AIGC赋能应急出版的价值、风险与应对策略
一、引言
当今世界正处于一个动荡变革期,不确定因素增多,地缘冲突、极端天气等各种突发性事件层出不穷。面对国内外形势的变化,如何应对突发事件对本行业产生的冲击,是各领域的专家学者关注的重大课题。
对于突发事件和人的关切是出版发展的永恒课题。我国是世界上灾害频发的国家之一,从《救荒活民书》到《洪涝防范与应急》,作为传播知识、传承文化的出版业通过出版的形式对抗灾救急进行了丰富的经验总结。从印刷术的发明到计算机技术应用于出版行业,再到今日生成式人工智能技术对出版行业的介入,技术的变革一直推动着出版行业的进步与发展,应急出版也不例外。随着人工智能技术的发展,AIGC(Artificial Intelligence Generated Content)应用于应急出版领域具有广阔的前景,但同时也暗藏风险,为此,本文展开研究。
二、AIGC与应急出版的概念
AIGC即人工智能生成内容,是指基于算法、模型和规则生成文本、图片、声音、视频、代码等内容的人工智能。随着人工智能技术的不断发展,AIGC取得突破性进展,生成式人工智能技术因其快速的数据采集与分析、高效的内容生产、强大的交互能力对出版业的内容生产和传播进行了颠覆性的变革。
应急出版是指出版机构应对社会突发性事件的出版活动,对于应急出版的定义,学界尚未达成一致意见,但学者王军峰对于应急出版的定义得到了众多学者的认同,应急出版是指“在突发事件已经发生或正在进行的情况下,出版机构为应对突发事件、满足公众的知识需求、恢复社会秩序而进行的应急性、工具性的出版活动”,“具有突发性、同步性、出版周期短、针对性强、实用性强的特征”。
三、AIGC应用于应急出版的价值
(1)AIGC的快速生产能力更好地满足应急出版的“应急”需求
在新冠肺炎疫情期间,《新型冠状病毒感染防护》,从选题策划到出版上市仅用了48小时。应急出版是针对突发性事件的出版,其核心是“急”,这种突发性事件是不可预料的,因其发生太过突然给社会的正常秩序带来重大冲击。应急出版的目标是“应急”,追求时效性,这就要求出版机构最大限度地缩短出版周期,提高出版速度。如果不能达到“应急”的要求,应急出版也就丧失了价值与意义。
《GPT在财务、合规和审计中的应用》是施普林格·自然授权作者使用ChatGPT作为创作工具创造出的学术图书。首先,出版机构组建一个项目团队,团队在多台设备上同时进行工作,根据项目要求对ChatGPT输入指令,ChatGPT根据要求按章输出内容,以创建初稿。然后,作者对模型输出的内容进行审阅,再次对ChatGPT输入指令,使ChatGPT按照要求修改初稿。最后,编辑与作者对输出内容进行进一步修正和补充。这种人机协作模式可以高效地输出内容,十分适合应急出版。AIGC技术高效的内容生产效率很好地满足了应急出版“应急”的需求,可以很好地解决应急出版出版周期短、突发性强的问题。
在选题策划环节,基于海量数据和自然语言处理技术,AIGC技术可以在开放平台和自建数据库中抓取海量数据,并自动进行数据的分析与处理,可以快速帮助编辑搜集信息并完成信息的整合,从而加快选题策划的进度。
在创作环节,AIGC工具可以极大地提升内容生成的速度,助力出版内容的生成。大部分AIGC工具,例如ChatGPT、文心一言等,都可以根据用户的指定生成文本,帮助作者快速完成内容的创作。AIGC还可以在创作之前为作者梳理相关知识和提供思路,助力作者进行“头脑风暴”,在创作之后对文本内容进行修改润色。AIGC还可以根据用户的指令生成相应的图表与图片。
在审校排版环节,AIGC还可以提升内容审校、排版的速度。目前一般的文字软件在人工智能技术的加持下都可以进行智能化校对与排版,生成式人工智能技术在强大的自然语言处理能力的加持下,可以更高效、更准确地完成内容的审校与排版工作。智能校对软件的校对速度是人工难以企及的,例如“方正审校的审校速度极快,一般情况下单篇10万字左右的稿件可在3分钟之内完成”。
另外,突发性事件充满很多不确定因素,出版机构很可能受到突发性事件的波及,无法为出版活动提供充足的出版资源,使本就紧急的应急出版活动受到限制。出版机构在出版过程中应用生成式人工智能技术可以在很大程度上打破人手不足、地理阻隔等限制,并节约出版成本。
(2)AIGC高效的信息采集与处理能力更好地满足应急出版的“同步”需求
应急出版具有很强的同步性。对于应急出版而言,出版实践活动与突发事情发展具有同步性,这就要求出版机构不仅要掌握突发事件发展的态势,监测事件发展动向,还要把握时机,在突发事情尚未结束前完成科普、指导、辟谣、引导舆论等相关内容的发布,在突发事件结束的短期时间内完成心理疏导、纪实、反思等内容的发布,这不仅要求出版机构缩短出版时间,还要时刻监控事件发生态势,把握出版时机。AIGC的数据来源之一就是开放平台,它可以在互联网上抓取突发事件的最新消息,并进行分析与预测,帮助出版机构更好地把握出版时机。
(3)AIGC强大的交互能力更好地满足应急出版的“针对”与“实用”需求
应急出版具有很强的针对性。面对特定的突发事件,不同群体对于信息的需求也不同,应急出版内容的发布需要针对特定的目标群体,在短时间内快速触达目标群体。AIGC基于大数据技术,可以通过用户的阅读习惯、阅读时间等要素对用户进行精准画像,生成式人工智能技术可以根据用户画像,判断用户所处的位置和心态,帮助出版机构将相应的出版内容传递给目标人群,从而对用户进行精准推送。AIGC还可以根据用户的指令生成宣传文案、宣传海报和宣传视频,助力出版物的传播发行。
应急出版是为了解决突发性事件而存在的,它具有很强的实用性。有的用户需要《台风防范与应急》,有的用户需要《洪涝防范与应急》,千人千面,不同用户的信息需求不同,即使面对同一突发事件,有的用户需要有效的防护措施,有的用户需要心理疏导,出版机构不可能针对个人情况出版内容。AIGC工具可以实现出版内容的个性化定制,满足用户的个性化需求。基于智能交互技术的聊天式机器人客服可以为用户提供个性化服务,它们基于历史对话可以更好地把握用户的需求。由于突发事件的不可抗力或者需求激增,很多出版机构的客服可能无法进行工作,或者分身乏术无法及时满足用户的需求,而智能聊天机器人可以在一定程度上替代人工客服的工作。
AIGC比人工客服和一般的机器客服更“懂”用户,比如ChatGPT会动态的吸纳用户输入的历史数据,接收信息的连贯性使AIGC更接近用户,用户与AIGC每一次互动的信息都会反馈到模型中,并成为此后该模型生成内容的依据,更能满足以用户为中心的需求。
四、AIGC应用于应急出版的风险
(1)AIGC的虚假内容风险与应急出版的真实性相抵触
应急出版的一大功能是辟除谣言、引导舆论、应对危机,因而对出版内容的真实性有很大的要求。但生成式人工智能生产的内容“常常是对多种主体生产内容的打散与重组,淡化了内容来源”,而且ChatGPT等AIGC工具“不擅长信息来源验证和文本的真实性核查”。AIGC巨大的的虚假内容风险与应急出版的真实性相抵触。
人工智能技术是数据喂养的产物,生成式人工智能生成的内容,来源主要是开放的互联网平台和开发者自建的数据库。首先,开放的互联网平台的信息良莠不齐,存在很多虚假信息。人人都可以在网络上发表自己的想法,这些信息大部分未经审核,信息的真实与否缺乏验证。突发事件发生后,互联网平台上可能会存在很多谣言,读者对出版物内容的真假往往缺乏主动查证的意识,一般会根据对信源的信任程度和自己既有的经验与立场,来判断内容的真假。生成式人工智能在处理数据的时候对数据进行了重组,淡化了数据的来源,同时AIGC也存在提供虚假信息的的情况,如果模型不能理解用户的提问,或数据库中没有用户需要的信息,AIGC可能会“一本正经地胡说八道”。OpenAI发布的文本转视频模型Sora,只需简单的文本指定或一张静态照片,就能生成一段1分钟的高保真视频,这使得虚假信息更具有迷惑性。如何识别以假乱真的虚假信息是生成式人工智能时代出版机构和用户共同面临的难题。
(2)AIGC的数据主义不符合应急出版人文关怀的原则
应急出版物的一大功能,就是关注受突发事件影响的用户的心理健康,抚慰心灵,给予他们力量与勇气,帮助他们早日走出困境,具有很强的人文关怀属性。AIGC的“从数据出发寻求解决方案的数据主义,以及从通过案例的有限集合来形成意义的训练迭代的强进化方式,高效但不符合人本关怀、价值关怀的原则”。
出版物具有物质属性和精神属性的双重属性,它不仅仅是传递信息的一个载体,还是传承文化、政治宣传、舆论引导的工具。出版物的精神文化价值是不能用数据来简单量化的,机器生产的内容遮蔽了“语言表达中无法被数字化的部分”,机器本身是没有情感的,机器对情感数据量化后的机械表达与人类在生活中形成的情感有着质的区别。这种人文关怀与AIGC本身情感的缺乏相抵触。“人的特殊生命体验所激发出来的创造力,这种创造力在文字上的表达,目前看来是无法被机器替代的”。
(3)应急出版应用AIGC的法律风险
应急出版虽“急”,但也不能无视法律法规。比如ChatGPT的开发者Open AI就面临众多版权诉讼纠纷。2023年9月,美国作家协会连同部分作家在纽约对Open AI提起了集体诉讼,指控其侵犯作者的版权并要求其对作者做出合理补偿。
首先是版权归属问题,目前对于AIGC的版权归属并没有明确的划分,机器并不能承担法律责任,其次是数据安全问题,AIGC在开放的互联网平台上爬取数据时,很可能会爬取到版权内容,编辑如果不加辨别,很可能会存在侵权问题,生成式人工智能工具擅长对搜索到的数据进行拼凑和重组,进而生成看似全新的内容,这就在一定程度上增加了辨别难度,编辑如果对生成内容的版权进行精细检索,则会耗费大量的精力与时间,增加出版时间。AIGC精准推送的基础是精准的用户画像,它需要对用户的喜好、位置、行动轨迹等数据进行深度学习,甚至会涉及到一些敏感信息,从各种散乱的数据中抽丝剥茧,整合成用户画像,它以一种隐蔽的方式侵犯用户的信息安全,还可能导致用户数据的外泄,目前互联网公司用户数据泄露的问题层出不穷。
五、纾解应用风险的策略
(1)坚守把关职责,捍卫出版伦理,注重应急出版价值
应急出版在出版的过程中不能一味的追求速度,应急出版其实是一项注重社会效益的出版,出版机构在出版应急出版物时应该坚持正确的价值导向,明确应急出版普及科学知识、分享经验、引导舆论、辟除谣言、抚慰心灵、鼓舞人心、凝聚共识的目标,牢记出版人的职责和使命。
出版机构在使用生成式人工智能大模型时应保持谨慎的态度,以审视的眼光去看待大模型输出的内容,关注大模型的数据来源,在需要的时候对输出的内容进行检测。
编辑应该坚守把关阵地,重视价值判断,捍卫出版伦理,辨别虚假信息,抵制内容剽窃,坚守社会主义意识形态。出版是一项经验性的工作,编辑应该将自己的经验与技术内容进行结合,更好地进行人机协同,将自己的人文关怀注入到出版物中。
(2)以技术之矛,攻技术之盾,提高风险防范效率
出版机构应该利用技术来对抗技术,对于生成式人工智能出版物存在的版权风险。出版机构应该未雨绸缪,利用检测工具检测文稿中是否存在人工智能生成的内容,以及是否存在剽窃,比如如普林斯顿大学研发的反作弊检测器Detect GPT和GPTZero X,OpenAI推出的人工智能文本分类器,抄袭检测服务公司Turnitin研发的AI写作检测工具等,可以主动在出版物中标识出是否存在人工智能生成内容。出版机构还需要对政治、宗教等方面的数据进行人工标注,利用人类价值观念对其进行引导。
(3)各方协作,共建资源共享平台,为应急出版提供便利
出版主管部门应该针对应急出版做好相应预案,给予应急出版物政策和资金上的支持,缩短应急出版物的审批时间,为应急出版物的出版活动提供便利。
出版主管部门或出版协会牵头,联合出版机构和人工智能技术公司,建设出版行业的共享数据库,出版机构将自己的资源划分为无偿使用部分和有偿使用部分,其他出版机构通过免费或付费的形式访问该资源。
在共享数据库的基础上搭建出版行业专用的生成式人工智能大模型,并引入常用的错别字库等相关语料库,对该工具进行训练,将出版规范与出版伦理等价值理性融入机器学习的数据来源与算法模型搭建之中。出版机构在利用该模型生成出版内容时,有偿或无偿连接各个出版机构的数据库,进行内容生产。国家出版主管部门还可以将应急出版物纳入著作权合理使用的范畴,允许出版机构在指明作者姓名等条件下,无偿使用数据库中的出版资源。
文章来源: 《文化产业》 https://www.zzqklm.com/w/wy/32640.html
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了
- 职称话题| 为什么党校更认可省市级党报?是否有什么说据?还有哪些机构认可党报?
- 《农业经济》论文投稿解析,难度指数四颗星,附好发选题!