第11版:学术家园

人工智能与出版业新机遇

《 人民政协报 》 ( 2024年03月25日   第 11 版)

讲座现场

■出版业,作为承载文化传承和知识传播的重要桥梁,与人工智能的结合,不仅意味着技术的革新,更预示着出版行业的深刻变革和全新机遇。人工智能,将使得出版业从内容创作、编辑、出版到发行、推广等各个环节发生变化。同时,人工智能在出版领域的应用也面临着诸多挑战,急需要探讨和解决。

本期讲坛刊发6位专家的讲稿,请他们从不同的角度探讨人工智能在出版领域的最新应用、创新实践以及未来发展趋势,揭示人工智能与出版业结合的美好前景。讲稿的主要内容来自他们近期在中国版权协会“远集坊”上的发言。

茅院生:“人工智能+”与中国出版业

人工智能对出版业影响深远,不仅影响到人们的生产、生活,还影响着世界格局的变化。比尔·盖茨说,ChatGPT等人工智能技术出现的重大历史意义,不亚于互联网和个人电脑的诞生。2024年政府工作报告中指出,深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。这为推动人工智能在出版行业的应用提供了根本遵循。

AI给出版带来了全流程的赋能与提升。主要表现在五个方面:创新内容生产、创新翻译与编辑校对、创新营销方式、创新产品形态与服务、创新流程管理。未来出版的形态可预见将会突破纸质、音像、电子出版物等传统平面或线性载体,向更多维立体的方向发展。AI是企业数字化的重要驱动力,对出版业带来的是组织形式、内容生产方式甚至战略上的调整,要促进出版行业进一步优化数字要素资源配置,挖掘数据语料化、知识化标引、多模态数据资源等数据的价值。

AI给出版业不仅提供了更多机会,也带来了挑战。一是传统图书市场更加艰难。一旦Sora等视频生成技术应用普及开来,短视频领域将会面临一波井喷式扩张,纸质阅读的受众会逐渐减少。二是人工智能大模型盈利困难。人工智能大模型研发投入动辄千万、亿万计,各单体社AI产品缺少通用性,与其他出版社需求不适配;工具产品能力欠缺,产品形态少,难以形成规模效应。三是法律伦理和版权问题难以解决。一些大模型厂商存在未经授权直接盗用出版单位专业内容的情况。围绕内容资源的核心版权很难达成深入合作,大模型生成出来的内容已经打散重组,很难追溯维权。四是传统出版人可能被替代。在内容生产领域,从PGC(专业生产内容)到UGC(用户生产内容),这两种模式都面临着“内容生产不可能三角”的制约,也就是必须在成本、质量和规模三要素之间进行抉择,放弃其一。但人工智能AIGC具有高质量、大规模内容生产和低成本三重特征,打破了传统意义上的“不可能三角”,带来的是出版人的某些岗位或者角色需求出现大量下降。

以中国出版集团在人工智能领域的探索与实践为例,中国大百科全书出版社依托在百科领域的专业优势,构建了基于权威百科知识的人工智能语料库。2023年12月,中华书局古联公司与南京农业大学推出了首个古籍整理大模型——“荀子”古籍大语言模型,包含了“四库全书”在内的古籍文献超20亿字大型语料库,能够实现自然语言理解、自动翻译、诗歌生成、自动标引等多项功能。在AI技术开发及应用方面,中国图书进出口(集团)总公司联合国内外28家头部出版企业,为图书馆等公共文化服务领域提供了新型文化消费场景的、以虚实深度合成为核心技术的新型融合解决方案;结合人工智能数据处理、内容生成与智慧互动能力,形成互动型知识服务,拓宽了图书单一阅读形式;聚焦行业打造的出版垂类大模型,形成了人工智能驱动的产品生态体系,在满足出版行业应用的同时,向水利、农业、材料等方向延展并实现了商业化运营。

出版业与AI的融合不仅仅是出版业高质量发展的要求,更是生存下去的必要路径。出版行业人员要从思想和行动上主动拥抱AI,从体制和机制上激发内生动力,从资源、资本、技术上推动行业广泛合作,要将AI与本行业本企业结合起来,筑牢数据基础,同时坚持秉承开放、平等、协作、快速、共享的互联网的核心精神。人工智能与出版的融合发展需要全行业精诚协作,开放共赢才能达到理想的发展目标。

(茅院生系中国出版集团有限公司党组成员,中国出版传媒股份有限公司董事、总经理)

张玉国:AI时代仍然是内容为王

励讯集团是全球最大的专业信息服务商、出版商。励讯集团比较突出的一个特点,是数字化应用。励讯集团长期应用AI技术,AI与大数据不可分割,当新一轮AI、大模型等如火如荼之时,励讯集团已经有20年做大数据的历史了;在生成式AI火起来之前,也已有十几年应用AI的历史了。

在处理文本数据场景下,生成式AI变为热门话题之前,广泛应用的人工智能技术还主要是提取式AI,最典型的应用是搜索、推荐和预测。生成式AI技术自2017年出现后,励讯集团一直密切关注,并已将生成式AI领域推出的应用广布于科研、医学临床和法律行业。比如,爱思唯尔发布临床决策支持工具ClinicalKey AI,帮助医生在临床决策时获得准确、简洁的循证医学信息。

生成式AI在专业出版领域的应用一般是法律界和科技、医学出版界。大部分法律专业人士认为,AI技术,尤其生成式AI技术将会深深改变法律界,它在法律界主要包含四个领域:研究问题、起草文件、精减工作流程以及文件分析等。AI不会取代律师,但使用AI的律师将取代不使用AI的律师,法律界非常愿意积极拥抱生成式AI。在科研领域,生成式AI技术可以产生和研究有关的构思,考虑科研怎么做;帮助撰写研究手稿,撰写文献综述,撰写基金申请,帮助审阅研究手稿等。总之,生成式AI技术已经成为提高专业人员工作效率的有用工具,是快捷高效的研究助手和写作助手,在多个方面应用前景广阔。

生成式AI技术潜力巨大,但也会带来很多挑战。特别是在幻觉、事实错误、偏见、数据安全和隐私保护、知识产权保护、虚假信息、失业和挑战传统教育等方面。像AI的幻觉问题,生成式AI可能会产生完全捏造的信息,既不准确,也不真实。比如2023年5月,美国《纽约时报》曾报道:一名律师在准备辩护材料的过程中使用了ChatGPT,而后者编造了6个并不存在的司法案例,产生此类问题的根本原因就是训练数据的不完整、不准确、有偏见。AI仍有巨大的局限性,一定不要过度炒作,甚至神话AI。一要敬畏,人类大脑是生物演化40亿年的产物,是已知世界最复杂的系统,要对大脑和人类智能充满敬畏;二要有信心,在700多万年人类发展历史上,人们发明过很多工具,有些工具是具有破坏性的,但人类没有为此中断不前;三是不仅要治理,还要有清醒的判断,防止人工智能再次进入“寒冬”。

对于专业出版机构来说,AI时代还是内容为王。出版业因技术而生,随技术变迁和发展,从来不曾畏惧过新技术。高质量、可信任的数据(内容)、对用户需求的深刻理解、先进的技术和平台(负责任的AI原则)将是专业出版的制胜关键。

(张玉国系励讯集团中国区高级副总裁)

黄强:AI在基础教育出版中的应用

人民教育出版社深耕基础教育教材和教育图书的编研出版已有70多年。习近平总书记在给人民教育出版社老同志的回信中指出:坚持正确政治方向,弘扬优良传统,推进改革创新,用心打造培根铸魂、启智增慧的精品教材。人民教育出版社历来重视新技术对教育出版和教学的积极影响。近年来,我们认真、积极推进深度融合发展,主要体现在以下两个方面:

一是积极应用成熟人工智能技术。一方面,利用人工智能技术助力传统出版。我们很早就开始借助各种智能审校手段辅助内容编辑和校对,建立了多种应用人工智能技术的平台和系统,协助开展编研出版工作。另一方面,在音像与数字出版中深度使用人工智能技术。第三代人教数字教材充分利用信息技术的优势,将多媒体技术、大数据技术和人工智能技术有机融合在一起,实现了纸质教材的数字化重构,解决了传统教材在数字化教学环境中使用不便利的问题。

二是积极探索生成式人工智能的应用方式。面对生成式人工智能技术的迅猛发展,我们采取双轨战略,既发挥自身研发实力,又积极与外部合作伙伴携手,共同探索和推动生成式人工智能技术在教育出版行业的实际应用。一方面,2023年6月,我们建立了人教数字AIGC实验室,对大语言模型、生成式人工智能等进行探索。目前,实验室已经完成了对ChatGPT、Gemini、通义千问、讯飞星火等主流大模型的调研和效果验证,也初步完成了对文本生成、图像生成、检索增强生成及相关数据安全和版权保护的研发工作。另一方面,加强与外界合作。近期,在教育部教材局的指导下,人民教育出版社与中央广播电视总台合作制作了中国首部文生视频AI系列动画片《千秋诗颂》,聚焦国家统编语文教材200多首古诗词,运用人工智能技术将诗词内容转化制作为唯美的国风动画。在生成式人工智能技术的加持下,《千秋诗颂》高度再现了古诗词中的人物造型、场景和道具,呈现了一部将中华古典诗词的博大精深与现代视听艺术相结合的动画作品。

简而言之,人民教育出版社也在积极、主动地拥抱新技术,并且在努力探索怎样更好地利用人工智能技术助力教育出版转型。有这样一些思考:一、要高度重视AIGC对教育出版带来的可能影响。二、要面对动态发展中的人工智能及其作用和价值,既要积极拥抱,也要客观评估。三、在人工智能时代,教育出版更需要在既有的机制流程中发挥专业优势。

总的来说,教育出版人应该深刻认识、并以积极心态迎接人工智能技术的发展给我们带来的挑战,冷静思索新问题,探索解决新方案,坚持守正创新,立足中国特色,加强对新技术应用的研究,将传统教育出版优势与新兴技术深度融合,运用人工智能技术赋能教育出版,为助力中国式现代化建设、创造人类文明新形态而努力。

(黄强系人民教育出版社党委书记、社长)

施其明:“AI+出版”融创新未来

数传集团专注在出版业做数字化转型已长达10年,可以说是出版行业中离AI场景最近。在利用AIGC和ChatGPT等先进技术服务方面,我们也在不断探索。AIGC时代,科技如何赋能加速出版业的数字化与普及化?就是我们思考的一个问题。

面对科技发展,数传集团调整企业发展战略,致力于深度研发AIGC技术在出版行业的应用,基于RAYS出版融合云平台打造了出版行业首个大模型BooksGPT,并以此为底层驱动,打造集成“数字员工+RAYS7.0版本”的出版融合智能服务解决方案,帮助出版业实现降本增效,为读者带去更加精准、高效、智能的书后服务。

在数传集团,AIGC已经深度参与出版业的编、印、发等核心环节。比如,“AI编辑工作室”能够提供数字员工助理并深度参与到编辑日常工作流程中,让编辑的工作更高效、更智能。以选题策划为例,2位选题策划数字员工深度参与数智化选题策划选题工作,能够比传统做法提效57%-89%。再如,AI校对,我们与多家权威数据库及机构进行合作,通过引入这些丰富的资源,我们的AI技术得以深度学习并自动更正多种校对问题,包括字词、标点符号及语法等,这个校对助手已经整合到员工工作流程中,交互迭代升级。此外,我们还利用AI进行全网可读性的宣发,如小视频、小文章和书评,以快速形成图书的营销机制。在新媒体编辑方面,我们实现了低成本的电子化和快速生成书评,以降低编辑和发行编辑的成本。这些应用形成了独特的营销逻辑,虽然不一定达到出版级,但足以形成不同的营销路径。

在数传集团,AIGC已全面且深度参与到了图书出版过程中内容制作、图书审校、发行营销以及“书后服务”各个环节,且完美高效地展现了AI和数字员工的“超能力”。

所以,就出版业来说,AIGC在实践中不仅与出版行业的结合性很强,还对出版流程和产品变化产生了积极的影响。与大型模型和芯片公司相比,出版业在AIGC的应用中可能更快实现场景化运用。但是,出版业迎来发展机遇的同时也将面临挑战:一方面,现阶段出版物内容同质化风险加大,出版人依然要发挥“把关人”作用,克服算法薄弱环节,确保高质量的生成内容;另一方面,目前知识产权的认定仍存在难度,版权归属认定任重道远,还急需多方协作共同来维护数字出版市场的良好秩序。

我相信,未来,数传集团会开发更多的AIGC相关应用,给出版行业去试用、学习,我们也会持续关注出版业在AIGC时代的动态、走向,贡献一份自己的力量。希望在新时代,古老的出版业能焕发出新的活力和生机。

(施其明系数传集团CEO)

童之磊:开启新一轮人工智能发展浪潮

在2024年国务院政府工作报告中,有一个词吸引了很多人的目光,那就是“人工智能+”。9年前的政府工作报告中第一次出现了一个词汇叫“互联网+”,以此带动了波澜壮阔的10年互联网发展。而今年的政府工作报告中提出了这样一个新的词汇“人工智能+”,我们相信未来10年甚至更长时间会带来一轮全新的人工智能发展浪潮。中国正从“互联网时代”迭代升级为“人工智能时代”,AI市场规模的全球化将进一步加速发展。

AI技术在文字、图像、音频、视频、3D建模、游戏等多领域正逐步落地,涉及图书出版、期刊出版、音乐出版、游戏出版、视频出版等多种出版形态。

在图书出版领域,已经出现了完全由人工智能创作的作品。在韩国一家出版社,他的一部图书就是用ChatGPT创作的,名字叫《寻找人生目标的45种方法》,出版流程只用了一周。在期刊出版领域,中华医学会杂志社率先在其期刊采编系统中引入了AI检测工具,为的是辨别作者的投稿是否由AI产生的,或者多大程度由AI产生,其准确率已达到96%。在音乐出版领域,谷歌推出了专用大模型,经过28万个小时的训练,可以创作5分钟的歌曲,已接近人类作曲家的风格了。AI音乐未来会成为一种新的模式。在游戏出版领域,AI的应用非常迅速,今年有一款游戏叫做《幻兽帕鲁》,是4个开发人员基于AIGC模型来完成的。在平台上发布以后,首日销量就超过了200万。在视频出版领域,比如Sora的发布,从几秒视频进化到1分钟的视频,是一个里程碑式的进展。

我们看到,AI有可能颠覆过去很多传统认知。其中很重要的原因是:AI本身并不仅仅是一种传统的工具,而是可以自我加速的工具。每一轮AI的迭代,都是自身的加速,之后会越来越快。所以我们现在说未来人类科技可能进入到一个新的时代,就是被AI加速的时代。

然而,AI的加速迭代也给全球知识产权保护带来了新挑战,比如原创性界定难、版权归属模糊、侵权风险增加、法律监管滞后等问题较为突出。目前,国际国内AI立法监管正逐步趋于完善,有效保护和规范数据的合规性。

以中文在线在出版领域进行的AI方面的探索为例。在文本方面,中文在线用AI释放内容生产力,为创作者提供全创作周期的智能辅助,并发布了全球首个万字创作大模型“中文逍遥”模型。在音频出版和漫画领域,AI主播已可以根据文字故事情节真实语境,生动模拟音色以塑造角色实现文本快速音频化,还可以通过输入文字态的文学作品,由AI模型自动转换成漫画形态,实现IP的跨模态生产力空间。在视频领域,今年2月29日,中文在线及清华大学元宇宙实验室联合总台央视在中国传统节日“补天节”,创作发布了国内首部AI全流程制作微短剧《补天》。今后,中文在线将全力构建AI+内容的新生态,共启出版行业的新未来。

(童之磊系中文在线董事长兼总裁)

李明德:人工智能应用与知识产权保护

著作权法保护的核心是作品,作品在人类文明史之前就已存在。作品保护制度的起源可以追溯到中国的造纸术和印刷术,以及西方的活字印刷技术。尽管作品传播技术不断发展,但著作权法始终关注作者的权利。历史上的法律,如英国和美国的版权法,都强调作者对其创作的作品的权利。

作者创作作品,作品获得保护,创作作品的自然人是作者。即使在现代,法律并没有脱离作者这个自然人,著作权属于作者,法人或者非法人组织也视为作者。如果说著作权制度或者版权制度的技术基础是造纸术和印刷术,那么随着作品传播技术的发展,留声机技术、摄影和电影技术,以及广播等新技术一次又一次地出现,就是对作品的保护制度的一次又一次挑战。这些都不亚于今天人工智能技术带来的挑战。著作权法不仅仅关注作品本身,还关注作品传播技术的发展。随着技术的发展,法律也在不断发展,以适应新的挑战。中国在制定著作权法时,借鉴了国际经验,规定了表演者权、录音制作者权等,但也有一些需要不断完善的地方。总之,著作权法始终关注保护作者的权益。

现在,技术的飞速发展对作品数字化、技术措施和权利管理信息保护、网络服务商责任等方面提出了挑战。例如对作品、技术发明、外观设计、商业标识等有保护条款,但对于一些新的名词术语、新的商业模式等方面的保护有待完善。再比如AIGC,如果强调AI是工具,其关键就在于使用者。那么,是更多地关注作品授权,还是更偏向后者?AI创作不能替代人类情感,责任应由人承担。作品传播技术与保护制度应共同发展,但人的创作、责任和权利不应改变。然而,目前业界过多地关注了数字化和数字技术问题,对于“以自然人为作者”的基础和前提重视不够。

从版权的角度探讨人工智能与作品传播中的问题非常重要,需要从相关作品、表演、录音和广播是否侵权,事先训练的数据库是否侵权,是否在训练软件的过程中侵权,由AI产生的内容是否侵权等多角度进行关注。就侵权认定而言,原则上也应当回到“自然人”,以及自然人组成的法人、非法人组织等这些著作权基本框架中来讨论,基本的法律原则没有改变,应该仍由创作者负直接侵权责任、传播者负帮助侵权责任。

在此,我也希望著作权领域的专家学者多关注网络服务商侵权责任,以及如何发挥著作权集体管理组织维权作用等相关问题,全面思考,确保著作权法的公平与有效实施。

(李明德系中国社会科学院知识产权中心名誉主任、中国法学会知识产权法研究会常务副会长)

2024-03-25 1 1 人民政协报 content_59504.html 1 人工智能与出版业新机遇 59,504 /enpproperty-->