第07版:科技时代

9位全国政协委员共同呼吁:

支持规范国产化ChatGPT研发及应用

本报记者 高志民

《 人民政协报 》 ( 2023年04月13日   第 07 版)

拥有国产且自主的ChatGPT,才能既保证中国社会可以享受到AI产业带来的技术升级,又能够免于被人卡脖子。国产化ChatGPT的研究开发也必须遵循“创新、协调、绿色、开放、共享”新发展理念。

“ChatGPT确实能做很多事情,跟人聊天、帮学生做作业、写论文,看似无所不能,但是仔细研究就会发现很多时候ChatGPT都在‘一本正经地胡说八道’,所撰写的论文也主要是‘逻辑严密的八股文’。”全国政协委员,重庆邮电大学校长高新波接受记者采访时表示。

高新波解释,ChatGPT本质上是一个生成式语言大模型,依靠千亿级的模型参数和海量的训练数据,获得了通用人工智能里程碑式的进步。从而也使人工智能擅长的领域从推理、决策扩展到了内容生成。

高新波告诉记者,尽管从现在的水平来看,ChatGPT还不够完美,但从发展的眼光来看,随着技术的发展,未来ChatGPT的能力很可能会越来越强,因为ChatGPT已经显示出了强大的成长潜力。

“但作为一种先进的技术具有双刃剑的工具属性。它既可以为善也可以作恶,这主要还是由使用该技术的人的价值观所决定的。从这个角度来看,我们教育的价值塑造功能就显得更加重要。”高新波表示,学校必须尽快研究人工智能时代教育的变革趋势,准确识变、积极应变、主动求变。通过教育的变革,在这个智能化突飞猛进的时代,把我们的学生培养成为一代能够合法使用人工智能的负责任的公民。

正源于此,今年“两会”期间,高新波和全国政协委员王亮、王填、王雪梅、韩林海、张云泉、潘健、乔杰、姜耀东共同提交了一件《关于加快支持和规范国产化ChatGPT研发及其在教育领域应用的提案》。

“必须加快支持和规范国产化ChatGPT的研究开发。ChatGPT本质上是一个生成式的语言大模型,其性能跟所学习的大数据的内容和质量密切相关。当下的ChatGPT学习的语料主要还是英文资料,中文的信息不是很多,尽管它把维基百科里的无数中文词条都当作训练素材,其中中文内容的占比也是少数的。因此,如果你用英文去问它一些技术问题,那么它的回答会清楚得多。”

高新波对此产生了深深的忧虑,“作为一种技术,ChatGPT的价值观主要来自于训练数据,如果训练数据主要来自西方,那么数据隐含中的价值观、偏见、歧视将会通过聊天系统传递出来,这对意识形态的影响将是可怕的。”

为此,高新波在提案中建议,中国必须开发自己的ChatGPT,否则在未来很可能陷入被动局面。因为只有拥有国产且自主的ChatGPT,我们才能既保证中国社会可以享受到AI产业带来的技术升级,又能够免于被人卡脖子,避免被错误价值观误导。

“加快支持和规范国产化ChatGPT的开放共享。”提案建议,国产化ChatGPT的研究开发也必须遵循创新、协调、绿色、开放、共享的新发展理念。作为一款语言大模型,其网络参数规模巨大,训练一次的成本是200-1200万美元。再加上训练样本的质量必须加以审查控制,为了实现模型的与时俱进还需要定期地迭代更新训练。这些都需要很大的训练和维护成本,因此必须加强国产化ChatGPT开发过程中的技术创新和统筹协调,进行顶层设计和布局,避免重复开发和不良训练数据带来的模型误导和污染。同时,还要加大模型的开放和共享力度,实现绿色发展。

“加快支持和规范国产化ChatGPT的在教育领域的使用。”提案还建议,ChatGPT的性能还取决于基于人类反馈的强化学习,因此为了避免在使用中人类非理性的反馈对国产化ChatGPT的负面影响,必须规范用户的人机交互。同时,在教育领域,ChatGPT将会带来深刻的变革,如课后答疑和作业批改等都可以由ChatGPT完成。

“学生在完成作业的过程中是否能借助ChatGPT,或者如何设计适应新形势的课后作业,给教育提出了新挑战,我们教育界必须未雨绸缪提前思考。”高新波说。

2023-04-13 本报记者 高志民 9位全国政协委员共同呼吁: 1 1 人民政协报 content_41850.html 1 支持规范国产化ChatGPT研发及应用 41,850 /enpproperty-->