中央研究院先前推出语言模型CKIP-Llama-2-7b,与Chat-GPT一样采用问答方式,可用于文案生成、语言翻译等。不过,专家发现,此语言模型采用中国资料「简转繁」,因此有不少问答内容,都以中国文化回答,用语也是中国用语。
后续中研院将系统下架,中研院也说,此为个人小型研究,希望将明清人物的生平进行自动化分析,建构自动化的历史人物、事件等事理图谱,民众的提问超出原始研究范畴,导致语言模型产生的内容出乎预期,未来研究及成果释出会更加谨慎。中研院也称,将规划成立「生成式AI风险研究小组」,深入了解AI对社会的冲击,提供研究人员相关指引,避免类似事件再度发生。
立法院教育及文化委员会今天邀请中研院院长廖俊智列席报告业务概况,并备质询,也审查明年度中研院预算案。
廖弘源会前受访表示,此语言模型的计划是大型语言模型,大型语言模型就相当于人的脑袋,人的脑袋是由很多脑神经单元所组成的,脑神经单元之间是用脑神经连结,要经过训练才能把知识训练到脑神经的连结里面。
廖弘源进一步说明,现在的AI其实有一个脑袋,就是希望用电脑来模拟人脑的运作,为了加以训练,就会有需要资料集的问题。
对于惹出争议的CKIP-Llama-2-7b,廖弘源表示,负责此计划的年轻研究员先前参与一个国科会语言模型的计划,该计划从去年8月到今年7月,经费也仅有70多万。到了今年1月起,该研究员负责中研院数位文化中心关于明清历史人物时空关系的计划,因此想透过新的科技加以应用。
廖弘源表示,因为在制作阶段缺乏足够资料,所以研究员想到,对岸跟我们使用相同语言,因此直接使用对岸的资料集,再把简体字转成繁体字,然后用于训练系统,但却造成一些价值观也被加入系统中。
廖弘源强调,该研究员的目的是要解决明清的历史人物的相关知识,混入其他知识并不是他的本意。
爆料信箱:news@nextapple.com
★加入《壹苹》Line,和我们做好友!
★下载《壹苹新闻网》APP
★Facebook 按赞追踪