发布时间:2024-12-21 16:50:20 来源: sp20241221
从知识中来,大模型的能力来源于人类的庞大知识库;到知识中去,大模型也将重新塑造人类知识应用、创造和转化的模式,在经济社会发展中产生巨大价值。
近期,人工智能大模型引起社会各界关注。从知识中来,大模型的能力来源于人类的庞大知识库;到知识中去,大模型也将重新塑造人类知识应用、创造和转化的模式,在经济社会发展中产生巨大价值。《大模型时代》一书对这些内容进行了详尽的介绍和展望。
大模型拥有丰富的各学科知识,并表现出一定的逻辑能力,这是因为科学家利用海量的人类语言数据和大规模的GPU(图形处理器)算力,对大模型进行了预训练。当前最新的模型,为其精心挑选的预训练知识数据量达到13万亿token(字),相当于500万套四大名著的规模;而通过训练提取的“知识片段”即模型的参数,有1.8万亿个。无论训练量和参数量都远超以往人工智能模型的规模,这也是人工智能大模型这个名字的由来。
这种利用庞大语料库对人类知识进行建模的方式,可理解为对现实世界的一种“模糊压缩”。通过训练好的大模型来解答问题,相当于对世界的“模糊还原”。“模糊”可能导致问题解答不准确,但也因为模糊,大模型可以解答原有知识解答不了的新问题。
“压缩”和“还原”的过程中,大模型都在反复预测文本中可能出现的下一个字。它用这样的方式来理解人类语言和知识的规律,并在遇到问题时,利用模型学到的规律,一个字一个字地生成连贯而有意义的内容。由于使用自然语言(而非程序语言)与人类进行交互,大模型可以灵活地接收并完成人类下达的各种知识型任务,这就打开了大模型跨学科跨行业应用的广阔空间。
大模型具有强大的应用前景。利用训练中积累的知识,辅以专业领域的知识库和流程逻辑,大模型可以充当行业专家的人工智能助手,甚至直接为客户提供一对一的知识服务。例如,面向乡村教师的人工智能助教,可以帮助教师进行课程设计和作业辅导,显著提高乡村教育质量。通过一对一的知识定制应用,大模型能大大降低专业服务的交付成本,打破以往服务个性化和普惠化之间的矛盾,让更多人享受到教育、医疗和法律等领域既个性化又普惠的专业服务。
大模型还能通过知识的跨界关联,推动人类新知识的发现和创造。20世纪80年代,科研人员开始通过计算机技术分析科学文献,寻找新的关联协作机会点,比如利用这一方法发现鱼油跟雷诺氏综合征的关联性,据此提出的疗效假设得到了验证。在跨学科研究成为大势所趋的今天,化学及材料科学等领域的研究显示,人工智能能实现更灵活、更深度的知识理解和挖掘,可将不同学科、不同语言的知识关联到一起,帮助科学家发现创新盲点,提出新假设,给出跨学科研究路径甚至合作对象的建议,从而推动人类知识发展到全新水平。
工业制造未来也将是大模型的用武之地。大模型通过推动人类知识向物理机器转移,实现更复杂的工业人机协作。在以往的工业制造自动化领域,机器人依据严谨的预定义编程指令来执行操作,执行任务的能力受到一定限制,因为大部分的人类知识存在模糊性,对这些知识的理解和应用依赖于环境和常识。比如对机器人说:“我要一个苹果。”机器人不知道该去拿还是去买,不知道去哪拿、怎么买。而大模型可通过自然语言的交互,理解人类任务,借助自身训练获取的知识和外接的环境感知能力——知道冰箱在哪,猜测冰箱冷藏区可能有苹果,正确拆解任务并转译为机器指令——找到并打开冰箱,取出苹果,如果没有,则通过网络下单购买苹果。这样,大模型就在人类与机器人之间建立了复杂的、实时动态的协作机制,完成之前无法实现的、更高难度的工业制造任务。
未来,知识的应用、创造和转化将提升到一个新的高度。从老百姓可感知的民生普惠服务落地,同时进行更多方向探索——推动工业制造升级和科研手段演进,人工智能大模型对经济社会的影响将逐步往深层次发展,从而创造更大的社会价值。
《大模型时代》:龙志勇、黄雯著;中译出版社出版。
《 人民日报 》( 2023年10月24日 20 版)
(责编:白宇、卫嘉)