从语言大模型到智能体

摘要:语言大模型开启了人工智能的新时代,其智能水平令人惊叹。更为关键的是,它实现了 AI 技术的整合。面向未来,我们可以利用统一的框架和方法来构建各类智能系统。这一统一框架是基于强化学习的智能体,而方法包括 Transformer、GPT 训练和强化学习等技术。本报告将分享讲者对语言大模型(LLM)和强化学习智能体(RL Agent)的一些观点,并介绍ByteDance Research近期的一些相关工作。以下是几个主要观点:1.LLM 的强大能力主要源自规模法则、语言建模技巧以及强化学习框架;2.可以将 LLM 与人类的对话形式化为基于语言的博弈,此观点有助于我们开发出更强大的 LLM,例如提升 LLM 的对齐能力;3.基于 LLM 能够构建 RL Agent,具备两层信息处理结构,以 LLM 为核心,内存、工具和多模态处理等为并列模块。如果 LLM 对应于人脑信息处理的 System 1,那么此类 RL Agent 则对应于 System 2;4.可以构建翻译 Agent 以实现更出色的同传翻译。


简介:李航,字节跳动研究部门负责人。ACM Fellow, ACL Fellow, IEEE Fellow。京都大学毕业,东京大学博士。曾就职于 NEC 公司中央研究所,微软亚洲研究院,华为技术有限公司诺亚方舟实验室。主要研究方向自然语言处理、信息检索、机器学习、数据挖掘。