从语言智能到代码智能

摘要:代码智能(Code Intelligence)旨在使计算机具备理解和生成代码的能力,并利用编程语言知识和上下文进行推理,支持代码检索、补全、翻译、纠错、问答等场景。以深度学习为代表的人工智能算法,近年来在视觉、语音和自然语言理解任务上取得了飞跃式的突破。最近基于Transformer的预训练模型大大推动了自然语言处理和多模态的技术进步。而基于最新的自然语言技术与编程语言知识相融合的代码智能的研究也受到越来越多的关注。本报告将介绍微软亚洲研究院自然语言计算组在该研究领域的一系列最新进展,包括针对代码智能的预训练模型(CodeBERT/CodeGPT)、基准数据集(CodeXGLUE)和融合了编程语言句法和语义信息的新的评价指标(CodeBLEU)。最后,本报告将研讨该领域目前存在的主要问题并探索未来的发展方向。


简介:周明博士,中国计算机学会副理事长、国际计算语言学会(ACL)前任会长,中国五所顶尖大学的博士生导师,首都劳动奖章获得者。现任微软亚洲研究院副院长。曾获得2010年华尔街日报亚洲创新奖、2012年微软CEO Ability Award以及2019年中国乌镇互联网大会世界互联网领先科技奖。他是中国第一个中英机器翻译系统CEMT和日本最著名的中日机器翻译的产品J-北京的研究者。他长期领导微软亚洲研究院的NLP研究,包括微软对联、输入法、机器翻译、新一代搜索、问答和阅读理解、聊天机器人、自然语言和多模态的大规模预训练模型等等并对微软产品做出突出贡献。他的小组培养了500名实习生、20余名博士和20余名博士后。现在均成为本领域的领军任务和技术骨干。周明主编《机器翻译》、《智能问答》等技术专著,发表了80余篇的ACL文章。H-Index 75。他是CCF-NLPCC大会、语言与智能高峰论坛的策划组织者之一、ACL亚洲分部创建人。周明于1985年毕业于重庆大学,1991年在哈工大获得博士学位。1991-1993年在清华大学从事博士后研究,后留校任教。1996-1999年访问日本高电社公司领导中日机器翻译研发。1999年加入微软研究院。