第五届语言与智能高峰论坛

任务型对话系统中的小样本自然语言理解

小样本学习（Few-shot Learning）希望计算机能像人一样只用几个样本学习新的任务，近年来已成为机器学习社区的热点研究问题，并被看作是让机器智能接近人类智能的关键方向。因为任务型对话系统经常需要频繁适应新领域、新需求，而新的领域往往数据不足，所以为小样本学习技术提供了一个绝佳的应用场景。自然语言理解作为任务型对话系统的关键模块，主要包括用户意图识别和语义槽填充两个任务。我们分别探索了这两个任务如何应对小样本的挑战：（1）语义槽填充：小样本文本序列标注；（2）用户意图识别：小样本文本分类与多标签分类；（3）此外，现在自然语言处理中的小样本学习缺乏一个统一的、能反映真实世界任务挑战的基准测试，我们为此标注了一个全新的小样本数据集FewJoint，并组织了SMP 2020技术评测，希望能以此推动自然语言处理中小样本学习研究的进展。

简介：车万翔博士，哈尔滨工业大学计算机学院教授，博士生导师，教育部青年长江学者，黑龙江省“龙江学者”青年学者，斯坦福大学访问学者，2019年入选黑龙江省首批“头雁计划”团队成员。现任中国中文信息学会计算语言学专业委员会委员、青年工作委员会副主任；中国计算机学会高级会员、曾任YOCSEF哈尔滨主席（2016-2017年度）。在ACL、EMNLP、AAAI、IJCAI等国内外高水平期刊和会议上发表学术论文50余篇，其中AAAI 2013年的文章获得了最佳论文提名奖，论文累计被引用3,600余次（Google Scholar数据），H-index值为32。出版教材 2 部，译著 2 部。目前承担国家自然科学基金、973等多项科研项目。负责研发的语言技术平台（LTP）已被600余家单位共享，提供的在线“语言云”服务已有用户1万余人，并授权给百度、腾讯、华为等公司使用。2018、2019连续两年获CoNLL国际评测第1名。2020年获黑龙江省青年科技奖；2015、2016连续两年获Google Focused Research Award（谷歌专注研究奖）；2016年，获黑龙江省科技进步一等奖（排名第2）；2012年，获黑龙江省技术发明奖二等奖（排名第2）；2010年获中国中文信息学会“钱伟长”中文信息处理科学技术奖一等奖（排名第2）、首届汉王青年创新奖（个人）等多项奖励。2017年，所主讲的MOOC课程《高级语言程序设计（Python）》获国家精品在线开放课程。