任务型对话系统中的小样本自然语言理解
小样本学习(Few-shot Learning)希望计算机能像人一样只用几个样本学习新的任务,近年来已成为机器学习社区的热点研究问题,并被看作是让机器智能接近人类智能的关键方向。因为任务型对话系统经常需要频繁适应新领域、新需求,而新的领域往往数据不足,所以为小样本学习技术提供了一个绝佳的应用场景。自然语言理解作为任务型对话系统的关键模块,主要包括用户意图识别和语义槽填充两个任务。我们分别探索了这两个任务如何应对小样本的挑战:(1)语义槽填充:小样本文本序列标注;(2)用户意图识别:小样本文本分类与多标签分类;(3)此外,现在自然语言处理中的小样本学习缺乏一个统一的、能反映真实世界任务挑战的基准测试,我们为此标注了一个全新的小样本数据集FewJoint,并组织了SMP 2020技术评测,希望能以此推动自然语言处理中小样本学习研究的进展。
简介:车万翔博士,哈尔滨工业大学计算机学院教授,博士生导师,教育部青年长江学者,黑龙江省“龙江学者”青年学者,斯坦福大学访问学者,2019年入选黑龙江省首批“头雁计划”团队成员。现任中国中文信息学会计算语言学专业委员会委员、青年工作委员会副主任;中国计算机学会高级会员、曾任YOCSEF哈尔滨主席(2016-2017年度)。在ACL、EMNLP、AAAI、IJCAI等国内外高水平期刊和会议上发表学术论文50余篇,其中AAAI 2013年的文章获得了最佳论文提名奖,论文累计被引用3,600余次(Google Scholar数据),H-index值为32。出版教材 2 部,译著 2 部。目前承担国家自然科学基金、973等多项科研项目。负责研发的语言技术平台(LTP)已被600余家单位共享,提供的在线“语言云”服务已有用户1万余人,并授权给百度、腾讯、华为等公司使用。2018、2019连续两年获CoNLL国际评测第1名。2020年获黑龙江省青年科技奖;2015、2016连续两年获Google Focused Research Award(谷歌专注研究奖);2016年,获黑龙江省科技进步一等奖(排名第2);2012年,获黑龙江省技术发明奖二等奖(排名第2);2010年获中国中文信息学会“钱伟长”中文信息处理科学技术奖一等奖(排名第2)、首届汉王青年创新奖(个人)等多项奖励。2017年,所主讲的MOOC课程《高级语言程序设计(Python)》获国家精品在线开放课程。