SMP 2022 前沿技术讲习班（CIPS ATT 33）

概况

时间：2022年8月19日 9:00-17:00

安排：

时间	内容
9:00-10:30	开放域人机对话关键技术张伟男哈尔滨工业大学计算机科学与技术学院副教授、院长助理
10:30-12:00	预训练语言模型最新研究进展崔一鸣科大讯飞资深科学家、北京研究院副院长
14:00-15:30	个性化和负责任的新闻推荐吴方照微软亚洲研究院主管研究员
15:30-17:00	跨时空舆论意涵提取与比较胡悦清华大学政治学系副教授，清华大学计算社会科学平台、清华数据与治理中心副主任

主席：车万翔（哈尔滨工业大学）

主席简介：车万翔博士，哈尔滨工业大学计算学部长聘教授、博士生导师，人工智能研究院副院长，社会计算与信息检索中心副主任。黑龙江省“龙江学者”青年学者，斯坦福大学访问学者，2019年入选黑龙江省首批“头雁计划”团队成员。现任中国中文信息学会理事、计算语言学专业委员会副主任兼秘书长；国际计算语言学学会亚太分会（AACL）执委兼秘书长；中国计算机学会高级会员、曾任YOCSEF哈尔滨主席（2016-2017年度）。在ACL、EMNLP、AAAI、IJCAI等国内外高水平期刊和会议上发表学术论文200余篇，其中AAAI 2013年的文章获得了最佳论文提名奖，论文累计被引用6,000余次（Google Scholar数据），H-index值为42。出版教材 4 部，译著 2 部。目前承担2030“新一代人工智能”重大项目课题、国家自然科学基金等多项科研项目。负责研发的语言技术平台（LTP）已被600余家单位共享，并授权给百度、腾讯、华为等公司使用。2018、2019连续两年获CoNLL国际评测第1名。2020年获黑龙江省青年科技奖；2015、2016连续两年获Google Focused Research Award（谷歌专注研究奖）；2016年，获黑龙江省科技进步一等奖（排名第2）；2012年，获黑龙江省技术发明奖二等奖（排名第2）；2010年获中国中文信息学会“钱伟长”中文信息处理科学技术奖一等奖（排名第2）、首届汉王青年创新奖（个人）等多项奖励。2017年，所主讲的MOOC课程《高级语言程序设计（Python）》获国家精品在线开放课程。

车万翔哈尔滨工业大学教授

主席：谢幸（微软亚洲研究院首席研究员）

主席简介：谢幸，微软亚洲研究院首席研究员，中国科学技术大学兼职博士生导师。他的团队在数据挖掘、社会计算和普适计算等领域展开创新性的研究。他2019年获ACM SIGSPATIAL十年影响力论文奖及中国计算机学会青竹奖，2020年获ACM SIGSPATIAL十年影响力论文荣誉奖，2021年获ACM SIGKDD China时间检验论文奖，并曾在KDD、ICDM等会议上获最佳论文奖。他曾担任ACM UbiComp 2011、PCC 2012、IEEE UIC 2015、SMP 2017、ACM SIGSPATIAL 2021、IEEE MDM 2022、以及ACM SIGSPATIAL 2022等会议程序委员会共同主席，并将担任PAKDD 2024与IEEE BigData 2025大会程序委员会共同主席。他是中国计算机学会会士、IEEE会士、ACM杰出会员。

谢幸微软亚洲研究院首席研究员

主席：孟天广（清华大学）

主席简介：孟天广，清华大学社会科学学院副院长、政治学系长聘副教授、博士生导师。研究领域包括中国政府与政治、国家社会关系、计算与信息政治、计算社会科学等，兼任中国政治学会青年工作专业委员会副会长、中国计算社会科学联盟秘书长、清华大学计算社会科学平台执行主任、数据治理研究中心主任等，入选教育部“青年长江学者”、清华大学仲英青年学者等人才计划。他担任国家哲学社会科学规划研究基金重大课题首席专家，主持国家级和省部级科研项目10多项。他在国内外知名学术期刊Comparative Political Studies、World Development、Governance、Social Science Research、Journal of Contemporary China、《中国社会科学》（英文版）、《政治学研究》等发表过70多篇中英文论文，近年来获得首届中国政治学会青年政治学优秀成果奖、北京市哲学社会科学优秀成果奖二等奖、上海市哲学社会科学优秀成果奖二等奖等学术奖励。

孟天广清华大学副教授

嘉宾

科大讯飞崔一鸣高级工程师

题目：预训练语言模型最新研究进展

摘要：以GPT、BERT为代表的预训练模型的出现，打开了自然语言处理的新篇章。“预训练+精调”也已经成为自然语言处理的新范式。在本次报告中，我们将回顾自然语言表示的发展历史，从传统的基于静态或动态词向量的方法，到以GPT、BERT为代表的经典预训练语言模型及其相关延伸模型。报告还将介绍预训练模型近期研究进展，包括预训练任务设计、多语言、可解释性、高效训练等方面，并在最后简要地展望未来的研究趋势

个人简介：崔一鸣，高级工程师职称，现任科大讯飞资深科学家、北京研究院副院长，CCF高级会员。毕业于哈尔滨工业大学计算机科学与技术专业，获工学学士和硕士学位，并继续攻读博士学位。主要从事阅读理解、预训练模型等自然语言处理相关领域的研究工作，并致力于推动中文机器阅读理解和中文预训练模型的研究与发展。曾多次获得机器翻译、机器阅读理解、自然语言理解评测冠军，其中包括机器阅读理解权威评测SQuAD、自然语言理解权威评测GLUE等。所研制的中文阅读理解及预训练模型开源项目被业界广泛应用，在GitHub累计获得1万次以上star，HuggingFace模型库中单月调用量突破1000万次。在国际顶级会议和期刊上发表学术论文40余篇、ESI高被引论文1篇，申请发明专利20余项、获授权专利6项，出版专著1部。担任EMNLP 2021和NLPCC 2021领域主席，担任NLP和AI领域顶级国际会议和国际期刊审稿人职务。

哈尔滨工业大学张伟男副教授

题目：开放域人机对话关键技术

摘要：近年来，人机对话受到了学术界和工业界的广泛关注，在研究上，已经成为各大自然语言处理国际顶级会议的热点。在应用上，基于人机对话技术的产品也层出不穷。人机对话系统在研究上主要分为开放域对话和任务型对话，相比于任务型对话具有明确的目标，开放域对话具有话题广泛及拟人化需求较强等特点，同时也面临着诸多挑战。本次报告中，我们将针对开放域人机对话中的核心关键技术的发展前沿和研究趋势进行概述。

个人简介：张伟男，副教授/博士生导师，哈尔滨工业大学计算机科学与技术学院院长助理。研究兴趣包括人机对话及自然语言处理。在ACL、AAAI、WWW、IJCAI、IEEE TKDE等CCF A类国际会议及国际顶级期刊发表论文多篇，担任ACL2021及EMNLP2021领域主席、AAAI2021高级程序委员会委员（SPC）及多个国际会议及期刊的程序委员会成员、审稿人及期刊编委。目前为中国中文信息学会（CIPS）青年工作委员会副主任、社会媒体处理专委会委员，中国计算机学会（CCF）术语工作委员会执委、哈尔滨分部秘书长，中国人工智能学会（CAAI）青年工作委员会委员。主导研发了智能人机对话系统“笨笨”，上线至今拥有7000余微信平台用户，积累百万级人机对话数据对，2019年3月“笨笨”中的开放域人机对话功能成功落地到科大讯飞AIUI智能交互平台，月均被调用6000多万次。曾获黑龙江省科技进步一等奖、第十届吴文俊人工智能科技进步二等奖和黑龙江省青年科技奖等。

微软亚洲研究院吴方照亚研院主管研究员

题目：个性化和负责任的新闻推荐

摘要：新闻推荐对于解决新闻信息过载和提升用户新闻阅读体验具有重要作用，广泛应用于在线新闻网站和新闻App。相比于经典的推荐场景如商品推荐，新闻推荐拥有很多独有的特点和挑战。在本次报告中，我将对新闻推荐的任务、数据集、评测和系统进行全面的介绍，同时将分享我们在个性化新闻推荐（如新闻理解、用户画像和个性化匹配）以及负责任可信赖的新闻推荐（如隐私保护和公平性）等方面的研究和思考。

个人简介：吴方照，微软亚洲研究院主管研究员，本科和博士均毕业于清华大学电子系。发表学术论文百余篇，被引用3000余次，H-index 32。曾获 NLPCC 2019优秀论文奖，WSDM 2019 Outstanding PC 和 AAAI 2021 Best SPC。AAAI 2022 领域主席，中国计算机学会高级会员。目前在微软亚洲研究院从事负责任AI、用户隐私保护、推荐系统、NLP等方面的研究和实践。研究成果在 Microsoft News、Bing Ads 等多个微软产品中得到应用。

清华大学胡悦副教授

题目：跨时空舆论意涵探索

摘要：社会科学诸领域已积累了与“人心”（个体认知、情感、态度）相关的大量调查数据，但历经长期研究，结论上却仍迷雾重重，很难达成共识。从方法论角度理解，这一困境很大程度上与数据的不可比性相关。以项目反应理论为代表的潜变量分析工具为解决这一难题提供了新途径。本讲比较了现行潜变量分析方法基本思路框架，重点回溯了项目反应理论的发展沿革。在此基础上，介绍“公共舆论动态比较法”（Dynamic Comparative Public Opinion, DCPO）这一新型项目反应理论方法，并以民主议题为例，阐释其如何高效实现对于同一民众认知或态度变量的跨时间、跨区域、跨调查提取和分析。

个人简介：清华大学政治学系副教授，博士生导师、苏世民书院论文导师，兼任清华大学计算社会科学平台、清华数据于治理中心副主任、上海交通大学中国发展研究院“流动的中国”网络研究员、Github Campus Advisor，美国爱荷华大学政治学博士，主要从事政治心理学、社会经济不平等、政治语言学等方面研究。在国内外知名学术期刊American Political Science Review, Journal of Politics、Political Psychology、Journal of Contemporary China、《公共行政评论》等发表论文二十余篇，国家自然科学基金、北京社会科学基金、清华大学国家高端智库课题重点项目等多项科研项目负责人。胡悦博士同时致力于政治科学方法论的研究和推广，兴趣涵盖实验室和调查实验、潜变量分析、文本大数据分析、网络分析、空间分析、数据可视化等；为数个全球十万+下载量R开源软件包的主要研发者。