SMP 2021 前沿技术讲习班第二十八期（CIPS ATT 28）

清华大学胡悦副教授

题目：理解“人心”之演变：跨调查分析新方法与新证据

摘要：社会科学诸领域已积累了与“人心”（个体认知、情感、态度）相关的大量调查数据，但历经长期研究，结论上却仍迷雾重重，很难达成共识。从方法论角度理解，这一困境很大程度上与数据的不可比性相关。以项目反应理论为代表的潜变量分析工具为解决这一难题提供了新途径。本讲比较了现行潜变量分析方法基本思路框架，重点回溯了项目反应理论的发展沿革。在此基础上，介绍“公共舆论动态比较法”（Dynamic Comparative Public Opinion, DCPO）这一新型项目反应理论方法，并以民主议题为例，阐释其如何高效实现对于同一民众认知或态度变量的跨时间、跨区域、跨调查提取和分析。

个人简介：胡悦，清华大学政治学系准聘副教授，博士生导师，数据治理研究中心副主任，美国爱荷华大学政治学博士，主要从事政治心理学、政治语言学和不平等认知等方面研究。在国内外知名学术期刊Journal of Politics、Political Psychology、Democratization、Chinese Sociological Review、Journal of East Asian Studies、Social Science Quarterly、《天津社会科学》等发表论文十余篇，为国家自然科学基金、北京社会科学基金、清华大学国家高端智库课题重点项目等多项科研项目负责人。胡悦博士同时致力于政治科学方法论的研究和推广，兴趣涵盖实验室和调查实验、潜变量分析、文本大数据分析、网络分析、空间分析、数据可视化等；为数个R开源软件包的主要研发者，其中`interplot`、`dotwhisker`等全球下载量过十万次。

哈尔滨工业大学张伟男副教授

题目：开放域人机对话关键技术

摘要：近年来，人机对话受到了学术界和工业界的广泛关注，在研究上，已经成为各大自然语言处理国际顶级会议的热点。在应用上，基于人机对话技术的产品也层出不穷。人机对话系统在研究上主要分为开放域对话和任务型对话，相比于任务型对话具有明确的目标，开放域对话具有话题广泛及拟人化需求较强等特点，同时也面临着诸多挑战。本次报告中，我们将针对开放域人机对话中的核心关键技术的发展前沿和研究趋势进行概述。

个人简介：张伟男，副教授/博士生导师，哈尔滨工业大学计算机科学与技术学院院长助理。研究兴趣包括人机对话及自然语言处理。在ACL、AAAI、WWW、IJCAI、IEEE TKDE等CCF A类国际会议及国际顶级期刊发表论文多篇，担任ACL2021及EMNLP2021领域主席、AAAI2021高级程序委员会委员（SPC）及多个国际会议及期刊的程序委员会成员、审稿人及期刊编委。目前为中国中文信息学会（CIPS）信息检索专委会委员、青年工作委员会执委，中国计算机学会（CCF）术语工作委员会执委、YOCSEF哈尔滨主席（2021-2022）、哈尔滨分部秘书长，中国人工智能学会（CAAI）青年工作委员会委员，腾讯AI Lab学术顾问。主导研发了智能人机对话系统“笨笨”，上线至今拥有6000多微信平台用户，积累百万级人机对话数据对，2019年3月“笨笨”中的开放域人机对话功能成功落地到科大讯飞AIUI智能交互平台，月均被调用6000多万次。曾获黑龙江省科技进步一等奖及第十届吴文俊人工智能科技进步二等奖等。

微软亚洲研究院吴方照博士

题目：个性化新闻推荐

摘要：新闻推荐是一个常见且重要的推荐任务，对于解决用户新闻信息过载和提高用户新闻阅读体验具有重要作用。相比于经典的推荐任务如电影推荐和商品推荐，新闻推荐拥有很多独特的特点和挑战，如新闻更新速度非常快、新闻本身具有丰富的语义信息，以及新闻推荐的结果会带来社会影响等。我们将在报告中系统介绍新闻推荐的任务、数据集、评测、模型和算法，并讨论新闻推荐的公平性、去偏差、用户隐私保护等方面的工作，同时介绍我们在新闻推荐算法落地方面的一些经验和思考。

个人简介：吴方照是微软亚洲研究院(MSRA)社会计算组主管研究员。研究兴趣为以人为中心的自然语言处理、用户画像和推荐系统。吴方照分别于2012和2017年在清华大学电子工程系获得学士和博士学位。

哈尔滨工业大学崔一鸣博士

题目：预训练语言模型最新研究进展

摘要：以GPT、BERT为代表的预训练模型的出现，打开了自然语言处理的新篇章。“预训练+精调”也已经成为自然语言处理的新范式。在本次报告中，首先简要回顾传统的基于静态以及动态词向量的文本表示方法。接下来深度解析以GPT、BERT为代表的预训练模型，介绍其建模方法以及相关延伸模型。报道的最后将介绍近期研究热点，并对未来研究方向进行展望。

个人简介：崔一鸣，科大讯飞北京研究院副院长、资深级主管研究员，CCF高级会员。毕业于哈尔滨工业大学，获工学学士和硕士学位，并继续攻读博士学位。主要从事阅读理解、预训练模型等自然语言处理相关领域的研究工作，并致力于推动中文机器阅读理解和中文预训练模型的研究与发展。曾多次获得机器翻译、机器阅读理解、自然语言理解评测冠军，其中包括机器阅读理解权威评测SQuAD、自然语言理解权威评测GLUE等。所研制的中文阅读理解及预训练模型开源项目被业界广泛应用，在GitHub累计获得一万以上星标，Huggingface平台月均调用量达到一百万次。发表学术论文30余篇（包括ACL、EMNLP、AAAI等高水平论文），申请发明专利20余项。担任EMNLP 2021和NLPCC 2021领域主席，担任NLP和AI领域顶级国际会议和国际ESI期刊审稿人职务。