SMP 2022 AI for Science


论坛概况

论坛时间:8月20日16:00-18:00

论坛简介:以深度学习为代表的人工智能与领域大数据的深度融合,驱动了包括机器视觉、自然语言处理等多领域的快速发展和成功应用。与此同时,近来的多项研究表明,人工智能不仅可以应用于工业应用领域与场景,而且在基础科学领域也能发挥重大潜在作用,如DeepMind研发AlphaFold2进行蛋白质预测等。为此,我们以“AI for Science”为主题组织了本次论坛,邀请了四位在该领域做出出色科研工作的国际知名学者,分别从“表征学习及其在药物研发上的应用”、“面向药物发现的几何深度学习”、“基于单个氨基酸序列的蛋白质三维结构预测方法”和“AI for Science开源社区发展的实践与思考”四个主题进行深度阐述。

论坛安排:

时间 内容 主持人
16:00-16:30 表征学习及其在药物研发上的应用
宋   乐 著名机器学习和图深度学习专家
宋国杰 北京大学智能学院院长助理,副教授
16:30-17:00 Geometric Deep learning for Drug Discovery
唐   建 蒙特利尔大学副教授
17:00-17:30 基于单个氨基酸序列的蛋白质三维结构预测方法
马剑竹 北京大学副教授
17:30-18:00 AI for Science开源社区发展的实践与思考
张林峰 北京深势科技有限公司创始人、首席科学家

论坛主席:宋国杰 (北京大学智能学院副教授)

主席简介:北京大学智能学院院长助理,副教授,北大-阿里妈妈人工智能创新联合实验室主任。聚焦于面向大规模图数据的机器学习与数据挖掘研究,以及在社交网络、推荐系统和EDA智能辅助设计等领域应用。主持了包括国家重点研发计划、国家自然科学基金等10多项国家级课题和20余项企业合作课题。是国家级精品课主讲教师,两度获得北京大学教学成果一等奖,“师德优秀奖”等荣誉。在包括国际顶级期刊和会议发表论文130余篇(CCF A/B 70余篇),是多个国际顶级会议的资深程序委员,担任3个国际领域顶级期刊的编委。先后2次获得最佳论文提名奖和最佳论文奖。教学成果先后4次获得国家级奖励,研究成果先后5次获得省部级和一级学会奖励。

宋国杰  北京大学  副教授


论坛嘉宾

宋乐/Le SONG   美国佐治亚理工学院  终身教授


报告主题:表征学习及其在药物研发上的应用

报告摘要:众所周知,新药研发存在研发周期长、成功率低、研发费用高等特点,人工智能技术的赋能无疑能够促进降本增效、提升自主创新。AI+Drug的技术、模型可以应用于靶点发现、药物设计等多个场景。本次报告将分享百图生科在大规模表征学习上AI模型的开发实践,以及这些模型具体是如何运用在药物研发过程中的。

嘉宾简介:宋乐博士是著名的机器学习和图深度学习专家,曾任美国佐治亚理工学院计算机学院终身教授、机器学习中心副主任,阿联酋 MBZUAI 机器学习系主任,蚂蚁金服深度学习团队负责人、阿里巴巴达摩院研究员,国际机器学习大会董事会成员,具有丰富的AI 算法和工程经验。自 2008 年起,宋乐博士在 CMU 从事生物计算相关的研究,利用机器学习技术对靶点挖掘、药物设计取得了一系列突破性成果,获得NeurIPS、ICML、AISTATS 等主要机器学习会议的最佳论文奖。社区服务方面,他曾担任NeurIPS、ICML、ICLR、AAAI、IJCAI 等 AI 顶会的领域主席,并出任 ICML 2022 大会主席,他还是同行评议期刊JMLR、IEEE TPAMI 的副主编。


Jian Tang /唐建   Mila-Quebec AI Institute  associate professor


报告主题:Geometric Deep learning for Drug Discovery

报告摘要:Drug discovery is a very long and expensive process, taking on average more than 10 years and costing $2.5B to develop a new drug. Artificial intelligence has the potential to significantly accelerate the process of drug discovery by extracting evidence from a huge amount of biomedical data and hence revolutionizes the entire pharmaceutical industry. In particular, graph representation learning and geometric deep learning--a fast growing topic in the machine learning and data mining community focusing on deep learning for graph-structured and 3D data---has seen great opportunities for drug discovery as many data in the domain are represented as graphs or 3D structures (e.g. molecules, proteins, biomedical knowledge graphs). In this talk, I will introduce our recent progress on geometric deep learning for drug discovery and also a newly released open-source machine learning platform for drug discovery, called TorchDrug.

嘉宾简介:Jian Tang is currently an associate professor at Mila-Quebec AI Institute and also at Computer Science Department and Business School of University of Montreal.  He is a Canada CIFAR AI Research Chair. His main research interests are graph representation learning, graph neural networks, geometric deep learning, deep generative models, knowledge graphs and drug discovery. During his PhD, he was awarded with the best paper in ICML2014; in 2016, he was nominated for the best paper award in the top data mining conference World Wide Web (WWW); in 2020, he is awarded with Amazon and Tencent Faculty Research Award. He is one of the most representative researchers in the growing field of graph representation learning and has published a set of representative works in this field such as LINE and RotatE. His work LINE on node representation learning has been widely recognized and is the most cited paper at the WWW conference between 2015 and 2019.  Recently, his group just released an open-source machine learning package, called TorchDrug, aiming at  making AI drug discovery software and libraries free available.


马剑竹   北京大学  副教授


报告主题:基于单个氨基酸序列的蛋白质三维结构预测方法

报告摘要:AlphaFold2依靠同源序列进行蛋白质三维结构预测,并取得了空前的成功。但是不是每个蛋白质都存在同源序列,例如药物设计中的抗体的关键功能区,是人体为了响应抗原刺的激临时搜索得到的。 为了解决这一难题,我们实现了只用单条氨基酸序列就可以进行精准的蛋白质三维结构预测软件OmegaFold。OmegaFold的精度已经非常接近AlphaFold2并已经超过了同样依赖于同源序列的RoseTTAFold。

嘉宾简介:马剑竹,现任北京大学人工智能研究院副教授,北京大学公共卫生学院副教授,博导,国自然海外优青项目入选者。2016年于芝加哥丰田工业研究院获得博士学位,随后在加州大学圣地亚哥分校医学院担任项目科学家。2019年开始担任美国普度大学计算机系Walther助理教授,兼任普渡大学生物化学系助理教授。主要研究领域为系统生物学,药物设计和统计机器学习。其学术成果曾发表于Nature, Cell,Nature Cancer,Nature Machine Intelligence, Nature Communications和PNAS等杂志。马剑竹博士还在NeurlPS, ICML, ICLR, KDD, UAI, WWW, CVPR等国际顶级机器学习和数据挖掘会议上发表多篇论文。


张林峰/Linfeng ZHANG   北京深势科技有限公司  创始人


报告主题:AI for Science开源社区发展的实践与思考

报告摘要:AI for Science正在成为学界和业界极为关注的话题。它将有望推动科研范式和产业形态的新一轮升级,同时也面临着很多挑战。在本报告中,我将分享在推动DeepModeling——一个致力于打造AI for Science时代基础设施平台的开源社区——过程中的实践与思考。我将着重探讨“开源模式”在这一语境下的必要性和困难,也将分享一系列从创新到落地的实际案例。

嘉宾简介:张林峰,北京深势科技有限公司创始人、首席科学家,北京科学智能研究院副院长、研究员。2020年博士毕业于普林斯顿大学应用数学系,2016年本科毕业于北京大学元培学院。通过有效结合机器学习和多尺度建模方法,有效解决了计算化学、分子模拟、增强采样等方向中的一些关键问题。共发表50余篇论文,发展了DeePMD-kit等开源软件和DeepModeling开源社区。作为核心开发者的工作获得2020年度高性能计算领域最高奖ACM戈登贝尔奖。