您的位置 首页 行业资讯

星药科技李成涛:人工智能在药物研发中的应用

不到现场,照样看最干货的学术报告!嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想

不去现场,还看最干巴巴的学术报告!

大家好。这是学术报告的专栏。《核心阅读》主编不定期评选并亲自主持会议,给你最好的科技领域学术报告,为学生录制报告的干货,想方设法让第一手PPT和直播视频——足够干爽新鲜!话不多说,赶紧看过去。希望这些优秀的青年学者专家杰青的学术报告,能让你在业余时间的知识阅读更有价值。

人工智能论坛现在浩如烟海,但是有硬货和干货的讲座百里挑一。“AI未来理论青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,核心阅读和纸质周刊为合作媒体。主办单位为中国科学院学生会,协办单位为计算学院研究生院、网络中心、人工智能学院、化工学院、公共政策与管理学院、微电子学院。2020年8月29日,第18届“AI未来理论青年学术论坛”以“微信社区通过网络平台直播”的形式举行。姚兴科技李成涛带来了《人工智能在药物研发中的应用》报告。

姚兴科技创始人兼首席执行官李成涛博士毕业于姚班清华大学,后获得麻省理工学院计算机科学博士学位。他在人工智能高层会议上发表了许多论文,他的研究成果落在药物发现领域的许多重要环节。

星药科技李成涛:人工智能在药物研发中的应用图.

人工智能在药物R&D中的应用

星药科技李成涛:人工智能在药物研发中的应用图.

星药科技李成涛:人工智能在药物研发中的应用图.

李成涛博士的报道是关于人工智能在药物R&D中的应用,涉及到一些落地应用以及人工智能在药物R&D过程中的具体位置。整个药物研发过程是一个非常漫长的过程,大致可以分为两个阶段:临床许可阶段是分界线,前者是候选药物阶段,后者是临床试验阶段。临床试验可能大家都很熟悉。以新冠肺炎疫情为例,你可能知道一些国家已经进行了一些相关的临床试验,具体来说,他们开发了一种新药或使用了现有的药物,并进一步想试试这种药物是否能在新冠肺炎患者中发挥作用。这个时候就要招一些患者去医院试用这种新药,看最后的反应是否能如预期的治愈,然后药物才有可能上市。从目标开始,临床实践前需要许多类似的过程。其实生病吃药本质上是一种调节体内蛋白质的方式。你服用的药物的小分子会与你体内相应的蛋白质结合,调节蛋白质的功能,这就是所谓的靶点。根据靶标的性质和三维结构,可以设计一些药物,经过一系列的设计、筛选、优化,以及体外和体内实验,可以测试其有效性和毒性。如果一切顺利,我们将进入临床许可阶段。如果没有,我们可能需要回去返工,重新优化分子性质,使其能够达到预期的实验目的。整个过程非常漫长,大概需要五到八年。

这么长的R&D时间和投资也对应着更多的R&D成本。目前,每种药物的平均研发成本接近30亿美元,非常昂贵。事实上,在药物研发领域有一个非常奇怪的现象,叫做EROOM定律,是摩尔定律的逆定律。一般预计随着时代和科技的进步,药物研发的成本会逐渐降低,但药物研发领域的成本实际上是逐渐增加的。在这个阶段,需要巨大的人力物力,需要大量的时间和财力来制造一种药物。相反,这么大的投资量并不等于回报。自2010年以来,R&D投资回报率逐年下降,从2010年的10.1%降至2018年的1.9%。目前整个行业处于这样一种状态,一方面成本很高,研发时间很长,另一方面大家做出来也赚不了多少钱,所以行业一直在思考如何找到一个非常好的降低成本,提高效率的方法。

人工智能近年来发展迅猛

AI能提供的价值主要是在药物研发初期。从最初的目标识别到基于目标三维结构的分子设计、筛选和优化,发现了一些与目标相互作用的小分子。现在这些东西都在电脑里,我们需要合成它们来做各种实验。所以如何合成这些新分子也是一个大问题,涉及到合成路径的设计。还有很多AI提供的登陆场景。本报告主要是关于分子设计的优化和合成路线的设计。

星药科技李成涛:人工智能在药物研发中的应用图.

李成涛博士首先介绍了分子设计的优化。很多同学都知道紫杉醇是天然抗癌产品。为了使计算机能够读取分子信息,有两种方法来表达整个紫杉醇分子。第一种是将整个分子序列化,每个序列会唯一对应一个分子,可以应用到NLP相关技术,后面会介绍。另一种更直观。如上图右图所示,将整个结构看作一个画面,每个原子在画面中表示为一个节点,不同的原子是不同颜色的节点;不同的化学键可以表示为不同的边,所以现在有不同的节点和不同的边,构成了这样一个分子图。本质上是邻接矩阵加标签。这是现存的两种代表性的表述。

根据上面的描述,如果要做分子生成,可以把问题变成序列生成问题。生成序列的方法有很多。报告中给出的例子是直接使用VAE,即使用序列作为输入和输出以及编码和解码网络。做过NLP的同学基本都清楚了。编码网络和解码网络之间的潜在空间将整个连续空间离散化,每个对应的局部部分是一个特定的分子,这可以通过从整个空间中采样一些期望的分子来实现。

但是如果把SMILES String直接作为分子的输入输出,直接序列生成有很大的缺点。第一点是它有一定的语法,所以解码时不一定能解码语法正确的分子;第二,即使你能Decode语法正确的分子,有些原子的价格可能不一样,或者有些原子此时无法与这个基团连接,否则会出现化学意义上的语义错误,难以避免;第三,结构相似的分子可能有完全不同的SMILES String。如上图底部所示,底部有两个分子,结构非常相似。化学上一般认为结构相似的分子性质相似,希望其表达尽可能相似。实际上,左分子的SMILES串与右分子的完全不同,这对序列模型提出了严峻的挑战,进一步改造采用了另一种方法。序列的编码和解码本质上对应的是将整个二维图结构变为一维序列信息,原始二维结构图中的结构信息在一维序列中没有得到很好的挖掘。

星药科技李成涛:人工智能在药物研发中的应用图.

另一种方法是直接使用图形作为输入输出。图本身是邻接矩阵,计算机可以读取。现在我们面临着全新的投入产出。第一个问题是如何对图形进行编码,这涉及到最近流行的图形神经网络。如上图所示,现在有一个分子图,放入电脑。每个原子都有相应的向量,并设计了多层消息传递机制。每个原子对应的向量可以与相邻向量交换信息。比如蓝色的那个和邻居以及自己整合交换信息,最后所有原子都有一个矢量编码邻居信息。最后通过将所有向量整合成一个向量,就可以直接相加或平均。

星药科技李成涛:人工智能在药物研发中的应用图.

接下来就是如何解码了。以前,没有特别好的解码方法来从固定长度的向量中解码出不确定大小的图形。然而最近出现了很多方法。这里以JTVAE为例进行介绍。很多分子中都有一些共同的基团,很多有机化合物中都出现了苯环。五元杂环也可以看作一个基团,也可以抽象出来。这些东西都经过抽象后成为一个点。如果把所有的环类抽象为一个点,那么没有环的连通图就是树,因为图中没有环。树做编解码相对容易。本来每次产生一个原子,都要考虑如何与现有原子连接。但是现在,没有必要考虑戒指,只考虑树,树可以直接由RNN生成。如上图所示,每个节点在两个方向上生成,一个用于子节点,另一个用于兄弟节点,直到每个节点选择停止。此时,整个编码或解码完成,树和图可以相互转换,最终得到一个从图到图的VAE,即结树VAE。

知道了VAE的编码和解码,训练和生成也就可以相应的搞清楚了。训练把一些图片作为输入输出,然后做自动编码。生成就是直接使用训练后的解码器对隐藏空间中的一些定长向量进行采样,然后解码成一些图。这个图是分子图,每个分子图都是一个分子,这样就达到了生成分子的目的。

星药科技李成涛:人工智能在药物研发中的应用图.

李成涛博士介绍了关于合成路径设计的具体思路。AlphaGo对化学合成路线的设计有一定的启示。围棋的每一步都有几十上百种可能,每一步都可能导致相应的策略调整。玩围棋的最终目的是赢,但是要几百步才能知道输赢,所以搜索空间很大,要几百步,搜索空间巨大。当时AlphaGo和MCTS做了这些估计,然后找到了一些比较好的路径进行搜索。这些东西和化学逆反应合成有一定的关系。如上图,绿框中的分子就是要合成的分子。刚开始我不知道怎么合成,但是我知道图中的A和B可以通过几个步骤合成目标分子,不断的把A和B的合成路径往后推,直到可以直接买到分子。这个概念就像玩游戏时合成一些游戏装备。刚开始需要合成非常基础的东西,然后逐渐向上合成,最后才有可能合成非常高级的装备,本质上是一样的。

姚兴科技的合成本质上是一个落后的过程,最大的问题是搜索空间很大。如果要合成A,A,B,C,B,D,C,E都可以合成A,可能有很多可能的合成途径,但是现在B,D都不知道怎么合成,可能E,F可以合成D,或者H,G可以合成D,所以每一步都有几十个甚至上百个合成途径,一个途径一个步骤的每一个决定都会对后面的合成途径产生一定的影响。B和D可以选一次,B和C可以选一次。这时候的目的是合成B和C,而不是B和D,两者差别很大。最终的目的是找到一种可行的合成方法,这种方法涉及到巨大的搜索空间,造成计算复杂度。其实可以通过蒙特卡洛树搜索来完成。

星药科技李成涛:人工智能在药物研发中的应用图.

2018年,一位研究员发表了一篇关于《Nature》的论文,通过蒙特卡洛树搜索找到了一条可行的路径。也是第一次用Deep Learning和RL来做大家以前做不到的事情。到现在还有很多化学物质没有合成,AI可能会为他们提供一些新的思路。

化学合成的AI方法可以分为单步逆反应预测和多步逆反应搜索。目前很多论文都在做这个,特别是最近两年。姚兴科技与谷歌大脑、麻省理工学院和蚂蚁金服的研究人员一起做了一系列相关工作,并发表了几篇关于神经突起和ICML的单步和多步反应的文章。有兴趣的请关注。

姚兴科技成立于去年下半年,是一家非常年轻的公司。我们希望通过人工智能基于靶标设计、筛选和优化分子,目的是尽可能降低药物研发成本,缩短药物研发时间,使合适的药物到达患者手中。姚兴科技去年年底入选默克加速器,获得了包括高蓉、源代码、DCM、晨星在内的基金的支持和认可。现在他们也在积极合作,包括一些知名的高校科研机构,国内上市制药公司都是姚兴科技的合作伙伴。有兴趣的同学欢迎联系姚兴科技有限公司(((info

galixir.com)交流讨论此件。

星药科技李成涛:人工智能在药物研发中的应用图.

AI未来说*青年学术论坛

第一届数据挖掘特别会议

1。李国杰院士:对人工智能“头鹅”角色的理性认识

2。百度熊辉教授:大数据智能人才管理

3。清华大学唐杰教授:网络表征学习理论与应用

4。刘强博士,瑞来智慧:深度学习时代的个性化推荐

5。柴博士,清华大学:基于人机协作的数据管理

二期自然语言处理专题会议

1。中科院张佳俊:自然语言生成的同步双向推理模型

2。北邮李磊:自动文本摘要分析与探讨

3。百度孙克:对话技术的产业化应用及问题探讨

4。阿里谭奇伟:基于序对序模型和淘宝实践的文本摘要

5。哈工大刘一佳:通过句法分析看语境相关词向量

第三届计算机视觉专场

1。北京大学彭宇新:跨媒体智能分析与应用

2。清华陆继文:深度强化学习和视觉内容理解

3。百度李:百度增强现实技术及响应

4。中科院张世锋:基于深度学习的通用目标检测算法对比探索

5。香港中文李洪阳:物体检测最新进展

第四届语音技术特别会议

1。中科院陶建华:语音技术的现状与未来

2。清华大学吴赫:音频信号深度学习处理方法

3。小米王宇君:小爱

4背后的小米语音技术。百度康郭勇:AI时代的百度语音技术

5。中科院刘斌:基于联合对抗增强训练的鲁棒端到端语音识别

第五届量子计算特别会议

1。清华大学惠:用机器学习发现量子力学

2。卢大伟,中国南方科技大学:量子计算与人工智能的碰撞

3。李一男,荷兰国家数学和计算机科学中心:大数据时代的量子计算

4。苏黎世联邦理工学院,杨玉祥:量子精密测量

5。百度段润嘿:量子架构——机遇与挑战

第六届机器学习专场

1。中国科学院张文胜:医疗保健领域大数据时代的认知计算

2。中科院庄福珍:基于知识共享的机器学习算法研究与应用

3。百度胡晓光:飞桨

4核心技术及应用实践。清华大学王:对抗性机器学习G:攻防

5。南京大学赵申义分校:面向学习的范围可扩展复合优化

第七届自动驾驶特别会议

1。北大查宏斌:基于数据流处理的SLAM技术

2。清华大学邓志东:自动驾驶“感”与“识”——挑战与机遇

3。百度诸樊:开放时代的自动驾驶仪——百度阿波罗计划

4。宋蓓丽文杰:智能车辆未知时空区域自主导航技术

第八届深度学习特别会议

1。中科院文新:深度学习入门基础与学习资源

2。中科院陈智能:计算机视觉经典<!DOCTYPE度学习与目标检测

3。中科院傅鹏:深度学习与机器阅读

第九届个性化内容推荐专场

1。赵鑫,人民大学:基于知识和推理的序列化推荐技术研究

2。赵军,C

5.百度冯樊植:基于知识地图的多模式认知技术与智能应用

第十二届年会专场

1。复旦大学桂雨:当NLP是社交媒体——在计算机和网络语言之间架起一座桥梁

2。清华大学董:深度学习的对抗性鲁棒性

3。罗:人工智能辅助科学发现

4。斯坦福应志胜:图形神经网络应用

第十三届人工智能辅助流行病研究在线特别会议

1。清华大学吴赫:信息技术帮助新冠肺炎防控

2。北京大学王雅莎:新冠肺炎肺炎传播预测模型

3。百度黄继洲:时空大数据和AI助抗疫情——百度地图实践与思考

4。百度张传明:疫情下的“直播”导航是怎么做出来的

第十四期深度学习在线特辑

1。中科院徐俊刚:自动深度学习口译

2。孙伟北航:昆虫目标检测技术

3。百度游小河:EasyDL,加速企业AI

4转型。百度邓彭凯:飞桨视觉技术分析与应用

十五大数据线专题

1。复旦赵卫东:大数据系统观

2。中国科技大学徐彤:ai×人才数据驱动智能人才计算

3。百度李伟斌:基于PGL

4的图形神经网络基线系统。中国科技大学张乐:基于人才流动特征分析的企业竞争力

第十六届NLP前沿技术与产业化在线专场

1。复旦大学黄玉京:自然语言处理中的表征学习

2。中科院刘康:低资源环境下的事件知识提取

3。百度何钟君:机器翻译——从想象到大规模应用

4。百度孙宇:百度语义理解技术ERNIE及其应用

5。哈佛大学邓云天分校:卡斯克用马尔科夫变形金刚

6辅助文本生成。复旦大学贵屿:不确定感知序列标注

第17届百度学术特别会议

1。麻省理工学院赵明敏:透过墙壁透视的计算机视觉

2。卡内基梅隆大学梁俊伟:视频中行人未来多条轨迹的预测

3。清华大学丁小寒:深度网络重参数化——让你的模型更快更强

4。南京大学赵鹏:动态环境下在线学习的算法与理论研究

5。上海交通大学方浩书:人类行为理解与机器人对象操作

星药科技李成涛:人工智能在药物研发中的应用图.

留言赞关注

我们共同分享ai学习发展的干货

如转载。

更多AI智能建筑安防科技-星药科技李成涛:人工智能在药物研发中的应用,欢迎订阅本站,阜阳旋转门生产厂家、开放式门禁、感应门自动、手机刷门禁、单轨伸缩门玩转智能建筑安防科技社群最新新闻。

本文来自网络,不代表红雨智能安防资讯网立场,转载请注明出处:http://www.zdm365.cn/zx/4519.html
返回顶部