您的位置 首页 行业资讯

UIUC罗宇男:交叉学科中的人工智能和科学发现

不到现场,照样看最干货的学术报告!嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想

不去现场,还看最干巴巴的学术报告!

大家好。这是学术报告的专栏。《核心阅读》主编不定期评选并亲自主持会议,给你最好的科技领域学术报告,为学生录制报告的干货,想方设法让第一手PPT和直播视频——足够干爽新鲜!话不多说,赶紧看过去。希望这些优秀的青年学者专家杰青的学术报告,能让你在业余时间的知识阅读更有价值。

人工智能论坛现在浩如烟海,但是有硬货和干货的讲座百里挑一。“AI未来理论青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,核心阅读和纸质周刊为合作媒体。主办单位为中国科学院学生会,协办单位为计算学院研究生院、网络中心、人工智能学院、化工学院、公共政策与管理学院、微电子学院。2020年8月29日,第18届“AI未来理论青年学术论坛”以“微信社区通过网络平台直播”的形式举行。UIUC罗玉南带来的报告《交叉学科中的人工智能和科学发现》。

罗玉南的研究兴趣是AI X、人工智能、药物发现、计算生物学、化学、农业等。一般来说,人工智能是一种非常有效的技术,它可以挖掘数据中的信息,并将其转化为知识,从而提供不同领域的预测甚至决策。在这个论坛上,他介绍了人工智能和跨学科研究的几个方面。

UIUC罗宇男:交叉学科中的人工智能和科学发现图.

跨学科中的人工智能与科学发现

UIUC罗宇男:交叉学科中的人工智能和科学发现图.

他的报告首先着眼于AI和生物学,第一个例子是结合AI和数据驱动分析的蛋白质工程。生物化学的一个重要领域是蛋白质工程,其目的是发现或优化自然界中现有的蛋白质特性。比如抗体也是一种蛋白质。现在,如果你想找到或设计一种更好结合的抗体,如新冠肺炎肺炎病毒,你需要优化自然界中现有的蛋白质,使其具有更好的特性。所以研究者可能会遇到这样一个问题,就是如何设计一个蛋白质序列,使其具有一些想要的信息。这是一个很难的问题,蛋白质序列影响很大。比如一个蛋白质即使有五个氨基酸,其可能的序列也会达到几十万个。然而,自然界中的许多蛋白质会含有更多的氨基酸,这可能超过了计算机可以耗尽的最大数量。

最后选择性能较好的部分作为下一代的母本蛋白,不断迭代,就像一个优胜劣汰的过程。经过几轮迭代,可以得到性质良好的蛋白质。

UIUC罗宇男:交叉学科中的人工智能和科学发现图.

这种方法效率有限,因为它的变异过程是完全随机的。从研究和计算的角度来看,有很多地方可以优化。一种直观的方法是用计算模型代替传统的耗时耗力的测量这种蛋白质性质的过程,如利用神经网络预测突变蛋白质的性质,从而在一定程度上提高整个实验的效率。有了这个模型,我们就可以结合这个模型,设计出一个具有一定性质的蛋白质序列,用这个序列,我们就可以合成这个蛋白质。罗玉南等人从这个角度设计了人工智能模型,旨在加速或辅助传统生物实验过程中耗时耗力的部分,从而加速整个蛋白质进化的基础。它们主要结合了两部分信息:一部分是全局信息,类似于自然语言处理的语言模型,但是是在蛋白质上训练的模型,用于蛋白质的全局相互依赖。另一个是生物信息。比如生物蛋白的两个氨基酸之间可能存在协同进化效应,因为整个氨基酸在进化过程中并不是独立进化的,可能存在空间和物理上的依赖性,使得两个氨基酸进化出一个

除此之外,他们还在模拟几轮蛋白质进化。每轮随机突变一些蛋白质,然后用模型预测突变后蛋白质的性质,选出较好的作为下一轮突变。重复三轮后,罗玉南发现蛋白质性质的分布越来越向高值方向推进,这意味着这个模型在不断改善突变后蛋白质的性质。他们还通过生物实验验证了计算模型,并通过该神经网络推荐了一些更好的蛋白质变体。TEM-1是细菌中的一种耐药蛋白,然后他们与生物学家合作,在实验室合成了这些蛋白变体,并测量了耐药性。结果表明,该模型预测的蛋白质变异体的耐药性高于自然界现有的蛋白质性质,甚至优于训练数据中的最佳样本,表明该模型成功找到了性质优于自然界现有蛋白质的蛋白质变异体。这个模型可以用来设计更多性质更好的蛋白质,比如基因编辑中的酶和化学催化剂。

罗玉南提到的第二个例子是分析SARS-CoV-2的多样性。他们的工作是研究数百名患者,探索冠状病毒的多样性,包括患者和患者群体水平的病毒多样性。大多数目前的方法假设病人只携带一种病毒基因型。然而,患者可能携带多种病毒,同一种病毒可能在患者体内变异,进化出不同基因型的病毒。罗玉南等人通过分析现有数据发现,患者携带多种基因型病毒的情况并不少见,62%的样本在一个样本中出现了多种病毒基因型的现象。研究患者内部和人群之间的病毒多样性,有助于更好地了解该病毒的特征,重构该患者病毒的传播路径,最终实现更准确的接触追踪。这些都是这个项目的直接应用。因此,罗玉南等人开发了一种算法,从测序数据中分析同一样品中的不同菌株。他们基于冠状病毒基因的41个突变定义了不同的冠状病毒菌株,这可以解释整个数据库中94%的样本的多样性。他们的算法是基于一个经典的机器学习算法,——,就是非负矩阵分解。但是要求分解后的矩阵有一定的局限性。比如,矩阵A表示某一个应变是否有某种变异,矩阵B表示每个样本中每个应变的百分比。利用该模型,罗玉南等人分析了现有新型肺炎患者的测序数据,得到了一些有趣的结果。

UIUC罗宇男:交叉学科中的人工智能和科学发现图.

比如在美国患者中,第三类分支占绝大多数,而澳大利亚的毒株则非常多样,每一个毒株都有一定程度的体现,这是病毒分布的结果。他们还考虑了进化中的分布,测序数据构建的进化树与他们发现的突变株的结构非常相似。此外,他们发现这些变异大多在蛋白质表面,对蛋白质的稳定性影响不大。在能改变氨基酸类型的突变中,92%在蛋白质表面。他们还从数据中发现了一些以前文献中没有发现的新的分析结果,进而为后续研究提供了一些思路。

然后罗玉南介绍了人工智能在药物发现方面的工作。药物研发是一个非常漫长、耗时、昂贵的过程,而且成功率往往很低。他们一直在想人工智能技术是否可以更有效地用于发现药物的新用途。于是他们构建了一个大规模的异质生物网络。

UIUC罗宇男:交叉学科中的人工智能和科学发现图.

基于该数据库设计一种机器学习算法,对每个网络中的每个节点进行低维向量表示,解决网络中高维、高噪声的问题,从而预测药物与靶蛋白的关系。该方法取得了比现有方法更好的预测结果。图为其算法预测的顶级药物与靶蛋白的作用关系,大部分可以在以前的文献中找到对应的论据。对于后来文献中没有发现或证实的预测,他们与药理学家合作进行实验,证实了三者之间的新作用关系

最后一部分是智能农业的研究进展。罗玉南和他的合作者希望建立一个基于海量卫星遥感数据的平台,并利用这个平台来代替传统的需要大量人力、物力和财力的农田监测。

UIUC罗宇男:交叉学科中的人工智能和科学发现图.

这个过程有很大的挑战。这个平台想用卫星图片,但是现有的卫星图片要么空间分辨率高,拍摄频率低,要么拍摄频率高,空间分辨率低。因此,罗玉南等人开发了一种算法,将不同时空分辨率的图片集成在一起,生成具有高时空分辨率的图片。这种方法可以做很多事情。例如,这类数据可以与计算机视觉的人工智能模型相结合,预测每个农田的作物品种和灌溉用水需求。罗玉南和他的合作者在这个方向发表了很多论文,同时他的合作者设计了一个平台,让大家可以非常准确实时的观察到每个农田的作物信息。

UIUC罗宇男:交叉学科中的人工智能和科学发现图.

AI未来说*青年学术论坛

第一届数据挖掘特别会议

1。李国杰院士:对人工智能“头鹅”角色的理性认识

2。百度熊辉教授:大数据智能人才管理

3。清华大学唐杰教授:网络表征学习理论与应用

4。刘强博士,瑞来智慧:深度学习时代的个性化推荐

5。柴博士,清华大学:基于人机协作的数据管理

二期自然语言处理专题会议

1。中科院张佳俊:自然语言生成的同步双向推理模型

2。北邮李磊:自动文本摘要分析与探讨

3。百度孙克:对话技术的产业化应用及问题探讨

4。阿里谭奇伟:基于序对序模型和淘宝实践的文本摘要

5。哈工大刘一佳:通过句法分析看语境相关词向量

第三届计算机视觉专场

1。北京大学彭宇新:跨媒体智能分析与应用

2。清华陆继文:深度强化学习和视觉内容理解

3。百度李:百度增强现实技术及响应

4。中科院张世锋:基于深度学习的通用目标检测算法对比探索

5。香港中文李洪阳:物体检测最新进展

第四届语音技术特别会议

1。中科院陶建华:语音技术的现状与未来

2。清华大学吴赫:音频信号深度学习处理方法

3。小米王宇君:小爱

4背后的小米语音技术。百度康郭勇:AI时代的百度语音技术

5。中科院刘斌:基于联合对抗增强训练的鲁棒端到端语音识别

第五届量子计算特别会议

1。清华大学惠:用机器学习发现量子力学

2。卢大伟,中国南方科技大学:量子计算与人工智能的碰撞

3。李一男,荷兰国家数学和计算机科学中心:大数据时代的量子计算

4。苏黎世联邦理工学院,杨玉祥:量子精密测量

5。百度段润嘿:量子架构——机遇与挑战

第六届机器学习专场

1。中国科学院张文胜:医疗保健领域大数据时代的认知计算

2。中科院庄福珍:基于知识共享的机器学习算法研究与应用

3。百度胡晓光:飞桨

4核心技术及应用实践。清华大学王:对抗性机器学习G:攻防

5。南京大学赵申义分校:面向学习的范围可扩展复合优化

第七届自动驾驶特别会议

1。北大查宏斌:基于数据流处理的SLAM技术

2。清华大学邓志东:自动驾驶“感”与“识”——挑战与机遇

3。百度诸樊:开放时代的自动驾驶仪——百度阿波罗计划

4。宋蓓丽文杰:智能车辆未知时空区域自主导航技术

第八届深度学习特别会议

1。中科院文新:深度学习入门基础与学习资源

2。中国科学院车

1.邵,北京邮电大学:知识地图的高效嵌入方法

2。徐军,人民大学:智能搜索中的排序——突破概率排序准则

3。百度周靖波:POI知识地图

4的构建与应用。百度宋训超:百度大比例尺知识地图构建与智能应用

5。百度丰樊植:基于知识地图的多模态认知技术与智能应用

第十二届年度

1。复旦大学贵屿:当NLP遇到社交媒体——搭建计算机与网络语言的桥梁

2。清华大学董:深度学习的对抗性鲁棒性

3。UIUC罗玉南:AI辅助的科学发现

4。谭福应志胜:图形神经网络应用

第十三届AI助疫研究在线专场

1。清华大学吴赫:信息技术帮助新冠肺炎防控

2。北京大学王雅莎:新冠肺炎肺炎传播预测模型

3。百度黄继洲:时空大数据与AI助抗疫情——百度地图实践与思考

4百度张传明:疫情下的“直播”导航是如何做出来的

第十四届深度学习在线专场

1。中科院徐俊刚:自动深度学习口译

2。孙伟北航:昆虫目标检测技术

3。百度游小河:EasyDL,加速企业AI

4转型。百度邓彭凯:飞桨视觉技术分析与应用

十五大数据线专题

1。复旦赵卫东:大数据系统观

2。中国科技大学徐彤:ai×人才数据驱动智能人才计算

3。百度李伟斌:基于PGL

4的图形神经网络基线系统。中国科技大学张乐:基于人才流动特征分析的企业竞争力

第十六届NLP前沿技术与产业化在线专场

1。复旦大学黄玉京:自然语言处理中的表征学习

2。中科院刘康:低资源环境下的事件知识提取

3。百度何钟君:机器翻译——从想象到大规模应用

4。百度孙宇:百度语义理解技术ERNIE及其应用

5。哈佛大学邓云天分校:卡斯克用马尔科夫变形金刚

6辅助文本生成。复旦大学贵屿:不确定感知序列标注

第17届百度学术特别会议

1。麻省理工学院赵明敏:透过墙壁透视的计算机视觉

2。卡内基梅隆大学梁俊伟:视频中行人未来多条轨迹的预测

3。清华大学丁小寒:深度网络重参数化——让你的模型更快更强

4。南京大学赵鹏:动态环境下在线学习的算法与理论研究

5。上海交通大学方浩书:人类行为理解与机器人对象操作

UIUC罗宇男:交叉学科中的人工智能和科学发现图.

留言赞关注

我们共同分享ai学习发展的干货

如转载。

更多AI智能建筑安防科技-UIUC罗宇男:交叉学科中的人工智能和科学发现,欢迎订阅本站,蚌埠智能门禁系统价格、门禁服务器、感应玻璃门、伸缩门的价格、车库门打不开了怎么办玩转智能建筑安防科技社群最新新闻。

本文来自网络,不代表红雨智能安防资讯网立场,转载请注明出处:http://www.zdm365.cn/zx/4571.html
返回顶部