新葡亰1495app > 新葡亰科学 > 细胞生物学撬开人工智能的黑匣子——深层神经网络揭露酵母细胞胞内过程
细胞生物学撬开人工智能的黑匣子——深层神经网络揭露酵母细胞胞内过程
2020-05-05 20:03

Ideker举了一个例子:机器学习系统可以分析数百万人的在线行为,将个人标记为潜在的恐怖分子或自杀风险。但我们不知道机器如何得出这个结论,他说。

Strickland报道科学界新闻已有15年,为《Discover》、《Nautilus》、《Sierra》、《Foreign Policy》和《Wired》等出版物撰写文章。她拥有哥伦比亚大学新闻学硕士学位。

图片 1

Ideker希望他能够采用迁移式学习这种机器学习方法,从模拟酵母细胞的神经网络获得模拟人类细胞的神经网络。“一旦你建立了一个能识别喵星人的系统,你不需要为识别松鼠重新训练整个神经网络”他说。

机器学习系统建立在人工神经元层上,称为神经网络。这些层通过神经元之间看似随机的连接而连接在一起。系统通过微调这些连接来学习。

Eliza Strickland高级副主编,于2011年3月加入IEEE Spectrum,最初被分配到亚洲新闻板块。福岛第一核电站的核灾难一爆发,她立即着手报道。Strickland对该事故的报道和事故后24小时的详细记录,使她获得尼尔奖。

似乎每次你转过身,有人都在谈论人工智能和机器学习的重要性,加州大学圣地亚哥分校医学院和摩尔癌症中心教授Trey Ideker博士说。但所有这些系统都是所谓的黑匣子。它们可以非常具有预测性,但我们实际上并不了解它们的工作方式。

DCell允许研究人员改变细胞的DNA,并观察这些变化如何向上波动以改变其生物过程,以及随后的细胞生长和繁殖。DCell的训练集由数百万个真实酵母细胞中的基因突变组成,与突变结果配对。

在最近发表在Nature Methods上的一项研究中,Ideker的研究团队最近开发了他们所谓的可见神经网络,并用它来构建DCell,这是一种功能正常的啤酒酵母细胞模型,通常用作基础研究的模型。为此,他们在一个地方积累了细胞生物学的所有知识,并创建了这些细胞成分的层次结构。然后他们将标准机器学习算法映射到该知识库。

DCell的透明,意味着它可能将用于细胞的计算机模拟实验,而无需进行费时且昂贵的实验室实验。如果研究人员能够弄清楚如何对一个简单的酵母细胞甚至复杂的人类细胞建模,影响将很深远。“如果你能够构建一个人体细胞工作原理的模型并对其进行模拟,”Ideker说道,“这将是一场精准医学和药物开发的革命。”

但最令Ideker兴奋的是DCell不是黑盒子;这种联系并不是一个谜,也不能通过偶然事件来形成。相反,学习仅由现实世界的细胞行为和约2,500个已知细胞成分编码的约束引导。该团队输入有关基因和基因突变的信息,DCell预测细胞行为,如生长。他们对数百万基因型的DCell进行了培训,发现虚拟细胞可以模拟细胞生长,几乎与实验室培养的真细胞一样准确。

这个项目的可行性在于,酿酒酵母是一种单细胞生物,自19世纪50年代以来一直作为研究的模式生物。Ideke说:“我们有大量关于细胞生物学的知识可以使用,很方便,“Ideker说,“事实上,我们对酵母细胞的结构足够了解。”

Ideker和Ma也对DCell进行了测试。如果他们故意给系统提供虚假信息,那就不行了。以核糖体为例。细胞利用这些微小的生物机器将遗传信息转化为蛋白质。但是,如果研究人员将核糖体连接到一个不相关的过程,如细胞凋亡,系统细胞就会自杀,DCell就无法预测细胞的生长。虚拟小区知道新的安排在生物学上是不可能的。

更重要的是,开发癌症药物的制药公司使用细胞生长作为药物是否起效的检验标准。通过对大量调控基因开关的分子的观察,他们会猜测这种潜在的药物是否会导致肿瘤细胞停止增殖?研发抗癌药物需要数十亿美元,计算机模拟具有明显的价格优势。

Ideker和他的共同指导的癌细胞地图计划的同事现在正在产生他们为人类癌症建立DCell所需的一些实验数据。然后,他们将确定如何最好地个性化这种虚拟细胞方法,以获得患者独特的生物学。

癌症是最便于研究的疾病,因为每个癌症患者的肿瘤细胞都含有独特的突变组合。Ideker说:“用患者的基因组数据和突变信息作为模型的输入,会得到这些细胞的生长速度,以及癌症的侵袭性。”

我们希望有一天能够输入您特定的癌症相关基因突变,并获得有关癌症侵袭性的最新信息,以及预防其生长和转移的最佳治疗方法,Ideker说,他也是加州大学圣地亚哥分校计算生物学和生物信息学中心。

它们就像是黑盒子:在一端输入一个问题后(比如,图片里的是一只猫吗?这场围棋中下一步最好策略是?无人驾驶汽车在这个黄灯亮起的路口是否应该加速?),就能在另一端得到答案。我们或许不能知道AI系统这个黑盒子的具体工作原理,但我们知道它能有效工作。

人类的知识是不完整的,思科的实验室助理研究科学家马建柱博士说,他领导了建立DCell的工作。我们希望完成这些知识,以帮助指导医疗保健和其他方面的预测。

从给酵母建模,到给人类细胞建模,并不是一件容易的事。研究人员需要收集关于人类患者的足够信息作为神经网络的训练集——他们需要数百万条记录,包括患者的遗传图谱和健康状况。Ideker预测数据的增长量会极其迅速。他说,这将需要对患者基因组进行大规模测序。

为了使机器学习在医疗保健中变得有用和值得信赖,Ideker说,从业者需要打开黑匣子并了解系统如何做出决定。

图片 2

这是关于DCell系统主页的屏幕快照,一个模拟细胞结构和功能的深度神经网络。

如今,她负责生物医学工程领域的报道,并负责Spectrum关于“揭示人类操作系统奥秘”的特稿。该报告衍生了新的关于人类操作系统的博客,其中介绍可实现更精确和个性化的药物治疗的新兴技术。博客报道了可穿戴的生物传感器、大数据分析,以及可能使我们变成机器人的植入式设备。Strickland目前的兴趣领域是调控运动、情绪和记忆的神经调制技术。