炒作还是希望?AI何时才能真正颠覆制药业?
2020-05-18 09:57
来源:世界人工智能大会官网

过去的几十年中,人工智能(AI)已经从科幻小说中的故事变成了一种非常真实的力量。这种力量可能,甚至已经颠覆了地球上的几乎所有行为。AI可以帮助我们为汽车,飞机和太空飞船导航,在网飞(Netflix)上推荐电影,并促进了其他大大小小、数以百计的变化。

 

那么,尽管可以随意使用计算机和诸如AI之类的工具,为什么制药业这样一个生死攸关的行业,却几乎没有受到任何影响?

 

专家们认为,制药行业现在仍然是效率最低的行业之一,可以说是对科技进步最后的抵抗。理由是,尽管其他行业正在变得更高产高效,专家发现制药业的效率自1950年代以来就在持续下降。

 

举个例子,现在将一种新药,或者说一种新分子实体(NME)推向市场,成本超过26亿美元。这些成本,以及许多失败的药物开发成本,最终都会直接转嫁给你我——患者,消费者和纳税人。

 

这篇文章既不是对AI不切实际的炒作,也不是同样不切实际的怀疑,而是讨论了传统制药行业面临的挑战。如今AI在药物发现过程中的应用,以及最后,新的科技和流程是否有潜力革新制药行业。

 

一场豪赌:传统药物发现

 

为了理解AI在小分子药物发现领域的潜能和局限,首先要了解制药公司一直以来是怎样进行药物发现的。

 

如前面所说,制药业是地球上风险最高的行业。小分子药物发现可以分成以下几步:科学家先建立疾病假说,发现靶点,设计化合物,再展开临床前研究。这些平均需要五年时间,可能要花费数亿美元。临床开发过程可能再需要五年,以及另外几亿美元的投入。在这个过程中,药物需要经过临床I期(安全性),临床II期(有效性),和临床III期(大规模的安全性和有效性)的测试。

药物发现和开发阶段

 

因此,药物发现更像是一个分子的赌场。在这场轮盘赌中,有超过2000种可能开发成药物的靶点,数千种疾病,而每位患者在某种程度上都是独一无二的。为特定的患者亚人群选出正确的靶点极其复杂,因此每种选择的赔率极高。这就是为什么轮盘赌很少能带来丰厚的回报,而玩家必须习惯失败。

 

尽管在制药行业这场轮盘赌中下注的都是全世界最聪明的人,他们仍然99%的时间都在输。每次赌博都至少8年之后才能揭开胜负,在前4年中你可以更改赌注,而在之后4年,临床试验开始了,你只能选择放弃之前的投资以减少损失,或者追加赌注来进行更多的试验。而通常在前4年中下注的,和在临床试验中放弃或加注的并不是同一个人。

 

AI的作用:辅助,希望还是炒作?

 

面对这些荒唐的赔率和如今数据密集的环境,你也许会以为既然制药公司希望以更大的几率开发出可以上市的药品,AI是一个完美的选择。然而,尽管科技进步颠覆了移动通讯,个人电脑,互联网和基因测序等等领域,开发新药的成本却在稳步上升。

 

实际上,“AI可以降低赔率”对制药行业来说是一个喜忧参半的说法。一方面,它为这个领域吸引了更多投资和更多人才。但是,随着炒作愈演愈烈,药物开发成本却一路走高。因此这种说法引起了越来越多的怀疑。制药业的资深人士曾见证过看起来很有希望的技术突破却并没有带来研发水平的显著提高。因此,他们宁愿在现有药物发现过程的整个流程中逐步提升内部能力,而不是在某一种新技术上下重注。

 

AI到底是希望还是炒作的争论一直在继续。事实上,从作者开始从事AI药物发现以来,新的文章或者分析报告每天都会出现,不断地讨论AI的前景。一方面,AI专家们宣称革命即将到来,而另一方面,对AI存疑的药物研发专家们则把科技的新进展通通降格为炒作。

 

这也是为什么大多数行业专家对AI的前景持怀疑态度,包括深度学习。

 

用深度学习“洗白”AI

 

有很多证据可以表明,“AI可能拯救制药行业”不仅仅是一句炒作。作者尤其看好一种深度学习模型——生成对抗网络(GAN)。

 

虽然有些想法可以追溯到1990年代,生成对抗网络的第一篇论文2014年才由Ian Goodfellow发表,他也因此被称为“GAN之父“。可以看出,GAN还是一个比较新的概念。顾名思义,GAN可以被想成两个深层对抗网络之间的竞争。生成器(generator)会根据需要的条件来创建新的数据,而判别器(discriminator)会测试生成器的输出是否是为真。这项技术一问世就推动了一些有趣的研究。2016年,一些团队使用GAN根据自然语言生成了真实的图像。比如,如果给出一些描述:”这只小鸟的胸和冠是粉色的,主翼羽和副翼羽是黑色的“,那么GAN就会生成,或者说“想象”出大量具有这些性质的鸟类图像。

 

与此同时,作者在Insilico的团队开始研究GAN是否可以用于发现新型化学结构或分子,以实现在制药行业中应用。从鸟类图像和换脸APP到超高精度的新分子设计,听起来也许不太合逻辑,但作者和他的团队在2016年发表的一些早期论文相当成功。从那时起,他们发布了大量的生成方法,并开始尝试将它们与深度强化学习相结合。但尽管在多个会议上发表了数十篇论文和演讲,许多制药行业的计算化学和药物化学专家仍然对此保持怀疑。

 

这些怀疑也并不是空穴来风。如果要清晰地证明生成方法会对制药行业产生重大影响,唯一的方法就是选则一种影响了数百万人的疾病(仅仅罕见病是不够的),以完全无人干预的方法,仅靠AI发现一个全新的生物靶点,再无人干预地用AI为这个靶点生成新的分子,然后寄希望于这个分子能够通过生物测定,动物实验,最终,人类实验。

证明AI在药物发现中的价值,需要靶点确认,分子生成,实验验证这一完整周期 

 

这样的壮举在学术界几乎不可能实现,因为它花费甚巨,而且需要分析开发、化学合成等各个领域的专家。同样,初创公司也很难做到。作者的预测是,他们会在今年或者明年做到这一步——针对一个重大疾病,找到绝对创新的靶点,绝对创新的分子,在实验室环境中进行疾病相关的测定。在两到三年后,这些分子会经过临床II期验证。只有那时,怀疑论者才会满意。但那都是几年之后的事了。

 

人工智能在制药行业的未来

 

作者毫不怀疑AI将来可以创造出人类急需的药品,改善健康,治疗疾病。无论是生成强化学习等方法的结合,还是量子计算的迷人前景,都让他对未来充满信心。然而,他不想假装没看到眼前的困难——生物学很复杂,化学很复杂,临床试验也很复杂。同时在三个领域取得成功简直不敢想!

涵盖药物发现和开发所有领域的“制药行业AI大脑”

 

他还相信,AI在制药行业成功的关键是大规模整合现有的系统,从合识别生物靶点,设计新分子,到提供个性化治疗和预测临床试验结果。

 

我们需要一个强大的“制药大脑”,来跨越药物发现和开发长达十几年的周期,把临床数据带回到最初发现靶点的时候。

 

完成这些设想可能需要很多年。从事AI药物发现的科学家们需要精通药物发现的各种策略,才能为小分子药物开发显著提速。

 

最近的新冠病毒大流行暴露出如今传统制药方法和AI制药方法的无能为力。作者估计再过四个月,所有FDA批准的药物中(再加上漂白剂,紫外线,还有一些强一点的光),有百分之十都会被重新包装成新冠病毒的治疗方法。然而到时新药开发估计还没走到临床前研究这一步。要想大大加快药物发现的速度,AI和实验室自动化还有很长的路要走。