AI制药梦醒时分|Future
发布时间:2023-08-12 23:19

  当瓦特蒸汽机的齿轮转动了第一圈;当乔布斯从牛皮纸袋掏出Macbook;当ChatGPT用流畅优美的语言回答第一个问题。科技,曾经、正在、也将改变未来。

  【Future】是36氪科技报道团队主理的一档专栏,我们将围绕科技产业的前沿突破,记录那些实验室里令人振奋的新技术,是如何穿越PMF(Product Market Fit 产品与市场结合)的惊险周期,进而影响更广阔的商业社会。

  7月底,又有一款AI药物分子倒在了临床试验阶段,这款由AI设计的药物分子叫Ulotaront,将用于精神分裂症、广泛性焦虑症和重度抑郁症的辅助治疗。然而在临床阶段效果不理想,宣告失败。

  这并非住友首次在AI制药栽跟头。仅在去年,英国AI制药公司Exscientia与住友合作的DSP-1181管线还被Exscientia标榜为史上首个由AI设计并进入临床的药物分子。最终,受伤的还是住友。

  失败是药物研发的常态。新药开发向来有条“双十定律”:一款新药的成功需要付出超过十亿美金和十年时间的成本。强生的首席科学官Paul Stoffels还说过,做出一款能上市的新药,比造飞机还难。

  失败的代价很大,稍有不慎,搞砸一两款新药能让企业坠入深渊。美国药企再生元,IPO成功后,推到“死亡之谷”的三款新药接连失败,股价腰斩,此后数年没能翻身,公司累计亏损12亿美元。

  就在所有人绝望之际,再生元研发的治疗眼部疾病的新药阿柏西普成功上市,并大获成功,拯救了这家摇摇欲坠的公司。如今再生元股价较最低点涨幅接近160倍,市值则有望跃过千万美金。

  一款新药的暴利实在诱人,药企们苦苦找寻提高研发成功率的办法。随着机器学习和人工智能技术的发展,科学家们将目光投向AI制药。

  住友曾经押宝的DSP-1181项目,就是利用AI能力设计而成,2020年1月Exscientia宣布其进入临床试验。这是一款治疗强迫症的新药,前期研发时间不到12个月(传统制药前期则需要4-6年),效率惊人。这一里程碑意味着AI制药从理论走向实践,让资本看到了AI制药的希望。

  2020年也被视为AI制药行业的元年。2月,Schrodinger在纳斯达克上市,一年内股价上涨超过200%。AI制药进入黄金时代。随后上市的十余家公司也都受到资本的热捧。几乎同时,这条赛道成为国内创业风口。

  2021年AI制药在中国迎来融资巅峰,一级市场的AI制药公司从不到10家飙升到60多家。其中最吸金的是英矽智能。站在风口,这家成立于2014年的初创,一年完成两轮D融资,公司估值飙升到8.95亿美元。

  市场上的钱排着队找AI制药创企。一个投资经理告诉36氪,当时因为所处机构的名气不大,甚至很难约到明星项目创始人的时间。

  热闹归热闹,市面上却等不到一款AI设计的药物成功上市,上述AI制药公司的管线,多数推进到临床阶段,因效果不佳遭到放弃。2022年,唱衰AI制药的声音开始响起。

  当初风光满面的上市公司,难逃股价断崖式跌落。比如薛定谔的市值从60亿美元缩水到20亿美元左右。日子一旦不好过,裁员就来了。2022年6月和7月,美国有16家生物技术公司裁员。8月,独角兽AbSci账上的钱仅够活两年,不得不裁了约20%的员工。

  大部分AI制药公司的财报并不好看。2022年国内AI制药的融资金额直接腰斩。拿不到钱,有公司不得不节衣缩食,默默砍掉了部分管线。

  投资机构人员戴枫(化名)从2019年开始关注AI制药,投过数个早期项目。戴枫告诉36氪,“大家一开始有个expectation,用AI做药可以提高(研发一款新药的)成功率。”他认为这种过高的期待造成了之后的幻灭。

  戴枫说,直到现在还没有一款AI做的药成功上市,因此当初的期待还没被验证,“甚至在一些时期有点被证伪”。

  今年,ChatGPT为代表的大模型被认为是AI制药的新机会。广州实验室研究员陈红明接受采访时表示,GPT模型在药物研发的流程中会有很大作用,一方面能快速生成知识图谱,另一方面也会帮助到药物分子设计。

  浙商证券的一份报告指出,“生成式AI模型可以生成全新的蛋白质序列或结构”,“使不可能发现的靶点及成药机制成为可能”。

  一些头部公司已经把生成式AI应用在药物发现领域;部分以生成式模型技术为卖点的初创公司,也成功拿到了融资;再加上行业老大英矽智能准备上市,这些积极的信息无疑是场及时雨。

  不过戴枫认为,ChatGPT很难让AI制药在资本市场重现2021年的高光。在经济环境下行的大背景下,AI制药公司首先要想办法活下去,然后等待真正的milestone时刻。

  博尔赫斯写过一个故事,他虚构了一个叫巴别塔的图书馆,由无穷多的六边形房间组成,每个房间都有许多完全不同的藏书,书里包含大量杂乱、无意义的字母。

  同时,巴别塔图书馆也藏着足以改变人类命运的真理。一群图书管理员就在馆里无穷尽的字母中寻找“真理”,大多数人穷尽一生也两手空空,只有极少数人承蒙运气眷顾,找到了一两样。

  本质上,过去几十年的技术和神农尝百草的传说没什么两样——在庞大的混合物里做实验,希望能找到一种是起作用的。

  直到人工智能技术出现,一场巨变正在悄然发生。AI制药的浪潮,源自人工智能技术在生物学领域的重大突破。

  2020年,Google旗下DeepMind发布AlphaFold2,利用AI的能力预测蛋白质结构,解决了生物学界几十年的“蛋白质折叠问题”。2021年,AlphaFold2在短时间内成功预测出35万个蛋白质结构,几乎包含了人类基因组表达的约2万个蛋白质。

  临床前的药物研发流程主要包括靶点的确认、先导化合物的发现和优化。靶点可以理解为导致疾病的生物分子(大部分是蛋白质),化合物即有效的药物。

  过去,这些环节极度依赖人的经验与漫长的实验,随机性很高,也需要一定的运气。而且,《Nature》2017年的一篇论文表示,可能成药的化合物数量是10的60次方,而传统筛选办法只能找到的数量约是10的11次方。这中间存在的大片未知,就需要借助人工智能技术。

  AI既能快速推测出数量巨大的化合物,还能通过模型,综合评估成药性、活性、选择性等因素,从这些化合物里筛选最可能适配的化合物。

  2020年新冠疫情爆发,时间紧迫,全球都在等待针对新冠的特效药,这让AI制药得以大展身手。

  辉瑞的新冠口服药Paxlovid,借助了超级计算机的AI算法进行研发。另一家大药企利来,与AI制药公司AbCellera合作研发治疗新冠的抗体bamlanivimab,随后紧急投入使用,帮助了超过100万新冠患者。BenevolentAI则利用AI平台检索海量文献,发现一款治疗风湿的旧药或许能治疗新冠,随即展开实验。

  新冠疫苗研发也用上了AI。美国莫德纳公司的AI平台生成了20000个独特的mRNA序列,仅用42天就设计并生产了第一批待测试的新冠疫苗。

  其中,药企巨头赛诺菲不仅宣布拥抱AI,还身体力行地开出了多个AI制药订单。2022年,赛诺菲给Exscientia、英矽智能和Atomwise的订单金额分别是356亿元、82亿元和69亿元。

  在资本市场,AI制药刚崭露头角那会,戴枫和投资机构的同事正在寻找AI领域的新机会。

  当时,AI技术的商业化落地主要集中在人脸识别等场景,技术门槛低,“是个大学生就会搞”。他们想要的项目,“AI技术够复杂,商业价值足够厚,10年左右能变现”。

  听起来AI制药将颠覆药物研发,给企业创造远超过去的利润。然而现实很快给出冰冷的回应。

  制约AI制药发展的一大因素是数据。尤其是在AI制药还是资本的宠儿时,很多初创公司缺的不是钱,而是数据。

  AI技术需要大量的优质数据,然而初创公司能利用的数据并不多。某种程度上,数据构成了制药行业的核心壁垒。最好的数据往往散落在各大药企的手里,不会轻易共享。华东理工大学药学院教授唐赟接受采访时说,“即便是自己用不上的数据,也藏得像个宝贝一样,不会拿出来和人共享。”

  戴枫告诉36氪,大药企不排斥跟AI制药公司合作,问题在于,大药企“做甲方做惯了,习惯全部资源都围着它服务”,而AI制药公司不可能全部投入到这个合作订单。因此这种合作形式很难长久。

  过去几年,许多从业者开始呼吁数据共享,但困难重重。在欧洲,一个名叫MELLODDY的数据共享项目,囊括了药企、AI制药公司、IT巨头和高校等24家组织。参与者可以利用多家组织的数据,创建更精准的AI模型。

  愿景很美好,但据使用过的企业反馈,提升效果并不明显。究其原因还是,不同企业的数据很难一致,而且最核心的数据仍是商业机密。

  为了积累私有数据,AI制药行业的共识是“AI需要和实验结合”。头部AI制药公司正在建立自家的自动化实验室,从实验室获得大量有价值的数据,再投喂给AI模型。

  实验室的机器人可以帮工作人员从重复性的实验中抽身,将更多精力放在药物研发更重要的环节。

  “既然数据的使用进入下一个时代,”戴枫说,“那数据的生产也不能停留在上一个时代。”他投了一个生产AI制药数据的项目。

  经过几年的探索,AI制药的商业模式大概有三种:AI SaaS服务(提供AI平台软件)、AI CRO(提供药企研发服务)和AI Biotech(自主研制新药)。

  坦白说,基于前两种模式的AI制药公司,通常和传统药企合作,售卖“掘金用的铲子”。国内的晶泰科技主要走的就是CRO路线——根据客户提供的靶点,设计出先导化合物,验证安全性,最后完成交付。

  不管是卖软件还是卖服务,赚到的钱仅是杯水车薪。上市公司AbSci与默克、Xyphos Biotechnology等大药企均有合作开发订单,但年收入从未超过500万美金,而公司半年的支出就超过了4000万美金。

  别说盈利,连自我造血都够呛。“一些拿到太多融资、给到太高估值的初创公司,就很艰难了。”戴枫回忆道。

  要想证明自身的商业价值,就只能尝试AI Biotech。并非所有AI制药公司都具备自主研制新药的实力。

  “(一些AI制药公司)都在说怎么看文献、找靶点,感觉很不fancy,”一位投资机构人员难掩失望——她曾经看过这赛道,最终没有投,“讲得很高大上,干的都是整理文件的事情,比如一些申报文件写得很累,AI制药公司去搞这些。”

  况且,当AI制药推进到临床试验阶段,就跟传统制药相差无几:都要经历严格的、漫长的多期临床试验。有90%的新药都倒在了临床阶段,这也就是“死亡之谷”的由来。

  失败的代价是沉重的。BenevolentAI凭借一条自研管线上市,然而在临床试验中无法治疗患者病情,宣告失败。公司股价大跌,于5月裁员近180人,接近公司的一半。

  市场的幻灭只需几个月时间。大大小小的AI制药公司陷入挣扎。资本套现跑路是常事,更惨的要数那些没有太强现金流的初创公司,把钱烧光了,落得白茫茫一片。

  在这之前,制药行业通用的AI技术,多半是深度学习和大数据算法等,经历多年的研发和迭代,行业玩家在技术层面的差距并不明显。简单来说,大家用的方法差不多,比拼的是算法的精度和数据的质量。

  然而,ChatGPT可能会打破目前的技术格局。一个专家认为,大模型更富创造力,能够承载更多的制药所需的生物信息。同时,大模型能够对已有的数据进行二次训练,提升现有AI模型的精度。

  一些AI制药公司已经开始尝试生成式大模型。今年2月,美国加州的一家初创公司Profluent,开发出类似ChatGPT的大模型ProGen,并首次合成了自然界尚未存在的蛋白质,效果跟天然蛋白一样。这项研究成果发表在《Nature》杂志子刊,引起业内关注。

  据报道,研发人员给ProGen投喂了2.8亿种不同蛋白质的氨基酸序列,并且花费数周时间进行训练。

  在国内,AI制药公司呈元科技从去年4月开始布局预训练大模型,继而开发了针对合成肽药物的多目标生成式AI设计平台SynCore。

  呈元科技创始人张骁博士告诉36氪:“预训练大模型是个通才,具备很强的基础能力,但对AI制药来说,这还不够。”他举例道,预测一个候选药物分子是否会与特定的蛋白质发生作用,需要AI对化学结构、理化性质有深入理解。

  因此,研发团队利用强化学习对模型进行再调整,包括使用多轮干湿闭环的数据给模型反馈,告诉AI预测正确与否,让AI自发调整相关预测参数。

  张骁认为大模型是未来趋势,而大模型所需的技术也更加复杂,“能驾驭这种模型的(AI制药公司)并没有那么多”。

  除了专业的biotech团队和AI团队,他强调公司的高质量数据,构成了技术壁垒:“高通量数据,如mRNA展示库的数据,能真正用来训练并优化大模型;基于多目标强化学习的干湿闭环算法体系,让高质量的湿实验数据快速提高模型在特定管线中的预测准确性和可信度。”

  张骁表示,呈元科技已经在用AI预训练大模型赋能多个合成肽药物管线的研发,“在业内领先优势至少是2-3年”。公司去年获得天使轮融资,今年3月完成了数千万美元pre-A轮融资,距离他们成立还不到一年。

  咨询公司Gartner在一份报告里预测,2025年,50%的药物发现与研发将使用生成式AI;2027年,30%的制造商将借助生成式AI提高研发效率。

  比起创业者,投资机构人员戴枫对ChatGPT应用在AI制药的前景比较谨慎。他解释道,目前大模型在这个领域的应用主要是在交互场景,比如研究人员在浏览和分析大型数据集时,可以用自然语言和GPT对话,更快找到想要的素材。“其他场景我暂时想不到。”

  他认为,GPT在构建知识图谱时会有作用,比如替研究人员从海量的资料里提取有用信息,帮助研究人员进行靶点的确认等前期工作,“但这不算制药的环节”。他补充说,“我理解未来大模型在制药上会有价值,但需要更多的验证。”

  戴枫支持头部AI制药公司去尝试ChatGPT,因为这些公司具备一定的实力基础,换句话说,还有钱去做生成式AI的探索。但是,体量更小的公司完全all in GPT最好慎重一些。

  如今资本市场对AI制药的期待在回归理性。商业化的闭环暂时还未完成,既是困难,也是机会。尽管市面上的钱少了,创业者少了,但戴枫对AI制药的信心并未减弱。

  这半年他看了不少AI制药的项目,有条原则是,“至少你要取得一些小的milestone,就是实际的进展。这个时代光靠讲故事已经不行了。”

服务热线
365整形网 方舟号