据华为云公众号消息,9月23日,华为全联接2021隆重开幕,华为高级副总裁、华为云CEO、消费者云服务总裁张平安发表「深耕数字化,一切皆服务」主题演讲,并重磅发布了华为云盘古药物分子大模型。
一、华为为什么切入AI药物研发领域?
一款创新药从研发到上市,平均成本超过10亿美元、研发周期大于10年——这是医药界公认的「双10定律」。
高成本的研发投入的同时,可能还会面临高失败率和低回报率。新药研发的投资回报率从2010 年的10.1%下降至2018 年的1.9%,新上市药物的平均销售峰值从2010年的8.16亿美元下降至2018年的4.07亿美元。
(注:造成低回报率和高成本主要原因是,一款新药的诞生便会无形提高未来新药研发的门槛;患者用药的决定权在医生非患者,所以品牌忠诚度低)
为了解决加速新药研发进程、平衡研发投入与成果产出之间的关系,多家AI算法公司纷纷入局AI新药研发,如谷歌、英伟达等。
7月23日谷歌旗下DeepMind团队发布由人工智能系统AlphaFold预测的蛋白结构数据库(AlphaFold Protein Structure Database),这一数据库将免费提供给全球的科研人员开放使用。
其所公布的蛋白3D结构数据库包含了AlphaFold人工智能系统预测的约35万个蛋白结构,其中人类蛋白质组方面,AI对98.5%的人类蛋白的结构做出了预测。此前,科学家们历经数十年努力,解析的蛋白结构只覆盖了人类蛋白序列中17%的氨基酸。
研究人员指出,AlphaFold能够对人类蛋白质组中58%的氨基酸的结构位置做出可信预测,对36%的氨基酸的结构预测达到很高置信度。
当被美国制裁之后,华为为了活下去,不断从多维度切入多场景生态。AI新药研发是华为云的生态布局之一,同时也在追赶谷歌最新的Alphafold。
华为云深度联合中国科学院上海药物研究所,共同训练了华为云盘古药物分子大模型,赋能全流程的AI药物设计。华为云EIHealth平台,盘古药物分子大模型学习了17亿个药物分子的化学结构,其结构新颖性为99.68%。
其中,「神农项目」属于免费公开的新冠药物虚拟筛选数据库(类似谷歌alphafold开放人类蛋白质预测);
药物虚拟筛选,是指计算机辅助药物虚拟筛选是新药早期研发的重要环节,可根据靶点蛋白和小分子药物的3D结构,从成千上百万的小分子库中快速筛选出与蛋白结合最紧密的候选药物。
在药物生成方面,实现了对小分子化合物的独特信息的深度表征、对靶点蛋白质的计算与匹配,以及对新分子生化属性的预测,从而高效生成药物新分子;在药物优化方面,实现了对筛选后的先导药进行定向优化。
华为云盘古药物分子大模型四大技术和创新能力:
1)提出了针对化合物表征学习的全新深度学习网络架构。华为云盘古药物分子大模型首次采用「图-序列不对称条件变分自编码器」架构,可以自动找出化合物关键的分子特征指纹,极大地提升了下游任务的准确性。
2)进行了超大规模化合物表征模型训练。华为云盘古药物分子大模型对市面上真实存在的17亿个药物分子的化学结构进行预训练,在化学无监督学习模式下,实现结构重构率、合法性、唯一性等指标全面优于现有方法。
3)生成了拥有1亿个新化合物的数据库。华为云盘古药物分子大模型的分子生成器生成了1亿个创新的类药物小分子筛选库,其结构新颖性为99.68%
4)在20余项药物发现任务上实现性能最优(SOTA)。
根据华为一贯的作风,华为不造车,同样华为也不制药,但华为将和药企和CXO企业合作:
1)2016年3月16日,上海药明康德新药开发有限公司与华为公司与在深圳签署精准医疗云战略合作协议。
2)华为云联合西安交通大学第一附属医院,基于华为云盘古药物分子大模型研发出全新的广谱抗菌药物,将先导药的研发周期从数年缩短至一个月,大幅提升新药研发效率。
结语:从研发难度来说,谷歌的alphafold整体难度远大于华为云EIHealth平台,alphafold专注于人类蛋白质的氨基酸,而华为云EIHealth是专注于小分子药物研发。从竞争角度来说,华为云与制药企业并非竞争关系,而是合作关系。华为有望将先导药的研发周期从数年缩短至一个月,大幅提升新药研发效率。