人工智能在新药研发中的应用现状与挑战(上)
人工智能作为一种新兴技术,是新药研发实现降本增效的重要方式之一,人工智能+新药研发已成为中国医药企业加速创新转型的重要驱动力。
提升新药研发效率,对加快开发临床需求未被满足的创新药物,助力药企抢占“best-in-class”和“first-in-class”药物市场的机遇窗口期,从而提升药企全球竞争力具有重要意义。AI技术作为提升新药研发效率的重要驱动力量,正在加速对新药研发各环节的渗透。本文通过对AI技术、AI赋能新药研发应用场景,以及应用AI技术的企业主体进行总结梳理,并展望AI技术未来发展趋势,为AI+新药研发提供思路与参考。
人工智能+新药研发的应用模式
与AI在其他场景的应用类似,AI+新药研发的实现路径包括五大流程:获取目标训练数据集;AI自主学习算法建模;多次训练优化模型;测试集应用以评估模型性能;基于模型实现分子筛选、预测、分析等预定目标。算法、数据集和模型这3个要素是必不可少的部分,其中,算法和数据是实现应用的关键。
人工智能+新药研发应用算法
AI技术涵盖ML和DL,如表1所示。ML算法在新药研发领域被广泛用于分类和回归预测等方面,常见的ML算法包括决策树(decisiontree)、随机森林(randomforest)、支持向量机(supportvectormachine)、k-最近邻算法、朴素贝叶斯分类器等;DL算法包括深度神经网络(deepneuralnetwork,DNN)、卷积深度网络(convolutionalneuralnetwork,CNN)、循环神经网络(recurrentneuralnetwork,RNN)和自编码器(autoencoder,AE)等。DL算法适合处理大数据,模型也更为复杂。随着计算机性能的提高和数据量的积累,DL算法在新药研发中的应用越来越广。
表1:人工智能常见应用算法
人工智能+新药研发应用数据
新药研发过程涉及大量的数据,包括文献资料、化合物数据、靶点数据、专利数据、临床试验数据、真实世界数据、药品审评审批数据、市场销售数据等。面对海量、多源、异质性的数据,AI技术应用已逐渐跳出以靶点和分子筛选为核心的传统新药研发模式,形成以数据为核心的研发模式。
人工智能+新药研发的应用企业
近年来,越来越多的企业布局AI+新药研发,探索如何用AI技术实现新药研发的降本增效。据DeepPharmaIntelligence统计,截至2020年,全球共有240家AI+新药研发企业,主要分布在美国、英国和加拿大,国内也有一些从事此类工作的企业。目前,探索AI+新药研发的企业主要有三类:一是AI药物研发创新企业,如Exscienta、BenevolentAI、Atomwise、RelayTherapeutcs、晶泰科技、燧坤智能等;二是IT巨头,如Google、微软、腾讯、阿里巴巴集团等;三是大型制药企业,如罗氏、阿斯利康、强生、葛兰素史克(GSK)等。
图1:人工智能+新药研发企业图谱
AI+新药研发企业多以技术优势切入1个或多个应用场景,如BenevolentAI构建判断加强认知系统(judgmentaugmentedcognitionsystem,JACS)技术平台,针对包括阿尔茨海默病和罕见肿瘤在内的4个不同领域的疾病进行10多种药物的研发;晶泰科技组建RenovaAI新药研发平台,提供“计算+实验”新模式下的药物设计与固体形态研究服务。
大型药企则以自建AI研究团队、投资并购或与AI技术公司合作的方式,布局AI新药研发。辉瑞、GSK和诺华等制药公司也在内部建立了大量的AI研究团队。当前全球十大制药公司均已布局AI+新药研发,诸多大型制药公司开始与AI初创公司开展合作,例如艾伯维与AiCure、阿斯利康与BergHealth、拜耳与SensyneHealth、百时美施贵宝(BMS)与ConcertoHealthAI,以及辉瑞与IBMWatson等。
我国AI+新药研发起步较晚,目前尚处在初期阶段。据火石创造统计,国内涌现了晶泰科技、深度智药、云势软件、望石智慧等一批创新企业,主要分布在北京、上海、杭州和深圳等城市。然而,国内AI+新药研发企业并不多,总数不足20家。
近年来,随着我国医药产业创新发展的加速推进,国内医药行业在AI+新药研发领域的跨界合作也在增加:医药巨头与AI+新药研发技术公司合作,例如恒瑞医药与百奥知、豪森药业与Atomwise的合作;药企与IT巨头合作,如正大天晴通过与阿里云合作获得一种全新的化合物筛选方法;CRO企业与AI+新药研发技术公司合作,如药明康德和Schrdinger合资成立了FaxianTherapeutics,将药明康德的先导化合物优化服务与Schrdinger的药物设计软件平台相结合,从而加速新药发现;药明康德和Insilico合作开发了一种ML模型,用于从头设计DDR1蛋白(一种与纤维化等疾病有关的激酶)的小分子抑制剂。