量子比特 |公众号
国内首款标杆产品来了——
,来自百度智能云和百度推进器团队。
它在传统的生物分子结构预测任务中已经达到了相当的水平:尤其是在RNA分子和共价修饰场景中,准确性相同或显着超越。
△插图,蓝色为,黄色为
另外,在抗原抗体结构预测任务中,成功率提升到了80%+,感觉可以直接用来研究抗体结合机制。
更关键的一点是,它降低了使用门槛和成本——
支持在线服务。用户只需简单激活并按算力付费(相当于按Token付费)。
整个过程零代码操作,无需担心后续运维。
而且推理速度非常快,能够在几个小时内完成数千个分子结构预测。
其背后团队来自百度智能云和团队。
有些人可能不知道的是,他们长期以来一直深耕生命科学领域。他们自主研发的mRNA序列优化算法此前发表于《》。
这也是国内科技公司首次登顶世界顶级期刊。
国产车型强悍
这款国产机型的发布,不仅突破了技术本身,更彰显了其强大的应用属性。
首先,能力全面对标、局部超越。
以RNA分子预测和抗原抗体结构预测这两个最常见的核心场景为例。这两种场景都有助于下游药物设计、疾病治疗和其他研发。
在RNA分子预测任务中,在CASP 15 RNA数据集上的评估结果显示预测精度显着超标。
同时,在从PDB数据库收集的最新蛋白质-RNA复合物结构预测任务中也表现出了更高的准确性。
此外,在涉及共价修饰的多个结构预测任务中,结果基本持平并超过。
在抗原抗体结构预测任务中,精度与最新71个PDB抗原抗体结构预测数据相当。
通过指定任意数量的表位氨基酸,进一步提高了抗原和抗体结构预测的准确性。任意指定15个表位氨基酸的数量后,成功率进一步提高到80%以上。
其次,在线服务平台即用又丰富的场景应用。
我们都知道,日常生活中使用的高精度生物分子结构预测工具,即使是完全开源的,往往使用门槛也很高,需要用户具备较高的技术能力。
现在可以看到网站已经支持了很多功能,整个流程都是无代码的,而且还支持可视化呈现。
例如,它支持大分子的任何侧链修饰,包括蛋白质、DNA 和 RNA。输入分子实体后,旁边会显示配体结构。
设置完一些参数约束后,例如指定修饰组和连接位点,剩下的工作就交给你了。
最后,您可以获得3D结构和相应的参数结果,移动光标并有清晰的点解释。
与仅支持46种预定义修饰相比,通过定义侧链修饰可以覆盖更广泛的化学空间,覆盖PDB数据库中50%以上的修饰场景。但它只支持不到5%,相当于将修改后的场景扩大了十倍。
这样,生命科学从业者的研究空间就得到了极大的拓展,可以覆盖小蛋白/肽发现、酶修饰等具体应用。
除了在线服务外,还支持API调用,通过API SDK进行批量推理和大规模分析。
最后也是最核心的一点是,使用它,可以大大降低推理成本,直接提高高通量生物信息学应用的处理能力。
现在通用语言的大型模型都关注推理成本。事实上,生命科学领域的挑战更为严峻。
生命语言不仅涉及多模态数据的融合,还涉及三维空间的精确建模,这对计算资源提出了极高的要求。通常情况下,从业者必须自行购买、部署和维护昂贵且复杂的计算资源,进一步增加了科研成本和技术壁垒。
借助百度智能云CHPC平台,通过MSA检索和模型推理方面的性能优化,大大降低了推理成本——数小时内即可完成数千个准确的生物分子结构预测,大大提高了从业者的研究速度。
有一个更流行的例子。在百度云平台上,500长度的蛋白质推理仅需4元。与在云端租用GPU或自行部署往往花费数万甚至数百万的成本相比,确实低了指数级。
对于从业者来说,你只需要提供你的诀窍,剩下的都会为你计算。
现在,他们已经在和一些科研机构/CRO制药公司合作,比如验证湿法实验的可能性。
传统上,非常高通量的湿法实验需要几个月的时间才能锁定候选分子,但现在只需要计算进行初步筛选,然后使用高潜力的分子进行湿法实验,使整个研发节奏顺利。一个很大的进步。
生命科学迎来大模型应用时代
前几个月荣获诺贝尔奖,如今又以低门槛但性能不损的方式亮相。在生命科学领域,大模型正在加速从技术到应用的跨越,进入新阶段。
一方面体现在解决行业痛点。大车型具有一定的天然优势,加速传统产业发展。
例如,在药物研发方面,行业长期面临“双十困境”,即一种新药的研发需要10年时间、耗资10亿美元。
但现在随着大模型的发展,生物医药行业面临着前所未有的机遇。这体现在药物研发的多个研发环节。
例如,在虚拟筛选阶段,可以利用大模型技术从780万个分子库中快速筛选出6个潜在活性分子。效率比传统人工筛选高数千倍。
另一方面,更多前沿场景有望迎来革命性突破。像这样的低门槛产品,将吸引更多跨学科人才参与生命科学最前沿的课题。
之前已经讨论过,通用大机型带来的通用价值是降低成本和提高效率。在生命科学领域,在降低成本、提高效率的基础上,还有创新创造的价值。
比如基因编辑、个性化诊疗、合成生物学,甚至整个工业制造,包括农业、食品、化工、材料、能源等行业都可能被赋能。
在这一波浪潮中,百度这个强大的玩家也不容忽视。他们多年来一直深耕生命科学领域。
此前,他们还自主开发了一系列文心生物计算大模型,包括化合物通用表征模型and-2、蛋白质结构分析模型、单序列蛋白质表征模型-2。
这些模型为虚拟筛选、ADMET预测、蛋白质结构预测、mRNA序列设计等提供了便携且强大的算法工具。
企业通过百度()生物计算平台获取相关服务。目前,他们已与多家药企展开深度合作,助力加速药物研发管线的推进。
此外,百度智能云还构建了整套生命科学解决方案,覆盖从药物研发到下游诊疗场景的全链条。例如,行业首个大型医疗模型“奇迹医生”,目前正在加速落地医疗诊疗全流程,进一步拓展大型模型在生命科学领域的价值边界。
如今,百度的重大升级不仅提高了模型的准确性和效率,也给行业带来了更多可能性。
大型模型将在生命科学领域向更深、更广的方向进行探索。
平台链接:
论文链接:
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论