百度推出国内首个对标AlphaFold3的HelixFold3,RNA分子预测精准度超越AlphaFold3

进不了网站?换个网络试试!

量子比特 |公众号

国内首款标杆产品来了——

,来自百度智能云和百度推进器团队。

它在传统的生物分子结构预测任务中已经达到了相当的水平:尤其是在RNA分子和共价修饰场景中,准确性相同或显着超越。

百度推出国内首个对标AlphaFold3的HelixFold3,RNA分子预测精准度超越AlphaFold3插图

△插图,蓝色为,黄色为

另外,在抗原抗体结构预测任务中,成功率提升到了80%+,感觉可以直接用来研究抗体结合机制。

更关键的一点是,它降低了使用门槛和成本——

支持在线服务。用户只需简单激活并按算力付费(相当于按Token付费)。

整个过程零代码操作,无需担心后续运维。

而且推理速度非常快,能够在几个小时内完成数千个分子结构预测。

其背后团队来自百度智能云和团队。

有些人可能不知道的是,他们长期以来一直深耕生命科学领域。他们自主研发的mRNA序列优化算法此前发表于《》。

这也是国内科技公司首次登顶世界顶级期刊。

百度推出国内首个对标AlphaFold3的HelixFold3,RNA分子预测精准度超越AlphaFold3插图1

国产车型强悍

这款国产机型的发布,不仅突破了技术本身,更彰显了其强大的应用属性。

首先,能力全面对标、局部超越。

以RNA分子预测和抗原抗体结构预测这两个最常见的核心场景为例。这两种场景都有助于下游药物设计、疾病治疗和其他研发。

在RNA分子预测任务中,在CASP 15 RNA数据集上的评估结果显示预测精度显着超标。

百度推出国内首个对标AlphaFold3的HelixFold3,RNA分子预测精准度超越AlphaFold3插图2

同时,在从PDB数据库收集的最新蛋白质-RNA复合物结构预测任务中也表现出了更高的准确性。

百度推出国内首个对标AlphaFold3的HelixFold3,RNA分子预测精准度超越AlphaFold3插图3

此外,在涉及共价修饰的多个结构预测任务中,结果基本持平并超过。

在抗原抗体结构预测任务中,精度与最新71个PDB抗原抗体结构预测数据相当。

通过指定任意数量的表位氨基酸,进一步提高了抗原和抗体结构预测的准确性。任意指定15个表位氨基酸的数量后,成功率进一步提高到80%以上。

百度推出国内首个对标AlphaFold3的HelixFold3,RNA分子预测精准度超越AlphaFold3插图4

其次,在线服务平台即用又丰富的场景应用。

我们都知道,日常生活中使用的高精度生物分子结构预测工具,即使是完全开源的,往往使用门槛也很高,需要用户具备较高的技术能力。

现在可以看到网站已经支持了很多功能,整个流程都是无代码的,而且还支持可视化呈现。

例如,它支持大分子的任何侧链修饰,包括蛋白质、DNA 和 RNA。输入分子实体后,旁边会显示配体结构。

设置完一些参数约束后,例如指定修饰组和连接位点,剩下的工作就交给你了。

百度推出国内首个对标AlphaFold3的HelixFold3,RNA分子预测精准度超越AlphaFold3插图5

最后,您可以获得3D结构和相应的参数结果,移动光标并有清晰的点解释。

与仅支持46种预定义修饰相比,通过定义侧链修饰可以覆盖更广泛的化学空间,覆盖PDB数据库中50%以上的修饰场景。但它只支持不到5%,相当于将修改后的场景扩大了十倍。

这样,生命科学从业者的研究空间就得到了极大的拓展,可以覆盖小蛋白/肽发现、酶修饰等具体应用。

除了在线服务外,还支持API调用,通过API SDK进行批量推理和大规模分析。

最后也是最核心的一点是,使用它,可以大大降低推理成本,直接提高高通量生物信息学应用的处理能力。

现在通用语言的大型模型都关注推理成本。事实上,生命科学领域的挑战更为严峻。

生命语言不仅涉及多模态数据的融合,还涉及三维空间的精确建模,这对计算资源提出了极高的要求。通常情况下,从业者必须自行购买、部署和维护昂贵且复杂的计算资源,进一步增加了科研成本和技术壁垒。

借助百度智能云CHPC平台,通过MSA检索和模型推理方面的性能优化,大大降低了推理成本——数小时内即可完成数千个准确的生物分子结构预测,大大提高了从业者的研究速度。

百度推出国内首个对标AlphaFold3的HelixFold3,RNA分子预测精准度超越AlphaFold3插图6

有一个更流行的例子。在百度云平台上,500长度的蛋白质推理仅需4元。与在云端租用GPU或自行部署往往花费数万甚至数百万的成本相比,确实低了指数级。

对于从业者来说,你只需要提供你的诀窍,剩下的都会为你计算。

现在,他们已经在和一些科研机构/CRO制药公司合作,比如验证湿法实验的可能性。

传统上,非常高通量的湿法实验需要几个月的时间才能锁定候选分子,但现在只需要计算进行初步筛选,然后使用高潜力的分子进行湿法实验,使整个研发节奏顺利。一个很大的进步。

生命科学迎来大模型应用时代

前几个月荣获诺贝尔奖,如今又以低门槛但性能不损的方式亮相。在生命科学领域,大模型正在加速从技术到应用的跨越,进入新阶段。

一方面体现在解决行业痛点。大车型具有一定的天然优势,加速传统产业发展。

例如,在药物研发方面,行业长期面临“双十困境”,即一种新药的研发需要10年时间、耗资10亿美元。

但现在随着大模型的发展,生物医药行业面临着前所未有的机遇。这体现在药物研发的多个研发环节。

例如,在虚拟筛选阶段,可以利用大模型技术从780万个分子库中快速筛选出6个潜在活性分子。效率比传统人工筛选高数千倍。

另一方面,更多前沿场景有望迎来革命性突破。像这样的低门槛产品,将吸引更多跨学科人才参与生命科学最前沿的课题。

之前已经讨论过,通用大机型带来的通用价值是降低成本和提高效率。在生命科学领域,在降低成本、提高效率的基础上,还有创新创造的价值。

比如基因编辑、个性化诊疗、合成生物学,甚至整个工业制造,包括农业、食品、化工、材料、能源等行业都可能被赋能。

在这一波浪潮中,百度这个强大的玩家也不容忽视。他们多年来一直深耕生命科学领域。

此前,他们还自主开发了一系列文心生物计算大模型,包括化合物通用表征模型and-2、蛋白质结构分析模型、单序列蛋白质表征模型-2。

这些模型为虚拟筛选、ADMET预测、蛋白质结构预测、mRNA序列设计等提供了便携且强大的算法工具。

企业通过百度()生物计算平台获取相关服务。目前,他们已与多家药企展开深度合作,助力加速药物研发管线的推进。

此外,百度智能云还构建了整套生命科学解决方案,覆盖从药物研发到下游诊疗场景的全链条。例如,行业首个大型医疗模型“奇迹医生”,目前正在加速落地医疗诊疗全流程,进一步拓展大型模型在生命科学领域的价值边界。

百度推出国内首个对标AlphaFold3的HelixFold3,RNA分子预测精准度超越AlphaFold3插图7

如今,百度的重大升级不仅提高了模型的准确性和效率,也给行业带来了更多可能性。

大型模型将在生命科学领域向更深、更广的方向进行探索。

平台链接:

论文链接:

本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论