人工智能潜力无限,但科学家是不可替代的。
人工智能在打破学科界限、通过跨学科合作推进科学发现方面发挥着变革性作用。继2024年诺贝尔物理化学奖相继揭晓后,AI For(以下简称AI4S)领域再次掀起波澜。
面对炙手可热的新兴产业,它在快速发展的过程中又面临哪些机遇和挑战?今年行业发生了什么,如何激活该领域的创新动能,实现产业升级和可持续发展,成为行业关注的焦点。
12月11日,在“甲子光年”举办的2024甲子引力年终盛典上,四位领域专家、企业家以“科学智能:新范式下的AI促进科研转型”为主题,探讨了人工智能与人工智能的关系。人工智能与科学研究的经验、发展与未来。
深度原理核心创始成员、产品负责人李玉平,新研微魔生物科技CEO王岩,百图生物科技战略部总经理徐子尧,杜同度及主持人吴秉建,新芯资本合伙人,莱芒AI负责人生物技术 讨论了人工智能在科学研究中的应用和未来影响。他们从生命科学、化学、投资等不同角度分享了自己的见解和经验。
吴秉建谈到人工智能在科学领域的逐渐普及和接受,表示这些技术的应用已经逐渐从专业圈扩展到公共领域,特别是在解释这些复杂技术的应用时。 “人工智能的发展使我们更容易向非专家解释我们的工作。这种受欢迎程度非常重要。”
李玉平分享了深度原理利用人工智能进行材料科学研究的经验,以及如何利用人工智能和实验数据来优化材料设计过程,并强调人工智能的发展为解决尺度放大和不足的问题提供了有力的工具。数据。 “人工智能的人工智能正是目前解决这个问题的最佳解决方案。”
王艳提到了人工智能在冷冻电镜领域的应用,并介绍了人工智能如何帮助科学家更快地从大量数据中提取有价值的信息。她提到人工智能从科学研究的辅助工具向核心技术的转变,“AI并不是简单的数据挖掘或数据排序的AI,而是AI与先进实验方法的深度耦合。”
徐子尧强调了人工智能在生物制药领域的应用,特别是其在靶点发现和药物开发中的作用。她提到了人工智能在理解生物数据和构建模型方面的重要性,以及这些模型如何帮助科学家验证新药物靶点的有效性。 “AI需要理解里面的数据,比如一个科学家认为这是一个好的目标,它的评价标准是什么?它的维度是什么?这些问题都是AI人进一步理解的过程。”
讨论中,童嘟嘟分享了先导生物科技如何结合人工智能和免疫代谢重编程技术来优化肿瘤免疫治疗。比如如何改善T细胞耗竭的问题,提高治疗反应率和疗效,特别是在临床治疗淋巴瘤和白血病方面,已经实现了100%完全缓解。他认为,AI技术的应用使得免疫治疗药物的设计更加精准。 “通过AI算法解决实体瘤的CAR-T和TIL等细胞疗法遇到的问题,我们可以显着降低肿瘤免疫治疗的毒副作用。”
以下为本次圆桌交流实录,由《甲子光年》编译编辑:
吴秉健(主持人):我是吴秉健,心资本合伙人。我们是一家风险投资机构。我个人第一次关注AI是在2018年,Alpha准确预测了蛋白质结构。在科技圈、创业圈、投资圈都引起了轰动。今年,诺贝尔物理和化学奖授予了Alpha的作者。 AI for逐渐出圈。似乎向家人解释我们所做的事情更容易。今天我们主要讨论人工智能增强后科学家们取得的突破。我们心资本团队之前投资过小鹏汽车、满帮、百川智能等科技公司,也投资过一些人工智能应用和人工智能项目。
李玉平:我是李玉平,深度原理产品负责人。我们是一家年轻的公司,今年刚刚成立,专注于AI for和AI for。我们利用深度学习、第一性原理计算和高通量实验技术搭建平台,实现材料科学领域从分子筛选、合成设计、配方优化到可控实验的闭环流程。今年我们组建了一支背景多元、互补的团队,推动石化、精细化工、高端材料等领域的一些业务合作。
王岩:我是新研微墨首席执行官王岩,新研微墨是一家提供冷冻电镜服务和人工智能服务的国际先进服务提供商。新研显微镜的技术团队源于与 联合开发全球第一台生物冷冻电镜的团队。也是世界上第一个突破病毒原子级分辨率的团队。深耕冷冻电镜领域20余年。我积累了很多独家算法、工作流程和行业技术诀窍。冷冻电镜行业广泛使用的许多算法也来自我的团队。冷冻电子显微镜是一种非常强大的工具。通过分析蛋白质、信号通路、靶标、病毒、细菌等大分子的结构,可以分析生物运行机制、人为什么生病、如何治疗。目前公司主要为各类创新药企提供各类结构分析服务;为科技公司提供人工智能的算法咨询、生物咨询、算法验证、湿实验设计与实施等服务;提供服务为生物学、医学、药学、化学、材料等各类研究人员提供结构分析服务。
徐子尧:我是徐子尧,百图生物科技战略部总经理。我们使用大型人工智能模型来解决生命科学问题,今年我们扩展到了 DNA、RNA 和细菌的大型模型。从业务上看,我们这三年随着国家新生产力的提出,从生物医药领域向生物制造行业拓展。
童嘟嘟:我是来自莱芒生物的童嘟嘟。莱芒生物科技是一家与其他公司不同,更专注于AI应用的公司。基于免疫代谢重编程技术和前沿的AI算法,优化现有肿瘤免疫治疗方法,特别是解决T细胞耗竭问题,提高肿瘤免疫治疗的缓解率和疗效,减少毒副作用。在淋巴瘤和白血病适应症方面,我们的代谢增强型CAR-T疗法已经实现了100%的完全缓解率。同时,我们也在推进实体瘤适应症的管线研发,预计明年启动IIT临床研究。
吴秉健:我们先从一个简单的问题开始。大家都在致力于AI与跨学科的结合。您能谈谈您如何理解人工智能以及如何在您的业务中体现这一概念吗?
李玉平:我们公司的名字就反映了这一点。 “深度”代表深度学习,“原理”指第一性原理计算。在材料领域,我们面临着结构化高质量数据不足、多尺度建模、流程连接复杂等问题。 AI是解决这些问题的最佳途径。它在这个过程中起到数据创建和纠错的作用。它基于物理定律限制人工智能的输出并提供可解释性。通过持续的数据馈送,AI以极快的速度接近物理世界的真实解决方案,甚至出现更多的智能,并可以在多个生产领域“提出”更激进和创新的设计解决方案。这可能反过来有助于发现并形成循环数据驱动的“飞轮”。
王岩:AI for不仅仅是利用AI进行简单的数据挖掘或排序,而是与先进科学技术和实验方法进行深度耦合。冷冻电镜领域其实很早就开始应用AI,因为冷冻电镜技术需要将仪器捕捉到的二维电子衍射图像还原成各种大分子的三维结构。在选点、数据分析、结构重建的过程中是很自然的。我们正在逐步应用很多AI算法来提高效率。
其实我觉得AI可以分为两个阶段:第一个阶段,AI作为研究工具,帮助处理数据,加速科学研究。第二阶段以人工智能为主导,利用人工智能根据积累的数据预测蛋白质的结构。从此,AI不仅成为了研究的重要工具,AI也成为了一个独立的门类,推动了整个行业和行业的爆发。 。芯研微墨与工业人工智能紧密相关,提供算法咨询和生物咨询,包括湿实验的设计和实现、算法验证等。
徐子尧:我想用我们在医疗领域的实际例子。例如,在开发医学新药时,第一步通常是寻找新靶点。这主要涉及定义问题并确定什么是好的目标。同时AI需要了解,比如如果科学家认为这是一个好的目标,它的评价标准和维度是什么?数据是有标签的还是无标签的?
AI实际上需要理解这些规则并将其纳入模型架构中。这并不意味着如果人工智能推荐了一个目标,我们就可以开发管道并获得 FDA 批准用于临床。我们还需要实验来验证AI的结果。正如李总所说,整个过程需要像飞轮一样运转,每一个环节都需要各方的参与。
监事:前面几位嘉宾讲得很好,特别是王老师提到的两段论点。 AI前期更多是作为一种工具,后期帮助科学数据进一步探索深层次的科学原理。在我们医药领域,这一点是非常明确的。最初,AI主要作为设计新药物分子的工具,比如设计具有更高亲和力、活性和特异性的抗体分子或活性蛋白,相当于用AI工具替代了某些部分。传统药物开发的湿式实验过程效率更高、成功率更高、成本更低。对于新的细胞疗法,例如CAR-T,作用机制很复杂,成分也很多。改变其中一些可能会产生完全不同的临床效果。目前的研发方法主要是通过实验来尝试各种优化组合,寻找功效良好的CAR-T设计。未来可以更多地利用AI工具探索数据中的科学机制,为CAR-T的优化设计提供原则性的解决方案。解读,提高未来设计的效率。
吴秉建:人工智能作为一个跨学科的角色,包括干实验和湿实验。您能从自己的业务角度描述一下AI和AI的比例吗?
同一个主管读:这个问题在不同的公司甚至同一个项目中差异很大。以我们公司为例,涉及药品的项目需要经历从药物设计到体外细胞实验、体内动物实验以及后续临床研究的整个过程。这是一条长链。我觉得项目比重比较大,或者说湿实验部分比较大,可能80%到90%。人工智能可以在最早的分子水平优化设计中发挥重要作用。对于平台公司来说,人工智能可能会发挥更大的作用,能够更好地为我们这样的下游企业赋能。
徐子尧:总体来说,我们是一家AI平台公司,希望用AI赋能下游产业,所以AI整体占比非常高。具体到项目的某些方面,比如前期定义客户需求时,AI和AI就占了一半。在模型开发阶段,AI的比例可能高达80%。当最终交付给客户时,我们将与团队密切合作。一般生物部分占客户验证流程的80%,AI仍占20%。他们将继续使用我们的模型并将其应用到实际生产中。整个流程中不同环节的AI占比也不同。
王艳:根据实际业务情况,我们服务不同客户的比例会有所不同。比如我们给客户服务AI的时候,AI占比比较高。当我们为创新药企提供结构分析服务时,大部分都是内容。从整体AI For行业的角度来看,这个过程是首先生成大量的数据作为基础训练集来训练AI模型。 AI模型生成结果后返回验证,验证结果的真实性,然后反馈给模型。通过不断往复,AI模型逐渐优化,形成“科学数据-AI模型-实验验证”的闭环。这个闭环中所占的比例是比较大的。而在AI领域,我们不能仅仅依靠算力的堆栈。很多时候,深入的理解和洞察决定了研发的效率和深度。所以从目前来看,比例较大,大概在60%-65%左右。不过,随着研究的进步以及数据和模型的积累,人工智能的比重会逐渐增加,但科学实验的作用永远不会消失,只会变得更加自动化和智能化。未来,AI与AI一定会双轮驱动,共同推动生命科学等科学领域的发展。
吴秉建:五年后人工智能可能占多大比例?
王艳:五年后,我估计AI至少会占到45%、55%。事实上,AI是一种动态平衡。基础实验决定了现实世界的“硬约束”和“边界条件”。在此基础上,人工智能寻找模式并加速假设的制定。在自然生命科学领域,仍有许多边界需要探索。例如,我公司的第二代冷冻电镜技术可以观察不同生物状态下大分子的原位结构。随着这些边界逐渐扩大,数据积累也随之增加。 ,AI在该领域的作用将越来越强。
李玉平:前面的嘉宾已经从客户类型、需求阶段、公司定位等多个维度分析了这个问题。我更多的是从时间发展的角度来看。这个比率很难量化,并且是动态发展的。整个行业发展的基础是科学,关键在于人工智能。两者相互支撑,呈螺旋式上升。以我们为例,我们最初依靠材料结构和化学反应的计算,进行实验研究。积累了这些数据后,我们开始探索AI算法的设计,确保这些算法符合物理定律,能够根据计算和实验数据不断迭代AI能力。 AI给出预测结果后,我们在层面进行验证。当人工智能能力尚未完全达到标准时,行业更多地依赖于专家经验驱动和实验探索。但关键的突破在于人工智能,未来很可能占到一半以上。
吴秉建:你们做材料AI,AI占多少比例?
李玉平:目前需要区分所谓的AI是传统的统计模型还是数据驱动的深度学习框架。前者所占比例非常高。很多大公司都会利用开源工具和大型语言模型来帮助建立自己的AI团队来做一些数字化项目。至于深度学习,由于一些研发场景的不兼容以及开发成本较高,其应用相对较少。
吴秉健:今年诺奖公布后,相信科学界大家都感受到了一些影响,未来科学家的肖像可能会发生改变。这将如何影响您所在行业的科学家?您认为未来科学家的肖像会是什么样子?
李玉平:我认为,未来的科研团队将越来越依赖人工智能,人工智能将成为科学家的私人助理。从科学研究的早期阶段,如文献研究,到商业化过程中的专利检索和材料信息检索,这些耗时且艰巨的过程都可以由人工智能来承担。进入面向应用场景和市场需求的研发阶段,人工智能可以提出多种可能的解决方案,快速探索候选空间,快速衍生目标产品。在这种情况下,科学家的角色转变为进一步验证或规划。
王艳:我相信今年诺贝尔奖的颁发对很多人来说是一个震撼,也是一个信号,表明人工智能已经成为科学研究中不可或缺的固定范式。它是一个基本工具,而不仅仅是辅助工具。人工智能极大地提高了科学研究的效率。例如,我们的一位合作伙伴现在可以预测每周 100,000 个肽复合物的产量。这种效率在以前是难以想象的,所以未来的科学家必须掌握AI工具才能加速自己的研究,为自己提供更多的探索空间。
但同时我们也必须明白,人工智能只是工具,而不是目的,前沿的科学问题仍然需要人类的创造力和判断力。人类科学家对问题的洞察力、对实验设计的直觉以及对结果的解释仍然至关重要。例如,中国科学院上海药物研究所12月6日发表论文指出,预测的GPCR复合物结构是错误的。这说明科学家在验证人工智能成果、定义人工智能应用边界方面发挥着不可替代的作用。现有的人工智能模型在自然科学中远非完全可靠,无法预测分子动力学模型或与其他分子的相互作用。因此,人工智能是科学家加速科学研究的有力工具,但科学家的作用是不可替代的。
徐子尧:因为我们公司很多同事都来自诺贝尔奖获得者团队,比如美国公司的总裁Per,他之前在David Baker的研究组工作,后来在诺和诺德担任全球副总裁。我们与David Baker的团队和来自顶尖大学的教授合作。这次诺贝尔奖是一个非常积极的信号。四年前公司成立时,在中国很难找到既懂人工智能又懂生物学的人。过去几年,我们努力促进AI和生物领域人才的对话,举办了很多培训和讲座。此次诺贝尔奖再次引发了该领域的公众关注。无论是从生物学还是人工智能的角度来看,大家都开始向中间靠拢,拥抱未来的变化。我们希望这种趋势能够持续下去,并吸引更多的科学家和学生进入这一领域。
院士:今年的诺贝尔奖颁给了人工智能。我认为这更多的是一种脱节行为。在生物制药行业,AI的运用已经非常广泛,比如早期的CADD(Aided Drug),即计算机辅助药物设计,早在上个世纪就已经开始了。我个人觉得,从行业或者学术的角度来看,工具的发展是渐进式的,从最初简单的统计方法或者基于第一性原理的化学计算方法,到后来AI技术的突破,使得AI能够与之前的所有知识相抗衡。整合以做出更准确的预测,从而加速药物设计过程。这一进展是在之前积累的所有数据的基础上一步一步取得的。因此,获得诺贝尔奖更多的是让不了解这个行业的普通人知道AI等计算工具越来越多地应用于基础科学研究和制药等行业。
吴秉建:由于人工智能涉及的领域很多,包括生命科学、材料科学等相关领域,我相信还有其他学科与其交叉后可以产生有趣的结果。你们能谈谈人工智能最快的实施方向是什么吗?实际实施时会遇到什么困难?
同导师读:在我工作的生物制药领域,最容易实现的领域肯定是蛋白质设计,包括抗体设计和其他药物设计。这些领域的实施可能会更快,因为蛋白质研究过去已经积累了大量高质量的结构化数据。例如,从结构预测到亲和力预测、蛋白质功能预测等,这些模型已经能够达到非常高的精度,对药物设计产生重大影响。
虽然目前还没有完全由人工智能设计的小分子或抗体药物进入临床,但我们已经在我们的研究管线中看到了人工智能作为辅助研发的情况。另一方面,实施的瓶颈可能是一些细分领域的数据质量仍然不够,导致预测精度不够。最大的问题是AI还无法在临床层面做出有效的预测。物理化学性质的预测在外部实验室环境中可能会取得不错的效果,但在体内环境中,尤其是从小鼠到人类的转化方面,存在巨大差距,目前还没有足够好的数据集来支持AI平台来开发模型来跨越这些差距。 。
吴秉健:那么现在填补这个空白的主要途径是什么呢?
通所都:主要是通过临床研究积累更多的数据来填补。
徐子尧:我们最近在生物制造方面投入很大,与很多企业进行了大规模的合作。生物制造领域实施起来可能会更快,因为它不涉及临床和监管方面。生物制造实际上是利用微生物或细胞来生产产品。这些产品可以是日常使用的维生素或糖替代品。它们已经开始取代传统化学工业或生产新产品。在生物制造中,使用人工智能来设计酶的开发时间可能很短,从中试到规模化生产只需几个月到一年。这使得数据迭代非常快,人工智能在多个行业迅速展现出优势,包括养殖、农业、饲料、维生素、保健品、医美行业。这些都是AI平台的优势。我们通过改造不同的酶,应用相似的算法,实现快速的行业应用。
王艳:最快的方向就是童院长提到的药物筛选和大分子预测。现在很多模型和公司在这些领域都取得了不错的成果,但是目前产业化进程并不是特别顺利,主要是因为还有很多实际问题没有解决,比如这些模型预测结构的生物学有效性不足,无法预测不同生物状态下的结构,无法预测分子动态信息,无法预测分子间相互作用和大型复合物,因为这些模型在训练的基础数据集中不存在这些信息。例如,训练集来自数据库,其中大部分是蛋白质晶体结构数据,因此这些模型可以预测大多数蛋白质的刚性结构框架,但无法预测柔性结构。
随着技术的进步和包含更多信息的更多数据的积累,希望当前模型的这些问题能够得到解决。我们公司的第二代冷冻电镜技术不需要结晶,甚至不需要蛋白质纯化和富集。可直接观察生物状态下的原位结构。它可以观察分子动态信息、分子间相互作用、大型复合物等,并产生结构数据,为模型中解决这些问题提供基础。过去,观察肿瘤标志物的结构需要经过蛋白纯化、再表达、富集、纯化和筛选等多个步骤。经过这些过程,肿瘤标志物的许多柔性结构发生了变化,你无法通过结构来判断不同生物体中发生了什么。大分子处于什么构型以及在这种状态下执行什么功能?然而,我们的技术可以直接观察生物体的原位构型。我们可以清楚地观察到大分子在这种生物状态下是什么构型以及它正在执行什么功能。功能。
而且传统技术在分离纯化过程中也筛选和忽略了很多信息,比如肿瘤微环境中是否存在一些复合物,比如药物与微环境中的一些复合物的结合。该信息已通过纯化和筛选而被忽略。直接原位观察生物结构的技术可以观察到以前遗漏的信息,为许多疾病的解释和治疗提供更多信息。随着足够数据的积累,基于这些数据的人工智能模型将能够预测更多的分子间相互作用、复杂相关的预测以及更灵活的结构。这或许会给整个行业的应用带来更多的可能性。即使科技发达,如果我们能够观察到药物进入人体的整个过程以及每个细胞中各个蛋白质的结合变化,那么药物与人体作用的整个过程就会被可视化,而且各种作用机制都会是透明的,那么未来我们可能不需要进行小动物和大动物的临床试验,这将改变药物研发的过程和产业结构。
李玉平:前面的讨论主要集中在生物技术领域。先说一下材料领域的情况。目前看来,材料领域最简单、最快的实现方式主要是配方优化和分子筛选。配方优化很好理解,即通过添加各种添加剂成分并调整生产工艺条件,可以获得性能更好的中间体或最终产品。这个过程会产生大量的数据,同时也是一个跨尺度的问题,跨越时间和空间维度的所有尺度。
在时间尺度上,化学反应的过渡态仅存在于皮秒级别,后续的物理和化学混合过程需要在更长的时间尺度上观察;在太空中,从原子水平的化学反应到分子、聚合物、最终的混合物,也在规模上发生了巨大的飞跃。这就带来了多尺度建模和连接流程生产的问题。
材料最终必须商业化并大规模生产。在这个过程中,涉及到很多仪器的配合和人的操作,这就带来了很多无法建模或难以建模的因素。这些影响可能会导致AI层面的一些失败和扭曲,而模拟是非常重要的一步。当然,我们也看到了很多技术的发展,比如工业互联网时代智能工厂的技术发展,为解决这个问题提供了很好的基础,就是通过增加传感器,可以捕捉到更多的数据,收集起来,就会更有意义。以系统化、结构化的方式组织这些数据来解决这个问题。
吴秉健:感谢各位嘉宾的精彩分享。我从各自的领域,以一种非常通俗的方式,尽量避免使用专业术语,向大家介绍了你们在AI领域的见解、机遇和挑战。我认为人工智能现在正在走向两个极端,这非常有趣。一方面,自从大模型开始逐步落地以来,出现了很多面向消费者的机会,即利用AI可能创造出覆盖广泛GDP的亿级产品。另一方面,AI是为一群非常高端的科学家服务的。这部分人虽然人数不多,但给他们带来的效率提升和突破,占GDP的比例非常高。让我们期待明年的诺贝尔奖,看看它的AI含量有多高。
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论