澳科大人工智能交叉应用研究院「AI数据科学家」实现海量数据自主分析生物医学的「龙虾」来了


澳科大人工智能交叉应用研究院「AI数据科学家」实现海量数据自主分析生物医学的「龙虾」来了

近日,澳门科技大学人工智能交叉应用研究院院长张康教授团队联合中国科学院计算技术研究所赵屹教授团队,并与多家科研及临床机构合作,在国际权威期刊Nature Biomedical Engineering发表研究论文,题为“A multi-agent LLM framework with self-evolving capabilities for autonomous, tool-aware biomedical data analyses”。

该研究提出并系统验证了一种全新的生物医学人工智能框架——BioMedAgent。该框架面向生物医学研究中分析流程复杂、专业门坎较高、自动化程度不足等问题,探索构建能够自主规划、调用工具并完成多步骤分析任务的「AI数据科学家」,为生物医学数据分析提供了新的智能化解决方案。

作为澳科大人工智能交叉应用研究院推进“AI+X”交叉融合布局的代表性成果之一,该研究体现了人工智能与医学健康、生命科学、数据科学等方向的深度结合,也展现了研究院围绕真实复杂问题推动人工智能走向场景应用的探索路径。

随着人工智能技术快速发展,其在医学影像分析、电子健康记录解析、多组学研究等领域已展现出重要应用潜力。然而,在真实复杂的科研场景中,面对多步骤推理、工具调用、跨模态数据整合等任务,如何使人工智能像具备经验的研究人员一样完成从任务理解、分析规划到执行总结的完整流程,仍然面临诸多挑战。

针对上述问题,研究团队开发了基于多智能体大语言模型的生物医学数据分析框架 BioMedAgent。该系统通过构建多个协同工作的功能模块,实现任务规划、代码生成、工具调用、结果执行与回馈优化等环节的衔接,形成「思考—规划—执行—反思」的完整分析闭环。与传统模型相比,BioMedAgent能够根据自然语言指令自动拆解复杂任务,并调用生物讯息学工具及数据库接口,组织形成较为完整的数据分析工作流,从而提升复杂科研任务的自动化处理能力。

此外,研究还引入了互动式探索(Interactive Exploration, IE)与记忆检索(Memory Retrieval, MR)机制,为系统在任务执行过程中的经验积累与策略优化提供了支援。赵屹教授表示,BioMedAgent并不局限于零散的指令执行或辅助程式设计,而是形成了涵盖「思考—规划—执行—反思」的完整分析链路。其特点之一在于系统可在任务执行与纠错过程中结合交互式探索和记忆检索机制积累经验,持续优化分析策略与代码调用方式,从而逐步提升对复杂生物医学问题的处理能力。

结果显示,BioMedAgent在该基准检验中取得了良好表现:总体任务成功率达到77%,其中组学分析任务成功率达94%,机器学习任务成功率达90%。与现有主流大语言模型智能体方法相比,BioMedAgent在多个任务类别中均表现出明显优势,并在外部独立基准检验中展现出较好的泛化能力。

除基准测试外,研究团队还在多个真实科研任务中验证了 BioMedAgent 的应用潜力。在跨组学研究场景中,系统可依据自然语言指令自动完成 RNA-seq 与单细胞 RNA 测序数据的联合分析,识别差异基因并解析其细胞来源,所得结果与已有研究结论保持一致。在机器学习建模任务中,BioMedAgent可在无需人工程式设计干预的情况下完成从模型构建、训练到评估的完整流程,并成功复现已有研究中的关键结论。在病理图像分析任务中,系统通过自动集成分辨率增强与细胞分割演算法,进一步提升了多类细胞分割精度,显示出较强的实际应用价值。

研究团队负责人表示,BioMedAgent并非旨在替代科研人员,而是作为面向科研和临床场景的智能辅助系统,说明研究者在面对复杂数据和多步骤分析任务时提升效率、降低技术门坎。该成果展示了人工智能从单一工具辅助向更高水平自主协同分析迈进的潜力,也为多工具整合、多步骤推理和复杂科研流程自动化提供了新的技术路径。

张康院长表示,澳科大人工智能交叉应用研究院将继续推动人工智能与医学健康、生命科学、工程技术及数据科学等领域的深度融合,围绕真实世界中的复杂问题开展联合攻关,探索更高水平的人机协同科研「自动驾驶」新模式,为生命科学研究、新药发现和临床转化提供有力支撑。

文章链结:https://www.nature.com/articles/s41551-026-01634-6