当前位置:首页 > 元宇宙 > AI

清华系团队 DeepSeek 版多模态生物医药大模型 BioMedGPT-R1 发布,后续计划开源

来源: 责编: 时间:2025-02-23 08:05:21 198观看
导读 2 月 21 日消息,清华大学人工智能产业研究院(AIR)和北京水木分子生物科技有限公司(简称:水木分子)昨日宣布推出升级版的生物医药多模态开源基础大模型 BioMedGPT-R1。此前,在 2023 年,双方合作发布了开源可商用、生物

2 月 21 日消息,清华大学人工智能产业研究院(AIR)和北京水木分子生物科技有限公司(简称:水木分子)昨日宣布推出升级版的生物医药多模态开源基础大模型 BioMedGPT-R1。mWB28资讯网——每日最新资讯28at.com

此前,在 2023 年,双方合作发布了开源可商用、生物医药多模态百亿参数开源基础大模型 BioMedGPT,水木分子发布了自研千亿参数多模态生物医药专业大模型 ChatDDFM 和新一代 AI 驱动药物发现工具 ChatDD。这次 DeepSeek 版 ChatDD-R1 基座模型也已同步上线 ChatDD,用于生物医药企业的药物研发。mWB28资讯网——每日最新资讯28at.com

BioMedGPT 是清华大学智能产业研究院(AIR)携手水木分子开源的全球首个可商用多模态生物医药百亿参数大模型,该模型在生物医药专业领域问答能力号称“比肩人类专家水平”,发布时在自然语言、分子、蛋白质跨模态问答任务上达到 SOTA。mWB28资讯网——每日最新资讯28at.com

在 BioMedGPT 的基础上,清华大学 AIR 与水木分子推出了 BioMedGPT-R1,用 DeepSeek R1 蒸馏版本模型更新了 BioMedGPT 中现采用的文本基座模型,从而引入了更优的文本推理能力。mWB28资讯网——每日最新资讯28at.com

通过跨模态特征对齐,BioMedGPT-R1 实现了生物模态与自然语言文本模态在同一个特征空间的统一融合,探索了生物多模态场景下的模型深度推理能力。mWB28资讯网——每日最新资讯28at.com

通过训练对齐翻译层(Translator),BioMedGPT-R1 将生物模态编码器(Molecule Encoder 与 Protein Encoder)输出映射到自然语言表征空间,从而在 DeepSeek R1 基础上增加了生物模态数据的理解能力。mWB28资讯网——每日最新资讯28at.com

mWB28资讯网——每日最新资讯28at.com

mWB28资讯网——每日最新资讯28at.com

BioMedGPT-R1 模型框架和主要训练步骤

BioMedGPT-R1 的训练分为两个主要步骤:mWB28资讯网——每日最新资讯28at.com

首先,仅训练对齐翻译层 Translator,使其能将编码后的生物模态表征映射到语义表征空间;mWB28资讯网——每日最新资讯28at.com

然后,同时微调对齐翻译层 Translator 和基座大语言模型,激发其在下游任务上的多模态深度推理能力。mWB28资讯网——每日最新资讯28at.com

清华大学 AIR 和水木分子研究团队表示,将长期持续维护 OpenBioMed 开源平台,团队现阶段探索方向是如何在强推理语言模型的基础上更好地适应性地实现跨模态对齐,团队正在以 BioMedGPT-R1 为基础进行系统性研究与综合评估,目前已经观察到其在化学分子理解任务上的性能提升,如在 CheBI-20化学分子描述任务上相比上一版本效果提升超 15%,后续也将依托 OpenBioMed 平台开源 BioMedGPT-R1 模型和生物医药研发 Agent 系统框架。mWB28资讯网——每日最新资讯28at.com

mWB28资讯网——每日最新资讯28at.com

附开源地址如下,当前新版本还未开源:mWB28资讯网——每日最新资讯28at.com

https://github.com/PharMolix/OpenBioMedmWB28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11002-0.html清华系团队 DeepSeek 版多模态生物医药大模型 BioMedGPT-R1 发布,后续计划开源

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: DeepSeek引爆AI热潮:技术信仰重塑,AGI元年将至?

下一篇: DeepSeek 还在发力:官宣下周陆续开源 5 个代码库,毫无保留、推翻象牙塔

标签:
  • 热门焦点
  • 这一超级富豪“逆袭”,身价大增4330亿

    来源:侃见财经互联网的突围没有“终点”。在快节奏的商业环境下,不断的试错成了互联网企业的标配,一年一个风口,一个风口造就一个热点,但是回头来看,最终受益的还是身处
  • 从科幻走进现实,元宇宙概念逐渐清晰

    2021年,元宇宙概念如同一颗炸弹投进互联网行业,掀起了一场数字海啸,众多企业纷纷入局,在此新领域展开新探索。那么,加速狂奔的元宇宙究竟是什么?概念翻红,元宇宙走进资本圈2021年3
  • 【量子位】虚拟数字人深度产业报告 | 元宇宙Meta洞见

    虚拟数字人行业未来的主要驱动力包括:用户代际变化,新一代消费者对内容消费和虚拟世界更为渴求;虚拟数字人相关技术门槛相对降低,成本有所回落;资本热度上升,受Metav
  • 字节、腾讯、网易鏖战元宇宙背后,大厂究竟在争夺什么?

    正当互联网商业踌躇不前,互联网大厂为了在存量中的增长挤破头皮之时,元宇宙的概念被资本点燃。先是Facebook更名Meta正式进军元宇宙,然后字节跳动收购了一家VR硬
  • 字节觅《原神》,腾讯元宇宙,游戏新王战旧神?

    文 | 陈桥辉陈奕迅的《红玫瑰》中有一句歌词,“得不到的永远在骚动”,这句话用到如今国内头部游戏平台再合适不过。随着《原神》的异军突起,使得头部游戏大厂感受
  • 权限风波过后 X2Y2如何挑战OpenSea?

    继LooksRare之后,又一个OpenSea挑战者X2Y2来了。上周,X2Y2宣布向超过86万个OpenSea交易用户发放X2Y2通证空投,并启动了「挂单挖矿」的奖励机制。这场早期激励活动
  • Terra链上TVL跃升至第二

    据DefiLlama数据显示,当前,Terra链上应用锁仓的加密资产价值(TVL)为172.1亿美元,在公链板块中已跃升至第二,超越了币安智能链TVL的118亿美元,TVL排名居首的仍为以太
  • 传统互联网与区块链场景下数据权利法律分析

    数据权益的复杂性在于数据涉及多环节多主体、内容不同质且与不同场景紧密联系、对软硬件技术环节紧密相关等方面的复杂性。在传统互联网与区块链模式下,数据处
  • 韩国流行音乐巨头SM与Binance达成NFT合作伙伴关系

    韩国流行音乐巨头 SM Entertainment 与加密货币交易所 Binance(币安)达成“Play2Create”NFT 合作伙伴关系。SM 娱乐一直在投资打造元宇宙该公司于 2020 年 10
Top