当前位置:首页 > 元宇宙 > AI

清华系团队 DeepSeek 版多模态生物医药大模型 BioMedGPT-R1 发布,后续计划开源

来源: 责编: 时间:2025-02-23 08:05:21 164观看
导读 2 月 21 日消息,清华大学人工智能产业研究院(AIR)和北京水木分子生物科技有限公司(简称:水木分子)昨日宣布推出升级版的生物医药多模态开源基础大模型 BioMedGPT-R1。此前,在 2023 年,双方合作发布了开源可商用、生物

2 月 21 日消息,清华大学人工智能产业研究院(AIR)和北京水木分子生物科技有限公司(简称:水木分子)昨日宣布推出升级版的生物医药多模态开源基础大模型 BioMedGPT-R1。mQc28资讯网——每日最新资讯28at.com

此前,在 2023 年,双方合作发布了开源可商用、生物医药多模态百亿参数开源基础大模型 BioMedGPT,水木分子发布了自研千亿参数多模态生物医药专业大模型 ChatDDFM 和新一代 AI 驱动药物发现工具 ChatDD。这次 DeepSeek 版 ChatDD-R1 基座模型也已同步上线 ChatDD,用于生物医药企业的药物研发。mQc28资讯网——每日最新资讯28at.com

BioMedGPT 是清华大学智能产业研究院(AIR)携手水木分子开源的全球首个可商用多模态生物医药百亿参数大模型,该模型在生物医药专业领域问答能力号称“比肩人类专家水平”,发布时在自然语言、分子、蛋白质跨模态问答任务上达到 SOTA。mQc28资讯网——每日最新资讯28at.com

在 BioMedGPT 的基础上,清华大学 AIR 与水木分子推出了 BioMedGPT-R1,用 DeepSeek R1 蒸馏版本模型更新了 BioMedGPT 中现采用的文本基座模型,从而引入了更优的文本推理能力。mQc28资讯网——每日最新资讯28at.com

通过跨模态特征对齐,BioMedGPT-R1 实现了生物模态与自然语言文本模态在同一个特征空间的统一融合,探索了生物多模态场景下的模型深度推理能力。mQc28资讯网——每日最新资讯28at.com

通过训练对齐翻译层(Translator),BioMedGPT-R1 将生物模态编码器(Molecule Encoder 与 Protein Encoder)输出映射到自然语言表征空间,从而在 DeepSeek R1 基础上增加了生物模态数据的理解能力。mQc28资讯网——每日最新资讯28at.com

mQc28资讯网——每日最新资讯28at.com

mQc28资讯网——每日最新资讯28at.com

BioMedGPT-R1 模型框架和主要训练步骤

BioMedGPT-R1 的训练分为两个主要步骤:mQc28资讯网——每日最新资讯28at.com

首先,仅训练对齐翻译层 Translator,使其能将编码后的生物模态表征映射到语义表征空间;mQc28资讯网——每日最新资讯28at.com

然后,同时微调对齐翻译层 Translator 和基座大语言模型,激发其在下游任务上的多模态深度推理能力。mQc28资讯网——每日最新资讯28at.com

清华大学 AIR 和水木分子研究团队表示,将长期持续维护 OpenBioMed 开源平台,团队现阶段探索方向是如何在强推理语言模型的基础上更好地适应性地实现跨模态对齐,团队正在以 BioMedGPT-R1 为基础进行系统性研究与综合评估,目前已经观察到其在化学分子理解任务上的性能提升,如在 CheBI-20化学分子描述任务上相比上一版本效果提升超 15%,后续也将依托 OpenBioMed 平台开源 BioMedGPT-R1 模型和生物医药研发 Agent 系统框架。mQc28资讯网——每日最新资讯28at.com

mQc28资讯网——每日最新资讯28at.com

附开源地址如下,当前新版本还未开源:mQc28资讯网——每日最新资讯28at.com

https://github.com/PharMolix/OpenBioMedmQc28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11002-0.html清华系团队 DeepSeek 版多模态生物医药大模型 BioMedGPT-R1 发布,后续计划开源

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: DeepSeek引爆AI热潮:技术信仰重塑,AGI元年将至?

下一篇: DeepSeek 还在发力:官宣下周陆续开源 5 个代码库,毫无保留、推翻象牙塔

标签:
  • 热门焦点
  • 欧盟人工智能法案:四种AI系统风险类型的划分及监管措施

    作者:赵志东 蔡佳雯来源:区块链日报该法案采用风险分级的规制路径,将人工智能系统的风险划分成不可接受的风险、高风险、有限风险和轻微风险四种类型,并针对不同类型施加了不同
  • 这场虚拟人争夺战,互联网巨头下场先赢一半?

    撰文/ 孟会缘 近两年间,要论引得无数互联网巨头竞折腰的一大热门产业,莫过于元宇宙领域中的数字人了。 作为继数字藏品之后,开发元宇宙的又一重点落地项目,互联网
  • 25万虚拟er在“元宇宙”追星

    “默叽默叽,我是默默酱,我是在真元宇宙也有头有脸的人。”12月11日晚20:00,虚拟偶像@默默酱的首场个人元宇宙演唱会《以梦为马,抵达繁星》在大有空间APP
  • 现在的元宇宙:一款低配版的科幻游戏

    在2021年的岁末之际,不禁感叹元宇宙元年之热闹,从元宇宙NFT头像,到元宇宙数字地产,再到元宇宙旅游景区等等,仿佛科幻感十足的元宇宙眨眼间就从人们的概念认知中完全
  • 元宇宙风口下,视觉中国如何重估?

    要说横跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一个。不仅互联网巨头们纷纷布局,上市公司们趋之若鹜,还被不少地方政府写入了产业规划,大有在2022年
  • 城市数字孪生标准化白皮书(2022版)

    当前,城市数字孪生已经发展成为支撑智慧城市的重要技术手段。城市数字孪生通过在数字空间对城市物理空间和社会空间进行全要素表达、全过程呈现、全周期可溯,实
  • 暴涨100倍的NFT worlds 会是未来元宇宙的雏形吗?

    NFT Worlds 系列产品于 2021 年 10 月 5 日免费铸造,该NFT系列是将传统的中心化电子游戏minecraft 与去中心化资产相结合。传统游戏Minecraft 对用户定制非常开
  • 元宇宙收割了谁

    作者:晓宇资本将元宇宙看作下一代互联网的门票,画大饼、割韭菜就成了一大选项。2021年被称为元宇宙元年。在这一年里,先是号称元宇宙第一股的沙盒游戏Roblox盛装
  • 2022年元宇宙系列报告:UGC当道,XR带来新交互体验

    UGC作为元宇宙的主要内容创作模式,已经越来越多的呈现于游戏、娱乐、社交、传媒等方面,UGC模式勾勒了元宇宙的边界,现今元宇宙UGC模式的主要呈现方式以元宇宙概念
Top