当前位置:首页 > 元宇宙 > AI

微软 Phi-4 多模态及迷你模型上线,语音视觉文本全能

来源: 责编: 时间:2025-03-01 07:56:50 175观看
导读 2 月 27 日消息,微软于 2024 年 12 月发布了 Phi-4,这是一款在同类产品中表现卓越的小型语言模型(SLM)。今日,微软进一步扩展 Phi-4 家族,推出了两款全新模型:Phi-4 多模态(Phi-4-multimodal)和 Phi-4 迷你(Phi-4-mini)

2 月 27 日消息,微软于 2024 年 12 月发布了 Phi-4,这是一款在同类产品中表现卓越的小型语言模型(SLM)。今日,微软进一步扩展 Phi-4 家族,推出了两款全新模型:Phi-4 多模态(Phi-4-multimodal)和 Phi-4 迷你(Phi-4-mini)。q5928资讯网——每日最新资讯28at.com

q5928资讯网——每日最新资讯28at.com

Phi-4 多模态模型是微软首款集成语音、视觉和文本处理的统一架构多模态语言模型,参数量达 56 亿。在多项基准测试中,Phi-4 多模态的表现优于其他现有的先进全模态模型,例如谷歌的 Gemini 2.0 Flash 和 Gemini 2.0 Flash Lite。q5928资讯网——每日最新资讯28at.com

q5928资讯网——每日最新资讯28at.com

在语音相关任务中,Phi-4 多模态在自动语音识别(ASR)和语音翻译(ST)方面超越了 WhisperV3 和 SeamlessM4T-v2-Large 等专业语音模型。微软表示,该模型在 Hugging Face OpenASR 排行榜上以 6.14% 的词错误率位居榜首。q5928资讯网——每日最新资讯28at.com

q5928资讯网——每日最新资讯28at.com

在视觉相关任务中,Phi-4 多模态在数学和科学推理方面表现出色。在文档理解、图表理解、光学字符识别(OCR)和视觉科学推理等常见多模态能力方面,该模型与 Gemini-2-Flash-lite-preview 和 Claude-3.5-Sonnet 等流行模型相媲美甚至超越。q5928资讯网——每日最新资讯28at.com

注意到,Phi-4 迷你模型则专注于文本任务,参数量为 38 亿。其在文本推理、数学计算、编程、指令遵循和函数调用等任务中表现优异,超越了多款流行的大型语言模型。q5928资讯网——每日最新资讯28at.com

为确保新模型的安全性和可靠性,微软邀请了内部和外部安全专家进行测试,并采用了微软人工智能红队(AIRT)制定的策略。经过进一步优化后,Phi-4 迷你和 Phi-4 多模态模型均可通过 ONNX Runtime 部署到设备端,实现跨平台使用,适用于低成本和低延迟场景。q5928资讯网——每日最新资讯28at.com

目前,Phi-4 多模态和 Phi-4 迷你模型已在 Azure AI Foundry、Hugging Face 和 NVIDIA API 目录中上线,供开发者使用。q5928资讯网——每日最新资讯28at.com

Phi-4 系列新模型的推出,标志着高效 AI 技术的重大进步,为各类人工智能应用带来了强大的多模态和文本处理能力。q5928资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-11226-0.html微软 Phi-4 多模态及迷你模型上线,语音视觉文本全能

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌重组人力与云部门,裁员进行时,成本削减成重点

下一篇: 职业棋手比赛私藏手机用 AI 作弊被抓现行,被中国围棋协会撤销段位、禁赛 8 年

标签:
  • 热门焦点
  • AI大模型“战火”烧到了教育领域

    作者:刘旷自2023年开年以来,AI大模型这股风是越吹越猛烈了。随着ChatGPT的出圈爆火,再度掀起了一波AI热浪,无论是在国内还是国外都有不少企业宣布入局或者跟进AI大模型领域。与
  • AIGC产品测评TOP25丨谁能抢到下个十年的“船票”?

    Tech星球(微信ID:tech618) 文 | 何煦阳策划 | 杨晓鹤封面来源 | 图虫创意 2016年,李彦宏站在百度联盟峰会的讲台上,向所有人宣布:互联网的下一幕是人工智能。同年,Google 旗下 Dee
  • 数字人的新革命,BAT的“冲高”战场

    来源:刘旷ChatGPT横空出世,让人们看到了数字人的另一种可能,将ChatGPT与虚拟数字人融合,研发出更加智能化、拟人化的虚拟数字人成为数字人厂商的新命题、新方向。2月份,岭南股份
  • 2022开年最热投资赛道竟是虚拟人,背后隐藏了什么商业价值?

    在刚刚结束不久的2021年江苏卫视跨年演唱会上,虚拟邓丽君与歌手周深同台联唱,实现了跨时代合作,而这还不只是“邓丽君”,哔哩哔哩、东方卫视等多家跨年晚会都出现
  • 百度元宇宙希壤是什么?(附下载)

    百度元宇宙希壤是什么,最近很多人关注。还有很多人问希壤怎么下载、百度希壤怎么进入?今天小编带你来全面了解一下。“希壤”是百度于2021年12月27日于百度AI开
  • 量子计算在未来能否提高区块链技术的效率

    区块链技术的主要成功之处在于对不透明的金融流程进行了去中心化的访问量子计算机的内在目标是解决传统计算机不可能解决的问题随着区块链技术的使用案例逐渐
  • Meta 呼吁行业合作建立元宇宙网络基础设施

    Facebook 的母公司 Meta呼吁,建立必要的全球合作的基础设施,以支持其蓬勃发展的元宇宙野心。“元宇宙”成为 2021 年的主要流行语之一,这在很大程度上是由 Facebo
  • 虚拟人的3大纪律和6种品牌孵化模式

    作者:陈格雷(老小格)及团队虚拟人很热,我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点,整理出6种最主要的品牌虚拟人模式,后面一一介绍。
  • 爆发在即的Layer2赛道百花齐放,谁将是领跑者?

    还记得几年前最早我们提起ETH扩容,首先想到就是Layer2,而Layer2里,首先想到的是闪电网络,状态通道,Plasma…然后折腾了几年,发现并没有什么用,许多项目方和资本也等不
Top