当前位置:首页 > 科技  > 数码

Ollama发布自研多模态AI引擎,本地推理性能实现大幅提升

来源: 责编: 时间:2025-05-18 15:58:57 180观看
导读近期,科技领域迎来了一项新的技术突破。据WinBuzzer于5月16日报道,开源大语言模型服务工具Ollama宣布成功研发出一款多模态AI定制引擎,这一创新成果标志着Ollama在技术上实现了对llama.cpp框架的直接依赖的摆脱。此前,lla

近期,科技领域迎来了一项新的技术突破。据WinBuzzer于5月16日报道,开源大语言模型服务工具Ollama宣布成功研发出一款多模态AI定制引擎,这一创新成果标志着Ollama在技术上实现了对llama.cpp框架的直接依赖的摆脱。ci428资讯网——每日最新资讯28at.com

此前,llama.cpp项目通过整合libmtmd库,为项目增添了全面的视觉支持功能。这一进展引发了社区对Ollama与llama.cpp之间关系的广泛讨论。针对这一话题,Ollama团队成员在Hacker News平台上进行了澄清,强调他们的引擎是基于golang独立开发的,并未直接借鉴llama.cpp的C++实现,并对社区的反馈表示了感谢。ci428资讯网——每日最新资讯28at.com

在官方声明中,Ollama指出,随着各大科技公司如meta的Llama 4、Google的Gemma 3、阿里巴巴的Qwen 2.5 VL以及Mistral Small 3.1等推出的AI模型复杂性日益增加,现有的技术架构已难以满足高效处理的需求。因此,Ollama决定推出这款全新的多模态AI定制引擎。ci428资讯网——每日最新资讯28at.com

ci428资讯网——每日最新资讯28at.com

这款新引擎在本地推理精度上实现了显著突破,特别是在处理大型图像并生成大量token时,表现尤为突出。Ollama通过引入图像处理附加元数据,优化了批量处理和位置数据管理,有效避免了图像分割错误导致的输出质量下降问题。他们还采用了KVCache优化技术,进一步加速了transformer模型的推理速度。ci428资讯网——每日最新资讯28at.com

在内存管理方面,新引擎也进行了大幅优化,并新增了图像缓存功能。这一功能确保了图像处理后的数据可以重复使用,避免了数据的提前丢弃,从而提高了资源利用效率。为了进一步提升性能,Ollama还与NVIDIA、AMD、Qualcomm、Intel和Microsoft等硬件巨头展开合作,通过精准检测硬件元数据,对内存估算进行了优化。ci428资讯网——每日最新资讯28at.com

针对像meta的Llama 4 Scout(一款拥有1090亿参数的混合专家模型MoE)这样的复杂模型,Ollama的新引擎还支持分块注意力(chunked attention)和2D旋转嵌入(2D rotary embedding)等先进技术。这些技术的引入,使得Ollama在处理复杂模型时能够展现出更高的效率和准确性。ci428资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-151084-0.htmlOllama发布自研多模态AI引擎,本地推理性能实现大幅提升

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 蚂蚁集团CTO何征宇:数据短缺成大模型发展最大瓶颈

下一篇: ChatGPT将支持MCP协议,企业可无缝对接第三方AI服务?

标签:
  • 热门焦点
  • 对标苹果的灵动岛 华为带来实况窗功能

    继苹果的灵动岛之后,华为也在今天正式推出了“实况窗”功能。据今天鸿蒙OS 4.0的现场演示显示,华为的实况窗可以更高效的展现出实时通知,比如锁屏上就能看到外卖、打车、银行
  • 5月iOS设备性能榜:M1 M2依旧是榜单前五

    和上个月一样,没有新品发布的iOS设备性能榜的上榜设备并没有什么更替,仅仅只有跑分变化而产生的排名变动,刚刚开始的苹果WWDC2023,推出的产品也依旧是新款Mac Pro、新款Mac Stu
  • 分布式系统中的CAP理论,面试必问,你理解了嘛?

    对于刚刚接触分布式系统的小伙伴们来说,一提起分布式系统,就感觉高大上,深不可测。而且看了很多书和视频还是一脸懵逼。这篇文章主要使用大白话的方式,带你理解一下分布式系统
  • 这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • Python异步IO编程的进程/线程通信实现

    这篇文章再讲3种方式,同时讲4中进程间通信的方式一、 Python 中线程间通信的实现方式共享变量共享变量是多个线程可以共同访问的变量。在Python中,可以使用threading模块中的L
  • Temu起诉SHEIN,跨境电商战事升级

    来源 | 伯虎财经(bohuFN)作者 | 陈平安日前据外媒报道,拼多多旗下跨境电商平台Temu正对竞争对手SHEIN提起新诉讼,诉状称Shein“利用市场支配力量强迫服装厂商与之签订独家
  • 得物宠物生意「狂飙」,发力“它经济”

    作者|花花小萌主近日,得物宣布正式上线宠物鉴别,通过得物App内的“在线鉴别”,可找到鉴别宠物的选项。通过上传自家宠物的部位细节,就能收获拥有专业资质认证的得物鉴
  • 苹果公司要求三星和LG Display生产「无边框」OLED iPhone显示屏

    据 The Elec 报道,苹果已要求其供应商为未来的 iPhone 型号开发「无边框」OLED 显示面板。苹果显然已要求三星和 LG Display 开发新的 OLED 显示面
  • 世界人工智能大会国际日开幕式活动在世博展览馆开启

    30日上午,世界人工智能大会国际日开幕式活动在世博展览馆开启,聚集国际城市代表、重量级院士专家、国际创新企业代表,共同打造人工智能交流平台。上海市副市
Top