当前位置:首页 > 科技  > 数码

Ollama发布自研多模态AI引擎,本地推理性能实现大幅提升

来源: 责编: 时间:2025-05-18 15:58:57 171观看
导读近期,科技领域迎来了一项新的技术突破。据WinBuzzer于5月16日报道,开源大语言模型服务工具Ollama宣布成功研发出一款多模态AI定制引擎,这一创新成果标志着Ollama在技术上实现了对llama.cpp框架的直接依赖的摆脱。此前,lla

近期,科技领域迎来了一项新的技术突破。据WinBuzzer于5月16日报道,开源大语言模型服务工具Ollama宣布成功研发出一款多模态AI定制引擎,这一创新成果标志着Ollama在技术上实现了对llama.cpp框架的直接依赖的摆脱。q7h28资讯网——每日最新资讯28at.com

此前,llama.cpp项目通过整合libmtmd库,为项目增添了全面的视觉支持功能。这一进展引发了社区对Ollama与llama.cpp之间关系的广泛讨论。针对这一话题,Ollama团队成员在Hacker News平台上进行了澄清,强调他们的引擎是基于golang独立开发的,并未直接借鉴llama.cpp的C++实现,并对社区的反馈表示了感谢。q7h28资讯网——每日最新资讯28at.com

在官方声明中,Ollama指出,随着各大科技公司如meta的Llama 4、Google的Gemma 3、阿里巴巴的Qwen 2.5 VL以及Mistral Small 3.1等推出的AI模型复杂性日益增加,现有的技术架构已难以满足高效处理的需求。因此,Ollama决定推出这款全新的多模态AI定制引擎。q7h28资讯网——每日最新资讯28at.com

q7h28资讯网——每日最新资讯28at.com

这款新引擎在本地推理精度上实现了显著突破,特别是在处理大型图像并生成大量token时,表现尤为突出。Ollama通过引入图像处理附加元数据,优化了批量处理和位置数据管理,有效避免了图像分割错误导致的输出质量下降问题。他们还采用了KVCache优化技术,进一步加速了transformer模型的推理速度。q7h28资讯网——每日最新资讯28at.com

在内存管理方面,新引擎也进行了大幅优化,并新增了图像缓存功能。这一功能确保了图像处理后的数据可以重复使用,避免了数据的提前丢弃,从而提高了资源利用效率。为了进一步提升性能,Ollama还与NVIDIA、AMD、Qualcomm、Intel和Microsoft等硬件巨头展开合作,通过精准检测硬件元数据,对内存估算进行了优化。q7h28资讯网——每日最新资讯28at.com

针对像meta的Llama 4 Scout(一款拥有1090亿参数的混合专家模型MoE)这样的复杂模型,Ollama的新引擎还支持分块注意力(chunked attention)和2D旋转嵌入(2D rotary embedding)等先进技术。这些技术的引入,使得Ollama在处理复杂模型时能够展现出更高的效率和准确性。q7h28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-151084-0.htmlOllama发布自研多模态AI引擎,本地推理性能实现大幅提升

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 蚂蚁集团CTO何征宇:数据短缺成大模型发展最大瓶颈

下一篇: ChatGPT将支持MCP协议,企业可无缝对接第三方AI服务?

标签:
  • 热门焦点
  • SpringBoot中使用Cache提升接口性能详解

    环境:springboot2.3.12.RELEASE + JSR107 + Ehcache + JPASpring 框架从 3.1 开始,对 Spring 应用程序提供了透明式添加缓存的支持。和事务支持一样,抽象缓存允许一致地使用各
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 三言两语说透柯里化和反柯里化

    JavaScript中的柯里化(Currying)和反柯里化(Uncurrying)是两种很有用的技术,可以帮助我们写出更加优雅、泛用的函数。本文将首先介绍柯里化和反柯里化的概念、实现原理和应用
  • 这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • JVM优化:实战OutOfMemoryError异常

    一、Java堆溢出堆内存中主要存放对象、数组等,只要不断地创建这些对象,并且保证 GC Roots 到对象之间有可达路径来避免垃 圾收集回收机制清除这些对象,当这些对象所占空间超过
  • 为什么你不应该使用Div作为可点击元素

    按钮是为任何网络应用程序提供交互性的最常见方式。但我们经常倾向于使用其他HTML元素,如 div span 等作为 clickable 元素。但通过这样做,我们错过了许多内置浏览器的功能。
  • iQOO Neo8系列新品发布会

    旗舰双芯 更强更Pro
  • OPPO K11搭载长寿版100W超级闪充:26分钟充满100%

    据此前官方宣布,OPPO将于7月25日也就是今天下午14:30举办新品发布会,届时全新的OPPO K11将正式与大家见面,将主打旗舰影像,和同档位竞品相比,其最大的卖
  • DRAM存储器10月价格下跌,NAND闪存本月价格与上月持平

    10月30日,据韩国媒体消息,自今年年初以来一直在上涨的 DRAM 存储器的交易价格仅在本月就下跌了近 10%,此次是全年首次降价,而NAND 闪存本月价格与上月持平。市
Top