当前位置:首页 > 科技  > 手机

苹果论文展示Ferret-UI大语言模型:可深度理解屏幕信息内容

来源: 责编: 时间:2024-04-11 08:58:24 344观看
导读 近日,苹果发布研究论文,展示了名叫“Ferret-UI”的多模态大语言模型。根据论文介绍,Ferret-UI模型针对目前MLLMs模型(多模态大语言模型)无法有效理解移动应用程序在屏幕上显示的内容这一问题,做出了针对性的调整。为了训练

近日,苹果发布研究论文,展示了名叫“Ferret-UI”的多模态大语言模型。Nlf28资讯网——每日最新资讯28at.com

Nlf28资讯网——每日最新资讯28at.com

根据论文介绍,Ferret-UI模型针对目前MLLMs模型(多模态大语言模型)无法有效理解移动应用程序在屏幕上显示的内容这一问题,做出了针对性的调整。Nlf28资讯网——每日最新资讯28at.com

为了训练Ferret-UI,苹果收集了大量初级用户界面任务的训练样本,如图标识别、查找文本和小部件列表。Nlf28资讯网——每日最新资讯28at.com

这些样本的格式都是按照带有区域注释的指令来设计的,以便于精确引用和接地。Nlf28资讯网——每日最新资讯28at.com

同时,为了增强模型的推理能力,苹果进一步编制了高级任务数据集,包括详细描述、感知/交互对话和功能推理。Nlf28资讯网——每日最新资讯28at.com

这使得Ferret-UI相较目前的GPT-4V等MLLMs模型,在理解应用程序在屏幕上显示的内容时,有着显著的优势。Nlf28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-82548-0.html苹果论文展示Ferret-UI大语言模型:可深度理解屏幕信息内容

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 用户反馈佩戴Vision Pro后出现健康问题:头痛、颈部酸痛等

下一篇: 2024中国边缘计算20强重磅发布!华为第一

标签:
  • 热门焦点
  • K60至尊版刚预热 一加Ace2 Pro正面硬刚

    Redmi这边刚如火如荼的宣传了K60 Ultra的各种技术和硬件配置,作为竞品的一加也坐不住了。一加中国区总裁李杰发布了两条微博,表示在自家的一加Ace2上早就已经采用了和PixelWo
  • 一年经验在二线城市面试后端的经验分享

    忠告这篇文章只适合2年内工作经验、甚至没有工作经验的朋友阅读。如果你是2年以上工作经验,请果断划走,对你没啥帮助~主人公这篇文章内容来自 「升职加薪」星球星友 的投稿,坐
  • 使用LLM插件从命令行访问Llama 2

    最近的一个大新闻是Meta AI推出了新的开源授权的大型语言模型Llama 2。这是一项非常重要的进展:Llama 2可免费用于研究和商业用途。(几小时前,swyy发现它已从LLaMA 2更名为Lla
  • 新电商三兄弟,“抖快红”成团!

    来源:价值研究所作 者:Hernanderz 随着内容电商的概念兴起,抖音、快手、小红书组成的“新电商三兄弟”成为业内一股不可忽视的势力,给阿里、京东、拼多多带去了巨大压
  • 年轻人的“职场羞耻感”,无处不在

    作者:冯晓亭 陶 淘 李 欣 张 琳 马舒叶来源:燃次元“人在职场,应该选择什么样的着装?”近日,在网络上,一个与着装相关的帖子引发关注,在该帖子里,一位在高级写字楼亚洲金
  • 华为Mate 60系列用上可变灵动岛:正式版体验将会更出色

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
  • 2纳米决战2025

    集微网报道 从三强争霸到四雄逐鹿,2nm的厮杀声已然隐约传来。无论是老牌劲旅台积电、三星,还是誓言重回先进制程领先地位的英特尔,甚至初成立不久的新
  • iQOO 11S评测:行业唯一的200W标准版旗舰

    【Techweb评测】去年底,iQOO推出了“电竞旗舰”iQOO 11系列,作为一款性能强机,该机不仅全球首发2K 144Hz E6全感屏,搭载了第二代骁龙8平台及144Hz电竞
  • OPPO K11评测:旗舰级IMX890加持 2000元档最强影像手机

    【Techweb评测】中端机型用户群体巨大,占了中国目前手机市场的大头,一直以来都是各手机品牌的“必争之地”,其中OPPO K系列机型一直以来都以高品质、
Top