当前位置:首页 > 科技  > 芯片

台湾新创APMIC与Twinkle AI合作推出繁体中文推理模型

来源:icspec 责编: 时间:2025-04-07 10:37:35 161观看
导读据媒体报道,中国台湾新创公司APMIC与语言模型研究社群Twinkle AI达成合作,共同推出了适用于手机端的3B参数繁体中文推理模型,同时还发布了24B和70B参数的更大模型。这些模型通过开源模型结合繁体中文语料,并利用微调和蒸
据媒体报道,中国台湾新创公司APMIC与语言模型研究社群Twinkle AI达成合作,共同推出了适用于手机端的3B参数繁体中文推理模型,同时还发布了24B和70B参数的更大模型。这些模型通过开源模型结合繁体中文语料,并利用微调和蒸馏技术开发而成。
APMIC成立于2017年,专注于模型微调和语言模型平台服务,是NVIDIA的独立软件供应商。Twinkle AI则是2024年成立的研究社群,主要研究繁体中文语言模型,并已开源评测架构Twinkle Eval。
此次合作的模型基于Meta或Mistral AI的基础模型,使用了约100B的繁体中文语料,涵盖新闻、学术论文、法律条文和社会讨论等多领域文本。团队还借助NVIDIA NeMo和Data Curator工具,以及DeepSeek R1 1776模型作为蒸馏技术的基底,完成了通用模型向推理模型的改造。整个开发过程动用了超过200片H100进行预训练与微调。
APMIC共同创始人兼CEO吴柏翰表示,3B参数的轻量化模型适合手机端应用,预计可在最新款iPhone上运行,主要取决于设备的存储容量。24B参数模型在计算资源与推理精度之间实现了平衡,适合企业和学术研究;而70B参数模型则进一步提升了推理和语言理解能力,适用于对性能要求更高的专业场景。
此外,双方还开源了评测架构Twinkle Eval,整合了包括台湾通识与专业能力混合题库(TMMLU+)、台湾法律语料测试集(tw-legal-benchmark-v1)和多任务基准测试集(MMLU)等数据集。团队指出,传统评测工具多采用逐题推论方式,但随着语言模型向“测试时运算拓展”发展,逐题推论限制了评测效率。Twinkle Eval通过平行验测和工具整合,提升了评测效能,方便企业用户进行自动化测试。
吴柏翰在近期的NVIDIA GTC大会中观察到,AI产业分工日益细化,专注于特定领域的深度发展比追求通用领域的广泛覆盖更具竞争力。他强调,对于希望进军国际市场的中国台湾企业,加强软硬件结合与专业合作是提升市场差异化的关键。

本文链接:http://www.28at.com/showinfo-27-141885-0.html台湾新创APMIC与Twinkle AI合作推出繁体中文推理模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 苹果计划推出AI健康助手,2026年或上线

下一篇: 英诺赛科赢得国际专利战,中国GaN产业迎利好

标签:
  • 热门焦点
  • 一加Ace2 Pro真机揭晓 钛空灰配色质感拉满

    终于,在经过了几波预热之后,一加Ace2 Pro的外观真机图在网上出现了。还是博主数码闲聊站曝光的,这次的外观设计还是延续了一加11的方案,只是细节上有了调整,例如新加入了钛空灰
  • 6月安卓手机好评榜:魅族20 Pro蝉联冠军

    性能榜和性价比榜之后,我们来看最后的安卓手机好评榜,数据来源安兔兔评测,收集时间2023年6月1日至6月30日,仅限国内市场。第一名:魅族20 Pro好评率:95%5月份的时候魅族20 Pro就是
  • Automa-通过连接块来自动化你的浏览器

    1、前言通过浏览器插件可实现自动化脚本的录制与编写,具有代表性的工具就是:Selenium IDE、Katalon Recorder,对于简单的业务来说可快速实现自动化的上手工作。Selenium IDEKat
  • 不容错过的MSBuild技巧,必备用法详解和实践指南

    一、MSBuild简介MSBuild是一种基于XML的构建引擎,用于在.NET Framework和.NET Core应用程序中自动化构建过程。它是Visual Studio的构建引擎,可在命令行或其他构建工具中使用
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 之家push系统迭代之路

    前言在这个信息爆炸的互联网时代,能够及时准确获取信息是当今社会要解决的关键问题之一。随着之家用户体量和内容规模的不断增大,传统的靠"主动拉"获取信息的方式已不能满足用
  • 电视息屏休眠仍有网络上传 爱奇艺被质疑“薅消费者羊毛”

    记者丨宁晓敏 见习生丨汗青出品丨鳌头财经(theSankei) 前不久,爱奇艺发布了一份亮眼的一季报,不仅营收和会员营收创造历史最佳表现,其运营利润也连续6个月实现增长。自去年年初
  • OPPO、vivo、小米等国内厂商Q2在印度智能手机市场份额依旧高达55%

    7月20日消息,据外媒报道,研究机构的报告显示,在全球智能手机出货量同比仍在下滑的大背景下,印度这一有潜力的市场也未能幸免,出货量同比也有下滑,多家厂
  • 英特尔Xe-HP项目终止,将专注Xe-HPC/HPG系列显卡

    据10 月 31 日消息报道,英特尔高级副总裁兼加速计算系统和图形事业部总经理 表示,Xe-HP“ Arctic Sound” 系列服务器 GPU 已经应用于 oneAPI devcloud 云服
Top