当前位置:首页 > 科技  > 软件

如何在Ollama创建自定义模型?构建本地大模型

来源: 责编: 时间:2024-05-09 09:26:26 336观看
导读从ChatGPT发布后的一段时间,我们见证了大型语言模型(LLM)爆炸式增长,在来自四面八方的消息中,我们了解了大模型似乎在不断渗透到各行各业,改变着生产模式。但,在实际行业应用上还是很难跟上所有技术上已经取得的发展,数据安全

从ChatGPT发布后的一段时间,我们见证了大型语言模型(LLM)爆炸式增长,在来自四面八方的消息中,我们了解了大模型似乎在不断渗透到各行各业,改变着生产模式。但,在实际行业应用上还是很难跟上所有技术上已经取得的发展,数据安全以及大量的硬件资源需求等方面成了大模型应用落地过程中经常需要讨论的重要内容,本地运行开源LLM也成为了热门方案。cER28资讯网——每日最新资讯28at.com

大模型参数的大小从一个层面反映了模型的能力,但是,实际应用真的必须用到那么大参数的大模型吗?cER28资讯网——每日最新资讯28at.com

cER28资讯网——每日最新资讯28at.com

比较实在的思路是:用较少的资源,在本地搭建较小的模型,为某些场景提供大模型的某些方面的能力。这种方式可以根据需要选择适合场景的模型,同时也能够确保数据限制在自己的网络空间。cER28资讯网——每日最新资讯28at.com

搭建本地大模型的关键内容:cER28资讯网——每日最新资讯28at.com

(1)哪里下载开源大模型?cER28资讯网——每日最新资讯28at.com

Huggine Face可以说是大模型的集中营。可以下载到各种开源模型库。cER28资讯网——每日最新资讯28at.com

(2)如何部署大模型?cER28资讯网——每日最新资讯28at.com

部署大模型的方式很多,其中一个比较简单的方式是使用一些框架工具,例如:LangChain、Ollama。其中Ollama是一个开源的大模型服务工具,使用起来非常简单,旨在为用户提供本地化的运行环境,满足个性化的需求。cER28资讯网——每日最新资讯28at.com

其实,Ollama已经提供了许多流行的大模型可以选择。cER28资讯网——每日最新资讯28at.com

cER28资讯网——每日最新资讯28at.com

而,Huggine Face目前拥有超过25万的大模型,最新、最全的开源大模型应该都在里面,选择性更多。cER28资讯网——每日最新资讯28at.com

下面主要介绍如何利用Ollama从Huggine Face安装自定义模型。cER28资讯网——每日最新资讯28at.com

以模型Llama3-8B-Chinese-Chat为例,步骤如下:cER28资讯网——每日最新资讯28at.com

(1)下载安装Ollama,并确保您已安装Ollama并正在运行。cER28资讯网——每日最新资讯28at.com

ollama的下载地址:cER28资讯网——每日最新资讯28at.com

https://ollama.com/br

(2)去Huggingface网站下载模型的GGUF。cER28资讯网——每日最新资讯28at.com

https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bitbr

(3)创建一个模型描述文件,并输入必要的东西。cER28资讯网——每日最新资讯28at.com

创建一个名为 Modelfile 的文件,并使用 FROM 指令,填写的模型的本地文件路径。Modelfile文件中还可以添加系统提示词以及各项参数:cER28资讯网——每日最新资讯28at.com

# ModelfileFROM "./Llama3-8B-Chinese-Chat-q8_0-v2_1.gguf"# set the temperature to 1 [higher is more creative, lower is more coherent]PARAMETER temperature 1#许多聊天模式需要提示模板才能正确回答。默认提示模板可以使用TEMPLATE中的Modelfile指令指定TEMPLATE "[INST] {{ .Prompt }} [/INST]"br

(4)从这个模型文件中创建一个模型,并在终端中本地运行它。cER28资讯网——每日最新资讯28at.com

创建大模型:cER28资讯网——每日最新资讯28at.com

ollama create llama3_chinese example -f Modelfilebr

运行大模型:cER28资讯网——每日最新资讯28at.com

ollama run llama3_chinesebr

cER28资讯网——每日最新资讯28at.com

具体的过程也可以参考Ollama的文档:cER28资讯网——每日最新资讯28at.com

  • https://github.com/ollama/ollama/blob/main/README.md
  • https://github.com/ollama/ollama/blob/main/docs/import.md

本文链接:http://www.28at.com/showinfo-26-87493-0.html如何在Ollama创建自定义模型?构建本地大模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 纯 CSS 实现标签自动显示超出数量

下一篇: Python并发与并行:multiprocessing模块大揭秘

标签:
  • 热门焦点
  • 谷歌KDD'23工作:如何提升推荐系统Ranking模型训练稳定性

    谷歌在KDD 2023发表了一篇工作,探索了推荐系统ranking模型的训练稳定性问题,分析了造成训练稳定性存在问题的潜在原因,以及现有的一些提升模型稳定性方法的不足,并提出了一种新
  • 这款新兴工具平台,让你的电脑效率翻倍

    随着信息技术的发展,我们获取信息的渠道越来越多,但是处理信息的效率却成为一个瓶颈。于是各种工具应运而生,都在争相解决我们的工作效率问题。今天我要给大家介绍一款效率
  • 每天一道面试题-CPU伪共享

    前言:了不起:又到了每天一到面试题的时候了!学弟,最近学习的怎么样啊 了不起学弟:最近学习的还不错,每天都在学习,每天都在进步! 了不起:那你最近学习的什么呢? 了不起学弟:最近在学习C
  • 电视息屏休眠仍有网络上传 爱奇艺被质疑“薅消费者羊毛”

    记者丨宁晓敏 见习生丨汗青出品丨鳌头财经(theSankei) 前不久,爱奇艺发布了一份亮眼的一季报,不仅营收和会员营收创造历史最佳表现,其运营利润也连续6个月实现增长。自去年年初
  • 花7万退货退款无门:谁在纵容淘宝珠宝商家造假?

    来源:极点商业作者:杨铭在淘宝购买珠宝玉石后,因为保证金不够赔付,店铺关闭,退货退款难、维权无门的比比皆是。“提供相关产品鉴定证书,支持全国复检,可以30天无理由退换货。&
  • 大厂卷向扁平化

    来源:新熵作者丨南枝 编辑丨月见大厂职级不香了。俗话说,兵无常势,水无常形,互联网企业调整职级体系并不稀奇。7月13日,淘宝天猫集团启动了近年来最大的人力制度改革,目前已形成一
  • 阿里瓴羊One推出背后,零售企业迎数字化新解

    作者:刘旷近年来随着数字经济的高速发展,各式各样的SaaS应用服务更是层出不穷,但本质上SaaS大多局限于单一业务流层面,对用户核心关切的增长问题等则没有提供更好的解法。在Saa
  • 7月4日见!iQOO 11S官宣:“鸡血版”骁龙8 Gen2+200W快充加持

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
  • 微软发布Windows 11新版 引入全新任务栏状态

    近日,微软发布了Windows 11新版,而Build 22563更新主要引入了几周前曝光的平板模式任务栏等,系统更流畅了。更新中,Windows 11加入了专门针对平板优化的任务栏
Top