Ollama内网离线部署大模型

为了演示方便，我这里选用参数较小的Qwen1.5-0.5B-Chat模型。

下载GGUF模型

访问huggingface下载qwen1_5-0_5b-chat-q5_k_m.gguf模型。

https://huggingface.co/Qwen/Qwen1.5-0.5B-Chat-GGUF/tree/main

在这里插入图片描述
注意：

huggingface访问不到，可以选择国内的modelscope
选择q5_k_m模型，参考https://blog.csdn.net/weixin_44455388/article/details/136500170?spm=1001.2014.3001.5501

创建Ollama Modelfile

1、创建一个名为 Modelfile 的文件，并使用 FROM 指令，填写的模型的本地文件路径。

FROM ./qwen1_5-0_5b-chat-q5_k_m.gguf

Modelfile文件中还可以添加系统提示词以及各项参数：

FROM ./qwen1_5-0_5b-chat-q5_k_m.gguf# set the temperature to 1 [higher is more creative, lower is more coherent]
PARAMETER temperature 1# set the system message
SYSTEM """
你是AI助手小智，请根据用户的提问做出合适的回答。
"""

2、在Ollama中创建模型

ollama create qwen:0.5b -f Modelfile

在这里插入图片描述

3、运行模型

ollama run qwen:0.5b

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/723477.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Ollama内网离线部署大模型

下载GGUF模型

创建Ollama Modelfile

相关文章

华为智慧教室3.0的晨光，点亮教育智能化变革

@德人合科技｜公司数据防泄漏软件，防止内部文件数据资料外泄！

openGauss环境搭建 | 新手指南

【中国电信】光猫 PT632 使用超管权限修改 IP 地址租期时间

JS_选择文件夹，选择文件夹下所有文件，选择多个文件

Qt 二维数组的访问与应用

ActivityResultLauncher获取Activity返回数据

java 二分查找（迭代与递归）

深入了解 Jetpack Compose 中的 Modifier

Day5 JS基础-对象

【贪心算法】最大子序和

Android中的传感器类型和接口名称

java linq 关于常用list的表达式

【每日一题】1976. 到达目的地的方案数-2024.3.5

mac上传本地文件到远程阿里云

LeetCode 1641.统计字典序元音字符串的数目

微信小程序提交表单

JavaScript的for循环与双重for循环，妈妈再也不用担心我找工作了

解决MySQL 5.7在Redhat 9中启动报错：libncurses.so.5和libtinfo.so.5缺失问题

无法枚举容器内对象访问被拒绝