如何让本地GGUF模型通过Ollama进行管理和推理

Ollama 除了通过从支持模型列表中 pull 的下载模型方式，也支持手动导入GGUF模型。
关键是需要创建一个 Modelfile 文件，和将项目打包成docker image的过程有点类似。
Modelfile 内容的创建可以参考通过 ollama pull 命令拉取的模型对应的 Modelfile ，比如查看 llama3:70b 这个模型的 Modelfile，执行以下命令：

ollama show --modelfile llama3:70b

执行完命令后显示的 Modelfile 内容：

# Modelfile generated by "ollama show"
# To build a new Modelfile based on this, replace FROM with:
# FROM llama3:70b
FROM /usr/share/ollama/.ollama/models/blobs/sha256-0bd51f8f0c975ce910ed067dcb962a9af05b77bafcdc595ef02178387f10e51d
TEMPLATE "{{ if .System }}<|start_header_id|>system<|end_header_id|>{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>{{ .Response }}<|eot_id|>"
PARAMETER num_keep 24
PARAMETER stop <|start_header_id|>
PARAMETER stop <|end_header_id|>
PARAMETER stop <|eot_id|>

创建一个Modelfile（最好用模型名称命名）的空文件

nano Modelfile

并在其中添加FROM指令，用于指定要导入的模型的本地文件路径（下面的例子用的是相对路径），其他内容可参考ollama library已有模型的modelfile。

FROM ./vicuna-33b.Q4_0.gguf

名为 test 的Modelfile中的内容如下

FROM ./test.gguf
TEMPLATE """<|user|>
{{ .Prompt }}<|end|>
<|assistant|>"""

后续通过以下命令创建并运行模型：

# 通过Ollama命令创建该模型
ollama create [模型名称] -f Modelfile
# 运行模型
ollama run [模型名称]
# 拉取后的LLM所在位置
/usr/share/ollama/.ollama/models

详情可参考：modelfile创建官方文档

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/diannao/55793.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

如何让本地GGUF模型通过Ollama进行管理和推理

相关文章

YOLO11改进|注意力机制篇|引入NAM注意力机制

微服务实战——注册功能

C++ day04（友元 friend、运算符重载、String字符串）

YOLOv5改进——添加SimAM注意力机制

吴恩达深度学习笔记：卷积神经网络（Foundations of Convolutional Neural Networks）2.7-2.8

【Linux】 TCP短服务编写和守护进程

75. 颜色分类

Python | Leetcode Python题解之第468题验证IP地址

Window系统编程 - 文件操作

Jenkins Pipline流水线

看门狗电路设计

LSTM（长短时记忆网络）

力扣1031. 两个非重叠子数组的最大和

Nginx基础详解5（nginx集群、四七层的负载均衡、Jmeter工具的使用、实验验证集群的性能与单节点的性能）

对象的概念

QT入门教程攻略 QT入门游戏设计：贪吃蛇实现 QT全攻略心得总结

深入探讨JavaScript中的精度问题：原理与解决方案

Laravel Filament 如何配置多语言支持

Run the FPGA VI 选项的作用

夜间数据库IO负载飙升？MySQL批量删除操作引发的问题排查