windows 本地安装 Llama3.1 记录

1. 参考博客:1. 只要8G显卡!本地运行最强Llama 3.1大模型!:https://zhuanlan.zhihu.com/p/711409433                                    2. 只要8G显卡!本地运行最强Llama 3.1大模型!:https://xueshu.fun/4999/                                                  3. 使用Ollama实现本地部署大模型:               https://openatomworkshop.csdn.net/6645adbeb12a9d168eb6c7d4.html         4. Llama3 – 8B/70B 大模型!相关的工具和模型下载:https://blog.csdn.net/u010066597/article/details/138481313                5. AI初识--LLM、ollama、llama都是些个啥?:https://blog.csdn.net/weixin_66196770/article/details/139536570                 6. Llama3.1 8B模型下载地址:https://huggingface.co/shenzhi-wang/Llama3.1-8B-Chinese-Chat7. 【LLM中不同GGUF格式存储和表示模型参数的用途和硬件要求】:https://blog.csdn.net/Darlingqiang/article/details/140083695    8. ollama 安装第三方平台模型( GGUF篇 ):https://www.douyin.com/note/7371357396461030683                                        9. 从零到一使用 Ollama、Dify 和 Docker 构建 Llama 3.1 模型服务:https://zhuanlan.zhihu.com/p/7114160482. ollama 安装方式:1. docker 安装:1. 拉取 ollama 镜像:            
        方式1. docker pull ollama/ollama:0.3.3        // 使用 CPU 或者 Nvidia GPU 来推理模型方式2. docker pull ollama/ollama:rocm:        // 使用 AMD GPU 来推理模型
        2. 启动 ollama 实例:            
         方式1:docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:0.3.3                                                // 默认 CPU 模式运行方式2:docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:0.3.3                                     // Nvidia GPU 模式运行方式3:docker run -d --device /dev/kfd --device /dev/dri -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm             // AMD 显卡运行
    2. .exe 方式安装:从 https://ollama.com/download/windows  下载 OllamaSetup.exe,然后傻瓜式一路 next 安装3. 安装 ollama 客户端:参考博客:https://blog.csdn.net/qq_29519041/article/details/138614278( Docker下Open WebUI,Ollama的安装实践 )    
    docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
4. ollama 模型下载网站:4.1. Hugging Face:https://huggingface.co/5. ollama 常用命令:ollama 简介:Ollama是一个开源的 LLM(大型语言模型)服务工具,用于简化在本地运行大语言模型,降低使用大语言模型的门槛,使得大模型的开发者、研究人员和爱好者能够在本地环境快速实验、管理和部署最新大语言模型,包括如Llama 3、Phi 3、Mistral、Gemma等开源的大型语言模型。ollama 命令使用起来和 docker 很像。    
    1. ollama pull qwen:0.5b-chat     // 使用 ollama 下载 “通义千问” 的 qwen:0.5b-chat 模型2. ollama run qwen:0.5b-chat      // 使用 ollama 运行 “通义千问” 的 qwen:0.5b-chat 模型( 成功以后就可以输入问题聊天了 )3. ollama --version               // 查看 ollama 版本号4. ollama list                    // 查询模型列表
6. ollama 导入离线下载的 gguf 模型:1. 下载 xxx.gguf2. 新建 config.txt,内容如下:      
FROM "./xxx.gguf"TEMPLATE """{{- if .System }}
<|im_start|>system {{ .System }}<|im_end|>
{{- end }}
<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""SYSTEM """"""PARAMETER stop <|im_start|>
PARAMETER stop <|im_end|>
    3. ollama create xxx -f ./config.txt4. ollama  list 会发现能列出 xxx了5. ollama run xxx 然后开始对话6. ollama rm xxx  移除模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/877499.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

接口基础知识9:详解response body(响应体)

课程大纲 一、定义 HTTP响应体&#xff08;HTTP Response Body&#xff09;&#xff1a;服务器返回给客户端的数据部分&#xff0c;‌它包含了服务器对客户端请求的响应内容&#xff08;如客户端请求的资源、客户端请求的执行结果&#xff09;。 与请求类似&#xff0c;HTTP …

vue中父组件向子组件传值,子组件向父组件传值,简洁易懂

Vue中父组件传值到子组件 Vue中父组件传值分为两步&#xff1a; 一、父组件中代码中&#xff0c;使用属性绑定向子组件传递数据&#xff0c; 如图, 其中&#xff0c;:titles"title"就是在将父组件的title属性值&#xff0c;传递到子组件所绑定的titles属性中&#x…

python之matplotlib (3 坐标轴设置)

写在前面 在说明坐标轴设置之前&#xff0c;我有必要和大家说清楚图像设置的一些方法&#xff0c;避免陷入困扰模糊的地步。前面我们说过&#xff0c;画图的三种方法&#xff08;python之matplotlib &#xff08;1 介绍及基本用法&#xff09;-CSDN博客&#xff09;。而设置也…

2024开源资产管理系统推荐 8款免费开源IT资产管理系统/软件

开源资产管理系统 开源资产管理系统是帮助企业管理、跟踪和优化其资产的强大工具。这些系统能够自动记录资产的详细信息&#xff0c;如采购日期、使用情况、维护记录等&#xff0c;从而实现资产的全生命周期管理。企业可以通过这些系统优化资产使用效率&#xff0c;减少资产闲…

【TCP】确认应答、超时重传机制和TCP报头

TCP 相关机制 TCP 基本特点&#xff1a;有连接、可靠传输、面向字节流、全双工 有连接、面向字节流和全双工都能在前面的代码中体现有连接&#xff1a;必须要先调用 accept 建立联系才能处理面向字节流&#xff1a;会拿到 clientSocket 对象的 InputStream 和 OutputStream&a…

轻松解决找不到“MSVCP120.dll”的困扰

文章目录 轻松解决找不到“MSVCP120.dll”的困扰了解“MSVCP120.dll”可能导致问题的原因解决方法方法一&#xff1a;重新安装 Microsoft Visual C Redistributable 包&#xff08;亲测有效&#xff09;附官方网站链接两个安装包链接方法二&#xff1a;使用系统文件检查工具&am…

python人工智能002:jupyter基本使用

小知识&#xff1a;将jupyter修改为中文&#xff0c;修改用户变量&#xff0c; 注意是用户变量&#xff0c;不是系统变量 新增用户变量 变量名&#xff1a;LANG 变量值&#xff1a;zh_CN.UTF8 然后重启jupyter 上一章的软件安装完成之后&#xff0c;就可以创建文件夹来学习写…

Redis中List数据类型常用命令

目录 1. 基本操作 &#xff08;1&#xff09;在列表的头部插入一个元素 &#xff08;2&#xff09;在列表的尾部插入一个元素 &#xff08;3&#xff09;获取列表的长度 &#xff08;4&#xff09;获取列表中的元素 2. 读取和修改 &#xff08;1&#xff09;获取列表的范围&…

MaxKB(二):Ubuntu24.04搭建maxkb开发环境

接上文&#xff1a;windows10搭建maxkb开发环境&#xff08;劝退指南&#xff09; 上文在windows10环境搭建maxkb开发环境遇到各种坑&#xff0c;后面就转战ubuntu平台&#xff0c;果然比较顺利的完成开发环境搭建。当然遇到相关的问题还是可以参考上文《windows10搭建maxkb开发…

拟合与插值|线性最小二乘拟合|非线性最小二乘拟合|一维插值|二维插值

挖掘数据背后的规律是数学建模的重要任务&#xff0c;拟合与插值是常用的分析方法 掌握拟合与插值的基本概念和方法熟悉Matlab相关程序实现能够从数据中挖掘数学规律 拟合问题的基本提法 拟合问题的概念 已知一组数据(以二维为例)&#xff0c;即平面上n个点 ( x i , y i ) …

Harbor仓库push显示

背景&#xff1a; 在做测试时发现harbor仓库端口开放这&#xff0c;却一直登录不上去&#xff0c;重启harbor资源包docker-compose还是不行&#xff0c;修改了docker.service文件不行&#xff0c;json文件也不行&#xff0c;以下是涉及到的命令和报错&#xff08;好像是这个&a…

C语言指针详解-上

C语言指针详解-上 前言1.指针的基本概念1.1指针是什么1.2指针的声明与初始化1.3取地址符&和解引用符*& 运算符用于**获取变量的地址*** 运算符用于访问指针指向的值 2.指针的类型常见数据类型的指针指针与数组、字符串数组指针结构体指针函数指针二级指针void指针 3.指…

对零基础想转行网络安全同学的一点建议

最近有同学在后台留言&#xff0c;0基础怎么学网络安全&#xff1f;0基础可以转行做网络安全吗&#xff1f;以前也碰到过类似的问题&#xff0c;想了想&#xff0c;今天简单写一下。 我的回答是先了解&#xff0c;再入行。 具体怎么做呢&#xff1f; 首先&#xff0c;你要确…

进程地址空间(二)

目录 前言1. 进程地址空间究竟是什么2. 为什么要有进程地址空间2.1 让进程以统一的视角看待内存结构2. 2 保护物理内存2.3 进程管理 与 内存管理模块 的解耦合2.3.1 页表地址2.3.2 页表的权限管理2.3.3 关于进程挂起 && 惰性加载 4. 进程独立性的体现 前言 接着上篇文…

滑动变阻器的未来发展趋势和前景如何?是否有替代品出现?

滑动变阻器是常见的电子元件&#xff0c;主要用于调节电路中的电阻值。随着科技的不断发展&#xff0c;滑动变阻器的未来发展趋势和前景也引起了广泛关注。 滑动变阻器的未来发展将更加注重智能化&#xff0c;随着物联网、人工智能等技术的快速发展&#xff0c;滑动变阻器也将与…

git stash详细教程

git stash详细教程 基本命令: git stash: 保存当前未提交的更改&#xff0c;并恢复到干净的工作目录。git stash list: 列出所有的 stash。git stash show: 显示最新 stash 的简要内容。git stash show -p: 显示最新 stash 的详细内容。 应用和删除: git stash apply: 应用最新…

华为数通路由交换HCIP/HCNP

2017-2022年软考高级网络规划设计师真题解析视频&#xff01;软考复习一定要多做历年真题&#xff01; 2022年软考网络规划设计师真题解析_哔哩哔哩_bilibili 2024年5月软考网络工程师真题解析合集&#xff0c;考后估分版【综合知识案例分析】 2024年5月软考网络工程师真题解…

C语言 | Leetcode C语言题解之第347题前K个高频元素

题目&#xff1a; 题解&#xff1a; struct hash_table {int key;int val;// 查看 https://troydhanson.github.io/uthash/ 了解更多UT_hash_handle hh; };typedef struct hash_table* hash_ptr;struct pair {int first;int second; };void swap(struct pair* a, struct pair*…

YUM和NFS

文章目录 yum软件仓库的提供方式RPM软件包的来源Linux系统各家厂商用的安装源命令---yum 配置本地yum源具体操作 搭建ftp yum仓库环境具体操作实操环境服务端一、安装 vsftpd服务二、创建一个文件&#xff0c;并且挂载三、开启服务四、查看挂载 客户端五、备份六、搭建ftp yum仓…

【联想电脑】:使用拓展坞后转接HDMI,无法识别显示屏

项目场景&#xff1a; 作为一个嵌入式软件开发者&#xff0c;有两个外接屏幕&#xff0c;不足为奇。 但是在今天的使用电脑过程中&#xff0c;出现了接了一个拓展坞上面有HDMI接口&#xff0c;但是HDMI接口接上外接显示屏的时候电脑无法识别到&#xff0c;导致只有电脑直连的HD…