ollama教程(window系统)

前言

在《本地大模型工具哪家强?对比Ollama、LocalLLM、LM Studio》一文中对比了三个常用的大模型聚合工具优缺点,本文将详细介绍在window操作系统下ollama的安装和使用。要在 Windows 上安装并使用 Ollama,需要依赖 NVIDIA 显卡,并安装相关的驱动和 CUDA 工具链。以下是详细的分步骤指南:

一、安装ollama对硬件和软件的要求

1. 硬件要求:

  • NVIDIA 显卡,建议至少为 RTX 系列,显存 8GB 及以上。
  • 足够的磁盘空间(建议 40GB 以上)。
  • 推荐安装 SSD,提高性能。

2. 操作系统要求:

  • Windows 10 或更新版本(64 位)。

3. 软件依赖:

  • NVIDIA 驱动。
  • CUDA Toolkit(包含 cuDNN)。
  • Ollama 安装文件。

二、安装 NVIDIA 驱动

提示:一般情况下在安装操作系统的时候就会安装英伟达显卡的驱动了,如果已经安装了显卡驱动,可以跳过这一步。

1.检查显卡型号:

  1. 快捷键方式:按下“Windows”键+“X”键,从弹出的菜单中选择“设备管理器”。
  2. 在设备管理器窗口中,展开“显示适配器”选项。
  3. 在展开的列表中,就可以看到显卡的型号。例如,如果是NVIDIA的显卡,可能会显示为“NVIDIA GeForce GTX 1660 Ti”等类似的型号名称。
  4. 在“帮助”菜单中,查看“系统信息”中的显卡型号。

2.下载驱动:

  • 访问 NVIDIA 官方网站:https://www.nvidia.com/Download/index.aspx。
  • 输入你的显卡型号,选择系统版本,点击“搜索”并下载最新版本驱动程序。

3.安装驱动:

  • 双击下载的驱动程序文件。
  • 选择“自定义安装”,确保选中“清洁安装”以删除旧驱动残留。
  • 完成安装后,重新启动计算机。

三、安装 CUDA Toolkit

1. 下载 CUDA:

  • 访问 NVIDIA CUDA Toolkit 官方页面:https://developer.nvidia.com/cuda-downloads。
  • 选择你的操作系统、架构和版本,下载对应的安装包。

2. 安装 CUDA:

  • 双击安装包,按照安装向导进行安装。
  • 确保勾选“附加工具”(包括 nvcc 和相关库)。
  • 记下安装路径(默认是 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X)。

3. 配置环境变量:

  • 右键“此电脑”,选择“属性” > “高级系统设置” > “环境变量”。
  • 在“系统变量”中找到 Path,点击“编辑”。
  • 添加以下路径:
  C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X\binC:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X\libnvvp
  • 点击“确定”保存。

4. 验证 CUDA 是否安装成功:

  • 打开命令提示符,运行:
   nvcc --version
  • 如果返回 CUDA 版本号,说明安装成功。

四、安装 cuDNN

提示:cuDNN 的核心作用是加速 Ollama 运行的底层深度学习框架,从而提升推理效率

1. 下载 cuDNN:

  • 访问 NVIDIA cuDNN 下载页面:https://developer.nvidia.com/cudnn。
  • 登录或注册 NVIDIA 开发者账号。
  • 下载与你的 CUDA 版本兼容的 cuDNN 压缩包。

2. 安装 cuDNN:

  • 解压下载的压缩包。
  • 将 bin、include 和 lib 文件夹的内容复制到对应的 CUDA Toolkit 安装目录下(例如 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X)。

五、安装并运行 Ollama

1. 下载 Ollama:

  • 访问 Ollama 官方网站,下载适用于 Windows 的二进制文件。

2. 安装 Ollama:

  • 将二进制文件放到系统的某个目录(如 C:\Program Files\Ollama)。
  • 配置环境变量,将 Ollama 所在目录添加到 Path。

3. 运行 Ollama:

  • 打开命令提示符,运行:
 ollama --help
  • 如果显示帮助信息,说明安装成功。

4.查看可以下载的大模型

  • 访问 https://ollama.com/library

  • 搜索想要下载的大模型,
    在这里插入图片描述

  • 打开大模型详情页面,选择大模型版本,可以查看运行大模型的命令。
    在这里插入图片描述

5. 下载模型:

   ollama pull glm4:9b

其中glm4:9b是你下载的大模型名称。

6. 运行模型:

   ollama run glm4:9b

其中glm4:9b是你运行的大模型名称,如果没有下载大模型,会先下载大模型,下载完再运行这个大模型。

7. 查看已下载的模型:

   ollama list

8. 退出模型对话:

通过在对话命令行中输入/bye或使用快捷键Ctrl + d来退出。

六、常见问题

1、如何修改ollama存放大模型的文件夹?

  • ollama默认存放model文件的位置:C:\Users{用户名}.ollama

  • 修改ollama存放模型的默认位置只需在环境变量添加OLLAMA_MODELS=“E:\ollama”

  • 其中"E:\ollama"是你设置存放大模型的新位置。

2、ollama下载大模型太慢,怎么办?

如果使用ollama pull或ollama run下载大模型太慢,您可以手动从Hugging Face等网站下载模型文件(通常是.gguf格式),然后使用Ollama的create命令来创建模型。具体步骤如下:

  1. 创建一个文件夹来存放权重文件(例如gguf文件)。
  2. 从Hugging Face下载所需的.gguf文件,并将其放在创建的文件夹中。
  3. 创建一个构造文件(例如gemma-9b.modelfile),内容如下:
FROM ./gemma-2-9b-it-Q4_K_L.gguf
  1. 使用以下命令创建模型:
ollama create gemma-9b -f gemma-9b.modelfile
  1. 测试模型:
ollama run gemma-9b "hi who are u?"

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/66915.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[论文阅读] (35)TIFS24 MEGR-APT:基于攻击表示学习的高效内存APT猎杀系统

《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢。由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学术路上期…

半导体数据分析: 玩转WM-811K Wafermap 数据集(三) AI 机器学习

前面我们已经通过两篇文章,一起熟悉了WM-811K Wafermap 数据集,并对其中的一些数据进行了调用,生成了一些统计信息和图片。今天我们接着继续往前走。 半导体数据分析: 玩转WM-811K Wafermap 数据集(二) AI…

BGP 泄露

大家读完觉得有帮助记得关注和点赞!!! 目录 1. BGP 是什么? 2. 什么是 BGP 泄露? 3. 今天发生了什么? 4. 正常和被劫持状态下的路由示意图 5. 受影响区域 6. 责任在谁? 7. 有办法避免这…

wireshark排除私接小路由

1.wireshark打开,发现了可疑地址,合法的地址段DHCP是192.168.100.0段的,打开后查看发现可疑地址段,分别是,192.168.0.1 192.168.1.174 192.168.1.1。查找到它对应的MAC地址。 ip.src192.168.1.1 2.通过show fdb p…

使用 CompletableFuture 实现异步编程

在现代 Java 开发中,异步编程是一项重要技能。而 CompletableFuture 是从 Java 8 开始提供的一个功能强大的工具,用于简化异步任务的编写和组合。本文将详细介绍 CompletableFuture 的基本使用和一些常见的应用场景。 1. 为什么选择 CompletableFuture&…

AWS云计算概览(自用留存,整理中)

目录 一、云概念概览 (1)云计算简介 (2)云计算6大优势 (3)web服务 (4)AWS云采用框架(AWS CAF) 二、云经济学 & 账单 (1)定…

【江协STM32】10-4/5 I2C通信外设、硬件I2C读写MPU6050

1. I2C外设简介 STM32内部集成了硬件I2C收发电路,可以由硬件自动执行时钟生成、起始终止条件生成、应答位收发、数据收发等功能,减轻CPU的负担支持多主机模型支持7位/10位地址模式支持不同的通讯速度,标准速度(高达100 kHz),快速…

Web开发中页面出现乱码的解决(Java Web学习笔记:需在编译时用 -encoding utf-8)

目录 1 引言2 乱码表现、原因分析及解决2.1 乱码表现2.2 原因分析2.3 解决 3 总结 1 引言 Web开发的页面出现了乱码,一直不愿写出来,因为网上的解决方案太多了。但本文的所说的页面乱码问题,则是与网上的大多数解决方案不一样,使…

分类模型为什么使用交叉熵作为损失函数

推导过程 让推理更有体感,进行下面假设: 假设要对猫、狗进行图片识别分类假设模型输出 y y y,是一个几率,表示是猫的概率 训练资料如下: x n x^n xn类别 y ^ n \widehat{y}^n y ​n x 1 x^1 x1猫1 x 2 x^2 x2猫1 x …

【AUTOSAR 基础软件】软件组件的建立与使用(“代理”SWC)

基础软件往往需要建立一些“代理”SWC来完成一些驱动的抽象工作(Complex_Device_Driver_Sw或者Ecu_Abstraction_Sw等),或建立Application Sw Component来补齐基础软件需要提供的功能实现。当面对具体的项目时,基础软件开发人员还可…

【Linux】sed编辑器二

一、处理多行命令 sed编辑器有3种可用于处理多行文本的特殊命令。 N:加入数据流中的下一行,创建一个多行组进行处理;D:删除多行组中的一行;P:打印多行组中的一行。 1、next命令:N 单行next命…

HTML5 网站模板

HTML5 网站模板 参考 HTML5 Website Templates

数据链路层-STP

生成树协议STP(Spanning Tree Protocol) 它的实现目标是:在包含有物理环路的网络中,构建出一个能够连通全网各节点的树型无环逻辑拓扑。 选举根交换机: 选举根端口: 选举指定端口: 端口名字&…

前端学习-事件流,事件捕获,事件冒泡以及阻止冒泡以及相应案例(二十八)

目录 前言 事件流与两个阶段说明 说明 事件捕获 目标 说明 事件冒泡 目标 事件冒泡概念 简单理解 阻止冒泡 目标 语法 注意 综合示例代码 总结 前言 梳洗罢,独倚望江楼。过尽千帆皆不是,斜晖脉脉水悠悠。肠断白蘋洲 事件流与两个阶段说明…

Cognitive architecture 又是个什么东东?

自Langchain: https://blog.langchain.dev/what-is-a-cognitive-architecture/ https://en.wikipedia.org/wiki/Cognitive_architecture 定义 A cognitive architecture refers to both a theory about the structure of the human mind and to a computational…

CVE-2025-22777 (CVSS 9.8):WordPress | GiveWP 插件的严重漏洞

漏洞描述 GiveWP 插件中发现了一个严重漏洞,该插件是 WordPress 最广泛使用的在线捐赠和筹款工具之一。该漏洞的编号为 CVE-2025-22777,CVSS 评分为 9.8,表明其严重性。 GiveWP 插件拥有超过 100,000 个活跃安装,为全球无数捐赠平…

【Linux】网络层

目录 IP协议 协议头格式 网段划分 2中网段划分的方式 为什么要进行网段划分 特殊的IP地址 IP地址的数量限制 私有IP地址和公有IP地址 路由 IP协议 在通信时,主机B要把数据要给主机C,一定要经过一条路径选择,为什么经过路由器G后&…

HarmonyOS:@LocalBuilder装饰器: 维持组件父子关系

一、前言 当开发者使用Builder做引用数据传递时,会考虑组件的父子关系,使用了bind(this)之后,组件的父子关系和状态管理的父子关系并不一致。为了解决组件的父子关系和状态管理的父子关系保持一致的问题,引入LocalBuilder装饰器。…

Elasticsearch—索引库操作(增删查改)

Elasticsearch中Index就相当于MySQL中的数据库表 Mapping映射就类似表的结构。 因此我们想要向Elasticsearch中存储数据,必须先创建Index和Mapping 1. Mapping映射属性 Mapping是对索引库中文档的约束,常见的Mapping属性包括: type:字段数据类…

MySQL进阶突击系列(05)突击MVCC核心原理 | 左右护法ReadView视图和undoLog版本链强强联合

2024小结:在写作分享上,这里特别感谢CSDN社区提供平台,支持大家持续学习分享交流,共同进步。社区诚意满满的干货,让大家收获满满。 对我而言,珍惜每一篇投稿分享,每一篇内容字数大概6000字左右&…