linux安装ollama

俩种方式都可


一、linux通过docker安装ollama镜像

1.下载安装ollama镜像

# 安装 Docker
sudo yum install docker
sudo systemctl start docker#docker查看所有容器
docker ps -a  # 查看所有容器# docker查看指定容器
docker ps -a |grep ollama# 创建模型存储目录(例如 /data/ollama_models)
sudo mkdir -p /data/ollama_models
sudo chmod -R 777 /data/ollama_models  # 确保容器有写入权限# 启动容器并挂载目录
docker run -d \--name ollama \-v /data/ollama_models:/root/.ollama \  # 将主机目录挂载到容器内-p 11434:11434 \ollama/ollama#修改默认模型存储路径
如果不想挂载 /root/.ollama,可通过环境变量指定其他路径:
docker run -d \--name ollama \-v /custom/models:/data/ollama_models \  # 自定义挂载点-e OLLAMA_MODELS=/data/ollama_models \   # 指定容器内路径-p 11434:11434 \ollama/ollama# 停止容器
docker stop ollama# 启动
docker start ollama# 重启动
docker restart ollama#如果ollama正在运行并且不需要ollama了,删除
docker stop ollama && docker rm ollama

2.检查目录挂载 (-v) 是否生效 

#检查目录挂载 (-v) 是否生效
方法 1:使用 docker inspect 查看挂载信息
docker inspect ollama | grep -A 5 Mounts方法2:
# 进入容器内部
docker exec -it ollama bash# 查看目录是否存在
ls -l /data/ollama_models# 尝试创建测试文件(验证写入权限)
touch /data/ollama_models/test.txt
exit# 返回主机检查文件是否同步
ls -l /custom/models/test.txt

3. 检查环境变量 (-e) 是否生效

方法 1:使用 docker inspect 查看环境变量
docker inspect ollama | grep -A 10 Env
预期输出
"Env": ["OLLAMA_MODELS=/data/ollama_models","PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin"
]方法 2:在容器内打印环境变量
docker exec -it ollama sh -c 'echo $OLLAMA_MODELS'
预期输出/data/ollama_models

4.下载大模型

进入容器内操作或直接通过 REST API 下载模型:

方法 1:进入容器内操作  

大模型占用内存一般较高,最好查一下电脑配置是否能带动大模型

docker exec -it ollama ollama pull llama2  # 下载 llama2 模型

模型会自动保存到挂载的目录 /data/ollama_models

方法 2:通过主机直接调用
curl -X POST http://localhost:11434/api/pull -d '{"name": "llama2"}'

5. 验证模型下载

# 查看已下载模型
docker exec -it ollama ollama list# 检查主机目录内容
ls /data/ollama_models/models

6. 运行模型

# 在容器内交互式运行
docker exec -it ollama ollama run llama2# 通过 API 调用
curl http://localhost:11434/api/generate -d '{"model": "llama2", "prompt": "你好"}'

二、linux本地安装ollama

1. 下载并安装 Ollama

# 下载 Ollama
curl -fsSL https://ollama.com/install.sh | sh# 启动 Ollama 服务
sudo systemctl enable ollama
sudo systemctl start ollama#停止ollama服务
sudo systemctl stop ollama

2. 设置环境变量指定模型目录

默认情况下,Ollama 会将模型存储在 ~/.ollama 目录。要更改此位置:

# 创建新的模型存储目录(例如 /data/ollama_models)
sudo mkdir -p /data/ollama_models
sudo chown -R $USER:$USER /data/ollama_models# 设置环境变量(临时生效)
export OLLAMA_MODELS=/data/ollama_models# 使环境变量永久生效
echo "export OLLAMA_MODELS=/data/ollama_models" >> ~/.bashrc
source ~/.bashrc

3. 重启 Ollama 服务使更改生效

sudo systemctl restart ollama

4. 验证安装并下载模型

# 检查服务状态
systemctl status ollama# 下载模型(会自动保存到指定目录)
ollama pull llama2# 运行模型
ollama run llama2

5. (可选) 修改 systemd 服务文件永久设置

如果通过环境变量不生效,可以修改服务文件:sudo vi /etc/systemd/system/ollama.service
在 [Service] 部分添加:Environment="OLLAMA_MODELS=/data/ollama_models"
然后重新加载并重启服务:sudo systemctl daemon-reload
sudo systemctl restart ollama

6.查看ollama日志
 

1. 查看详细日志
首先获取更详细的错误信息:sudo journalctl -u ollama -n 50 --no-pager
或直接运行 Ollama 查看输出:sudo /usr/local/bin/ollama serve

7. 检查 ollama 用户是否存在

运行以下命令检查用户和组是否已创建:id ollama  # 检查用户是否存在
grep ollama /etc/group  # 检查用户组是否存在如果不存在,可以手动创建:
sudo useradd -r -s /bin/false ollama  # 创建系统用户(无登录权限)

注意事项:

    1. 确保指定的目录有足够的存储空间

    2. 目录权限要正确,Ollama 进程需要有读写权限

    3. 不同版本的 Ollama 可能有不同的配置方式

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/76465.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis 学习目标

🎯 Redis 学习目标(开发者视角) ✅ 一、学习完成后能掌握的核心能力: 分类具体内容📦 基础能力熟练掌握 Redis 五大数据结构(String、List、Hash、Set、ZSet),会用也会选对场景&am…

gerrit配置及使用git-lfs

gerrit服务器端配置 下载git-lfs插件 登录Dashboard [Jenkins] (gerritforge.com),下载对应版本的插件 配置gerrit 将下载的lfs.jar插件放到${GERRIT_SITE}/plugins/下面为所有仓库启用git-lfs 此步骤需要修改 All-projects 仓库配置,步骤如下 1、克隆仓…

深入理解 Linux PATH 环境变量:配置与优化!!!

深入理解 Linux PATH 环境变量:配置与优化 🚀 欢迎来到 Linux 环境变量的奇妙世界!今天我们来聊聊那个让命令行如鱼得水的幕后英雄——PATH 环境变量!😎 通过这篇博客,你将学会如何配置它、优化它&#xff…

如何在AMD MI300X 服务器上部署 DeepSeek R1模型?

DeepSeek-R1凭借其深度推理能力备受关注,在语言模型性能基准测试中可与顶级闭源模型匹敌。 AMD Instinct MI300X GPU可在单节点上高效运行新发布的DeepSeek-R1和V3模型。 用户通过SGLang优化,将MI300X的性能提升至初始版本的4倍,且更多优化将…

简化DB操作:Golang 通用仓库模式

介绍 本代码包提供一个用于数据库操作的通用仓库 (GenericRepository),利用 Golang 和 GORM (Go ORM) 实现。该仓库设计用于简化数据库的 CRUD (创建、读取、更新、删除) 操作,支持批处理、冲突处理、分页查询等高级功能。 主要功能 创建记录 (Create…

JavaWeb 课堂笔记 —— 08 请求响应

本系列为笔者学习JavaWeb的课堂笔记,视频资源为B站黑马程序员出品的《黑马程序员JavaWeb开发教程,实现javaweb企业开发全流程(涵盖SpringMyBatisSpringMVCSpringBoot等)》,章节分布参考视频教程,为同样学习…

双引擎驱动:解密音视频体验的QoS技术底座与QoE感官革命

QoS 定义:QoS(Quality of Service,服务质量)衡量音视频传输技术层面的性能表现,聚焦网络传输和系统处理能力,通过客观指标量化服务质量。核心指标 码率/带宽:数据传输速率上限,直接…

Stable Diffusion + Contronet,调参实现LPIPS最优(带生成效果+指标对比)——项目学习记录

目录 前言 一、数据集:图像文本,部分选取于DeepFashion 二、优化一,img2img 三、优化二,微调sd参数 四、优化三,dreamshaper优化 五、优化四,sdv1.5contronet 六、问题探索历程 1. 从 SDXL 到轻量化模…

SQL 不走索引的常见情况

在 SQL 查询中&#xff0c;即使表上有索引&#xff0c;某些情况下数据库优化器也可能决定不使用索引。以下是常见的不走索引的情况&#xff1a; 1. 使用否定操作符 NOT IN ! 或 <> NOT EXISTS NOT LIKE 2. 对索引列使用函数或运算 -- 不走索引 SELECT * FROM user…

数据库主从延迟全解析:原因、影响与解决之道

目录 一、引言&#xff1a;理解数据库主从架构 二、数据库主从延迟的定义与测量 2.1 主从延迟的技术定义 2.2 如何测量主从延迟 2.3 主从延迟对系统的影响 三、主从延迟的常见原因分析 3.1 网络延迟因素 3.1.1 网络质量与带宽限制 3.1.2 地理位置分布造成的延迟 3.2 …

分治-归并系列一>翻转对

目录 题目&#xff1a;解析&#xff1a;策略一&#xff1a; 代码&#xff1a;策略二&#xff1a; 代码&#xff1a; 题目&#xff1a; 链接: link 这题和逆序对区别点就是&#xff0c;要找到前一个元素是后一个元素的2倍 先找到目标值再&#xff0c;继续堆排序 解析&#xff1…

从0到1打造一套适合自己接单的脚手架05自动化创建表

上一篇我们是手动创建的表&#xff0c;感觉不方便&#xff0c;后续如果要做成产品在部署的时候一个个的创建表太麻烦了&#xff0c;我们让ai来自动创建表&#xff0c;输入如下提示词 现在这种单独去navicate执行也不方便&#xff0c;我希望是有一个目录里存放的表结构的语句&a…

minio改成https+域名访问

思路有两个&#xff1a; 方式一&#xff1a;通过nginx反向代理&#xff0c;将https配置在nginx&#xff0c;内部的MinIO还是使用HTTP&#xff1b;方式二&#xff1a;MinIO服务端直接配置成HTTPS&#xff1b; 注意&#xff1a; 私钥需要命名为&#xff1a;private.key 公钥需要…

VS Code构建C/C++开发环境(Windows with MinGW and CMake)

文章目录 目的编译工具链基础开发与调试基于CMake开发与调试关于settings.json总结 目的 在Windows上进行C/C开发目前最最常用的IDE就是微软的 Visual Studio &#xff0c;只是对我来说早些年的VS实在是太卡了&#xff0c;留下了不好的印象。后来没怎么用过&#xff0c;现在下…

一组可能的机器学习问题列表

线性回归与多项式拟合的关系最小二乘法在机器学习中的应用梯度下降是如何实现的贝叶斯分类器的应用场景高斯分布与判定在哪里用到模型的评估有哪些参数误差中的偏差和方差定义训练集分组的快捷方式如何度量模型性能查准率查全率的定义roc,aux的含义正则化是什么意思k均值用来解…

linux下io操作详细解析

在 Linux 系统下&#xff0c;IO&#xff08;输入/输出&#xff09;操作是程序与外部设备&#xff08;如文件、网络等&#xff09;交互的重要方式。Linux 提供了丰富的系统调用和库函数来支持各种 IO 操作。以下是对 Linux 下 IO 操作的详细解析&#xff0c;包括文件 IO、网络 I…

wsl2+ubuntu22.04安装blender教程(详细教程)

本章教程介绍,如何在Windows操作系统上通过wsl2+ubuntu安装blender并运行教程。Blender 是一款免费、开源的 ​​3D 创作套件​​,广泛应用于建模、动画、渲染、视频编辑、特效制作等领域。它由全球开发者社区共同维护,支持跨平台(Windows、macOS、Linux),功能强大且完全…

目标检测YOLO实战应用案例100讲- 基于卷积神经网络的小目标检测算法研究与应用

目录 知识储备 基于改进YOLOv5的小目标检测算法 一、环境配置(Python 3.8+) 二、核心代码实现 1. 改进模型定义(models/yolov5s_tiny.py ) 2. 小目标数据增强(datasets/tiny_aug.py ) 3. 训练脚本(train.py ) 三、关键改进点说明 四、实验配置建议 前言 传统…

智能DNS解析:解决高防IP地区访问异常的实战指南

摘要&#xff1a;针对高防IP在部分地区无法访问的问题&#xff0c;本文设计基于智能DNS的流量调度方案&#xff0c;提供GeoDNS配置与故障切换代码示例。 一、问题背景 运营商误拦截或线路波动可能导致高防IP在福建、江苏等地访问异常。传统切换方案成本高&#xff0c;智能DNS可…

根据 PID 找到对应的 Docker 容器

引言 在日常运维与调试过程中&#xff0c;我们常常需要查找某个进程所属的 Docker 容器。当系统出现问题或资源异常时&#xff0c;根据进程的 PID 找到其所属容器可以帮助我们迅速定位问题。本文将介绍如何利用 Linux 的 cgroup 机制&#xff0c;以及 Docker 提供的工具来完成…