docker部署Ollama并简单调用模型

Ollama简介

Ollama 是一个开源的大型语言模型(LLM)平台,旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。
Ollama 提供了一个简单的方式来加载和使用各种预训练的语言模型,支持文本生成、翻译、代码编写、问答等多种自然语言处理任务。
Ollama 的特点在于它不仅仅提供了现成的模型和工具集,还提供了方便的界面和 API,使得从文本生成、对话系统到语义分析等任务都能快速实现。

docker部署Ollama

前提主机上安装了docker 并且主机的规格大小至少为:4C8G
安装docker: yum install -y docker

或者其他docker 安装方式参考: https://blog.csdn.net/weixin_48953586/article/details/145597723
拉取ollama的镜像:

docker pull ollama/ollama
# 这里如果docker不能直接拉取镜像,需要配置下docker的镜像源

运行ollama容器

# 仅CPU运行: 映射出11434端口
docker run -d -v ollama:/root/ollama -p 11434:11434 --name ollama  ollama/ollama

这里采用linux主机运行所以使用仅cpu运行,如需使用gpu运行可以参考: https://ollama.cadn.net.cn/docker.html

通过ollama安装模型: llama3.2
下载模型:

 docker exec -it ollama ollama run llama3.2

拉取过程取决网速.
上面的模型下载成功之后,会自动进入命令行的对话界面可以进行对话,
在这里插入图片描述
测试为小模型,模型的准确性和性能比较差强人意.目的是为了测试跑通整个流程
以上就是通过docker部署完成了

api调用

部署地址: 10.155.252.193

查询当前模型列表命令:

# 在部署主机上执行命令
curl http://localhost:11434/api/tags

在这里插入图片描述

使用Python调用api

# -*- coding: utf-8 -*-
"""
-------------------------------------------------
@ File    : lear
@ Author :wuchangping
@ Date :2025/4/22 15:16 
@ Description:xxx
-------------------------------------------------
"""
import requests
import json
import time## 构建调用主函数
def send_request(prompt):response = requests.post("http://10.155.252.193:11434/api/generate",json={"model": "llama3.2:1b", "prompt": prompt, "stream": True},stream=True)for line in response.iter_lines():if line:data = json.loads(line.decode("utf-8"))full_text = data.get("response", "")for char in full_text:print(char, end="", flush=True)time.sleep(0.01)  # 模拟逐字输出的延迟# print(data.get("response", ""), end="", flush=True)## 传递参数模块
## 这里让他去读取日志文件内容
def analyse():with open("log" ,"r",encoding='UTF-8') as file:log_content=file.read()#构建提示词prompt = f"""请分析以下日志文件内容:- 统计请求的客户端ip和分别对应的数量- 统计响应码和数量日志内容:{log_content}"""send_request(prompt)if __name__ == '__main__':analyse()

在这里插入图片描述

模型的性能
主机的cpu使用情况:
在这里插入图片描述
参考文档:
https://blog.csdn.net/weixin_40280870/article/details/145300048
https://blog.csdn.net/weixin_48953586/article/details/145597723
https://ollama.cadn.net.cn/docker.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/78023.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis安装及入门应用

应用资料:https://download.csdn.net/download/ly1h1/90685065 1.获取文件,并在该文件下执行cmd 2.输入redis-server-lucifer.exe redis.windows.conf,即可运行redis 3.安装redis客户端软件 4.安装后运行客户端软件,输入链接地址…

《重塑AI应用架构》系列: Serverless与MCP融合创新,构建AI应用全新智能中枢

在人工智能飞速发展的今天,数据孤岛和工具碎片化问题一直是阻碍AI应用高效发展的两大难题。由于缺乏统一的标准,AI应用难以无缝地获取和充分利用数据价值。 为了解决这些问题,2024年AI领域提出了MCP(Model Context Protocol模型上…

从入门到精通【MySQL】视图与用户权限管理

文章目录 📕1. 视图✏️1.1 视图的基本概念✏️1.2 试图的基本操作🔖1.2.1 创建视图🔖1.2.2 使用视图🔖1.2.3 修改数据🔖1.2.4 删除视图 ✏️1.3 视图的优点 📕2. 用户与权限管理✏️2.1 用户🔖…

输入捕获模式测频率

前提工作: PA6、PA0通过跳线相连,PA6测试PA0的输出频率 本来只有下列函数,改变占空比 但是我们需要测试频率,需要动态改变频率。 void PWM_SetCompare1(uint16_t Compare) {TIM_SetCompare1(TIM2, Compare); //设置CCR1的值 }…

通付盾入选苏州市网络和数据安全免费体验目录,引领企业安全能力跃升

近日,苏州市网络安全主管部门正式发布《苏州市网络和数据安全免费体验产品和服务目录》,通付盾凭借其在数据安全、区块链、AI领域的创新实践和前沿技术实力,成功入选该目录。 作为苏州市网络安全技术支撑单位,通付盾将通过 “免费…

AI日报 - 2025年04月25日

🌟 今日概览(60秒速览) ▎🤖 AGI突破 | OpenAI o3模型展现行动能力,英国发布RepliBench评估AI自主复制风险,DeepMind CEO担忧AGI协调挑战。 模型能力向行动和自主性演进,安全与协调成为焦点。 ▎💼 商业动向…

DeepSeek开源引爆AI Agent革命:应用生态迎来“安卓时刻”

开源低成本:AI应用开发进入“全民时代” 2025年初,中国AI领域迎来里程碑事件——DeepSeek开源模型的横空出世,迅速在全球开发者社区掀起热潮。其R1和V3模型以超低API成本(仅为GPT-4o的2%-10%)和本地化部署能力&#x…

CDGP|大模型赋能数据治理:实践案例与深度剖析

随着大数据技术的飞速发展,数据规模呈爆炸式增长,数据来源也日趋多样化。在这个背景下,大模型,即具有数十亿甚至上百亿参数的深度学习模型,逐渐成为数据处理和分析的重要工具。大模型具备处理多任务、理解复杂语言模式…

Ubuntu 一站式部署 RabbitMQ 4 并“彻底”迁移数据目录的终极实践

1 安装前准备 sudo apt update -y sudo apt install -y curl gnupg apt-transport-https lsb-release jq若计划将数据放到新磁盘(如 /dev/nvme0n1p1): sudo mkfs.xfs /dev/nvme0n1p1 sudo mkdir /data echo /dev/nvme0n1p1 /data xfs defau…

5.2.3 WPF 中 XAML 文件 Converter 使用介绍

Converter(转换器)在 WPF 数据绑定中扮演着重要角色,用于在源数据和目标属性之间进行值转换 举例来说:我想用一个bool量来控制一个背景,为true时,显示红色;为false时背景用默认颜色。因此 Backg…

MySQL 8 自动安装脚本(CentOS-7 系统)

文章目录 一、MySQL 8 自动安装脚本脚本说明📌 使用脚本前提条件1. 操作系统2. 用户权限3. 网络要求 📌 脚本的主要功能1. 环境检查2. MySQL 自动安装3. 自动配置 MySQL4. 防火墙配置5. 验证与输出 📌 适用场景 二、执行sh脚本1. 给予脚本执行…

Python跨平台桌面应用程序开发

引言 在当今软件开发领域,跨平台应用程序开发变得越来越重要。用户希望无论使用Windows、macOS还是Linux系统,都能获得一致的应用体验。Python作为一种高级编程语言,凭借其简洁的语法和丰富的库生态系统,成为了跨平台桌面应用程序…

使用 Docker 安装 SQL Server 2022 并解决 Navicat 连接问题

在使用 Docker 安装 SQL Server 时,很多人可能遇到过无法通过 Navicat 等数据库客户端连接到容器的情况。尤其是尝试使用 mcr.microsoft.com/mssql/server:2022-latest 镜像时,可能会发现 Navicat一直转圈,无法连接到数据库。在这篇博客中&am…

2025最新软件测试面试八股文(答案+文档+视频讲解)

1、你的测试职业发展是什么? 测试经验越多,测试能力越高。所以我的职业发展是需要时间积累的,一步步向着高级测试工程师奔去。而且我也有初步的职业规划,前3年积累测试经验,按如何做好测试工程师的要点去要求自己&…

理解计算机系统_网络编程(2)

前言 以<深入理解计算机系统>(以下称“本书”)内容为基础&#xff0c;对程序的整个过程进行梳理。本书内容对整个计算机系统做了系统性导引,每部分内容都是单独的一门课.学习深度根据自己需要来定 引入 接续上一篇理解计算机系统_网络编程(1)-CSDN博客 国际互联…

【盈达科技】GEO(生成式引擎优化)底层逻辑

​​一、GEO的现状​​ ​​技术快速迭代​​ 生成式AI&#xff08;如ChatGPT、Claude、Google SGE&#xff09;正在成为用户获取信息的核心入口&#xff0c;传统搜索引擎的流量被分流。主流平台如Google推出“生成式搜索体验&#xff08;SGE&#xff09;”&#xff0c;Bing整合…

VS Code 智能代理模式:重塑开发体验

在编程领域&#xff0c;效率与精准度无疑是开发者们永恒的追求。而如今&#xff0c;VS Code 推出的智能代理模式&#xff08;Agent Mode&#xff09;&#xff0c;正以前所未有的方式&#xff0c;彻底颠覆了传统开发流程&#xff0c;为程序员们带来了一场前所未有的效率革命。本…

【回眸】Aurix TC397 IST 以太网 UDP 相关开发

前言 关于移植IST功能至 Infineon TC397上主要涉及到UDP发送报文及接收。IST是安全诊断相关的工作 Nvidia IST介绍 Orin系列芯片会提供一种机制来检测由系统内测&#xff08;IST&#xff09;所产生的永久的故障&#xff0c;IST 应该在 Orin-x 功能安全系统中使用期间被启动。…

Mediamtx与FFmpeg远程与本地推拉流使用

1.本地推拉流 启服 推流 ffmpeg -re -stream_loop -1 -i ./DJI_0463.MP4 -s 1280x720 -an -c:v h264 -b:v 2000k -maxrate 2500k -minrate 1500k -bufsize 3000k -rtsp_transport tcp -f rtsp rtsp://127.0.0.1:8554/stream 拉流 ffplay -rtsp_transport tcp rtsp://43.136.…

使用QML Tumbler 实现时间日期选择器

目录 引言相关阅读项目结构示例实现与代码解析示例一&#xff1a;时间选择器&#xff08;TimePicker&#xff09;示例二&#xff1a;日期时间选择器&#xff08;DateTimePicker&#xff09; 主窗口整合运行效果总结下载链接 引言 在现代应用程序开发中&#xff0c;时间与日期选…