本地部署DeepSeek方法

本地部署完成后的效果如下图,整体与chatgpt类似,只是模型在本地推理。

我们在本地部署主要使用两个工具:

  1. ollama
  2. open-webui

ollama是在本地管理和运行大模型的工具,可以直接在terminal里和大模型对话。open-webui是提供一个类似chatgpt的网页,相比terminal更加方便和直观一些。open-webui可自动检测ollama已经下载的模型,直接选择使用即可。两者搭配使用。

使用ollama,我们可以不用配置开发环境,也不需要写推理代码,使用起来类似conda或者docker,直接执行指令来运行某个模型就可以。比如想用deepseek模型,就执行ollama run deepseek-r1,想用llama模型,就执行ollama run llama3.3。下面具体介绍一下ollama和安装方法。

Ollama是一个开源的大型语言模型服务工具,以下是对它的具体介绍:

ollama介绍

特点

  • 本地部署:专注于在本地机器上便捷部署和运行大型语言模型,用户可在自己设备上运行模型,保护数据隐私,无需担心数据发送到云端的安全风险。
  • 多系统支持:支持Mac、Linux和Windows等多种操作系统,用户在不同平台上都能方便地安装使用。
  • 多模型支持:支持Deepseek-r1、Llama、Falcon、Qwen2、Phi3、Gemma2等多种流行的LLM模型,用户可按需选择,一键运行。
  • 易于使用:提供直观的命令行界面,操作简单,上手容易,降低了使用门槛。
  • 可扩展性:支持自定义配置,用户能根据自身硬件环境和模型需求进行优化,还可通过安装插件增加新功能。
  • 开源:代码完全开放,用户可自由查看、修改和分发,活跃的开发者社区也会提供问题解答和持续改进。
  • API支持:提供简洁的API,方便开发者创建、运行和管理大型语言模型实例,轻松将其集成到各种应用程序中。
  • 预构建模型库:包含一系列预先训练好的模型,用户可直接选用,无需从头训练或自行寻找模型源。
  • 模型导入与定制:支持从特定平台导入已有的大型语言模型,兼容PyTorch或Safetensors深度学习框架,方便用户集成自有模型。

功能

  • 自动硬件加速:能自动识别并充分利用系统中的最优硬件资源,如NVIDIA GPU、AMD GPU,或利用CPU的AVX、AVX2指令集等,实现针对性优化,确保AI模型高效运行。
  • 无需虚拟化:无需搭建虚拟机或配置复杂软件环境,可直接开始AI项目开发,简化流程。
  • 常驻API:在后台运行,可将强大的AI功能与项目无缝对接,无需额外复杂设置,方便将AI功能整合到应用中。

应用场景

  • 开发和测试:开发人员可以使用Ollama在本地快速搭建语言模型环境,用于开发新的语言相关的应用程序。
  • 个人学习和研究:对于研究自然语言处理的学者或者对语言模型感兴趣的个人来说,Ollama提供了一个方便的实验平台。
  • 文本生成:可用于生成各种文本内容,如新闻文章、博客文章、诗歌、代码等。
  • 翻译:能够将文本从一种语言翻译成另一种语言。
  • 问答:可以用于回答用户提出的各种问题。

下面以macOS为例说明一下安装过程,windows和linux类似。

ollama安装

直接访问其官网ollama,点击Download下载安装即可。傻瓜式安装。

安装完成后,ollama会在后台作为服务运行,这时候我们只需要重启一下terminal,然后运行想要的模型即可。

ollama所有支持的模型都可以从这个网站获得运行指令和详细介绍ollama models。

比如我们想用tinyllama模型,就直接执行ollama run tinyllama

类似docker image,经过一个pull的过程后,就可以使用了。

如果想使用deepseek-r1模型,直接运行ollama run deepseek-r1即可。

现在只能在terminal上使用大模型,略显不方便。如果有个web界面就好了。open-webui就是和ollama深度集成的webui界面,类似chatgpt的。而且不需要额外做什么,安装ollama后,open-webui会自动检测已经安装的模型,选择对应模型使用即可。

open-webui介绍

Open-WebUI是一个可扩展、功能丰富且用户友好的自托管AI平台,
在其官方github的介绍上,就注明了与ollama可以集成。

以下是具体介绍:

特点

  • 部署便捷:可使用Docker或Kubernetes(kubectl、kustomize或helm)进行无缝安装,支持ollama和cuda tagged镜像,轻松搭建AI环境。
  • 集成能力强:能与Ollama、OpenAI兼容的API集成,还可自定义OpenAI API的URL,连接到LM Studio、Groq Cloud、Mistral、Open Router等。
  • 安全与权限管理精细:支持基于角色的访问控制(RBAC),管理员可创建详细的用户角色和权限,确保只有授权人员能访问Ollama及相关敏感信息,且模型创建/拉取权限专属于管理员。
  • 多端适配好:采用响应式设计,在桌面PC、笔记本电脑和移动设备上都能提供无缝的使用体验;还提供适用于移动设备的渐进式Web应用程序(PWA),可在localhost上离线访问,提供类似原生应用的界面。
  • 多语言支持:具备国际化(i18n)支持,用户可使用自己熟悉的语言操作平台,且项目方积极寻求贡献者来扩展支持的语言种类。

功能

  • 文本交互增强:支持完整的Markdown和LaTeX功能,便于用户进行结构化文档创建和数学表达式输入;还支持提示预设,可通过聊天输入中的命令立即访问预设提示,也可通过Open WebUI社区集成轻松导入提示。
  • 多媒体交互:支持免提语音/视频通话,使聊天环境更具动态性和互动性;集成图像生成功能,可使用AUTOMATIC1111 API(本地)、ComfyUI(本地)和OpenAI的DALL-E(外部)等生成图像,丰富聊天体验。
  • 模型管理与操作:可通过Web UI轻松创建Ollama模型,包括创建和添加自定义角色/代理、自定义聊天元素、导入模型等;支持GGUF文件模型创建,能直接从Web UI上传GGUF文件,也可选择从计算机上传或从Hugging Face下载。
  • 代码与工具集成:提供原生Python函数调用工具,在工具工作区中有内置的代码编辑器支持,用户可添加纯Python函数,实现与LLMs的无缝集成;支持Pipelines插件框架,可将自定义逻辑和Python库集成到Open WebUI中。
  • 搜索与浏览:集成本地RAG,支持将文档直接加载到聊天中或添加到文档库,通过#命令访问;支持网页搜索,可使用SearxNG、Google PSE、Brave Search等多种搜索引擎,并将结果注入聊天;可通过#命令+URL将网站集成到聊天中。

应用场景

  • AI开发与研究:为开发者和研究人员提供了一个便捷的平台,方便他们快速搭建AI模型的测试和开发环境,进行模型的调试、优化等工作,加速AI项目的研发进程。
  • 智能客服与聊天机器人:可集成各种语言模型,构建智能客服系统或聊天机器人,为用户提供快速、准确的信息解答和服务支持,提升客户服务体验。
  • 内容创作与辅助:帮助内容创作者生成文章、故事、诗歌等各种文本内容,提供创作灵感和思路,提高创作效率和质量。
  • 教育与培训:在教育领域可用于构建智能辅导系统,根据学生的问题和学习情况提供个性化的解答和指导;也可作为培训工具,帮助学员更好地理解和掌握知识。

open-webui安装

在terminal直接执行pip install open-webui即可。安装完成后,执行open-webui serve

不过经过我测试,在MacBook的safari浏览器上,输入http://0.0.0.0:8080不行,127.0.0.1:8080是可以的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/67781.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

游戏引擎 Unity - Unity 启动(下载 Unity Editor、生成 Unity Personal Edition 许可证)

Unity Unity 首次发布于 2005 年,属于 Unity Technologies Unity 使用的开发技术有:C# Unity 的适用平台:PC、主机、移动设备、VR / AR、Web 等 Unity 的适用领域:开发中等画质中小型项目 Unity 适合初学者或需要快速上手的开…

【开源免费】基于Vue和SpringBoot的公寓报修管理系统(附论文)

本文项目编号 T 186 ,文末自助获取源码 \color{red}{T186,文末自助获取源码} T186,文末自助获取源码 目录 一、系统介绍二、数据库设计三、配套教程3.1 启动教程3.2 讲解视频3.3 二次开发教程 四、功能截图五、文案资料5.1 选题背景5.2 国内…

《苍穹外卖》项目学习记录-Day11订单统计

根据起始时间和结束时间,先把begin放入集合中用while循环当begin不等于end的时候,让begin加一天,这样就把这个区间内的时间放到List集合。 查询每天的订单总数也就是查询的时间段是大于当天的开始时间(0点0分0秒)小于…

【python】python油田数据分析与可视化(源码+数据集)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。 【python】python油田数据分析与可视化&#xff08…

FBX SDK的使用:基础知识

Windows环境配置 FBX SDK安装后,目录下有三个文件夹: include 头文件lib 编译的二进制库,根据你项目的配置去包含相应的库samples 官方使用案列 动态链接 libfbxsdk.dll, libfbxsdk.lib是动态库,需要在配置属性->C/C->预…

一文讲解HashMap线程安全相关问题(上)

HashMap不是线程安全的,主要有以下几个问题: ①、多线程下扩容会死循环。JDK1.7 中的 HashMap 使用的是头插法插入元素,在多线程的环境下,扩容的时候就有可能导致出现环形链表,造成死循环。 JDK 8 时已经修复了这个问…

python学习——常用的内置函数汇总

文章目录 类型转换函数数学函数常用的迭代器操作函数常用的其他内置函数 类型转换函数 数学函数 常用的迭代器操作函数 实操: from cv2.gapi import descr_oflst [55, 42, 37, 2, 66, 23, 18, 99]# (1) 排序操作 asc_lst sorted(lst) # 升序 desc_lst sorted(l…

MySQL数据库环境搭建

下载MySQL 官网:https://downloads.mysql.com/archives/installer/ 下载社区版就行了。 安装流程 看b站大佬的视频吧:https://www.bilibili.com/video/BV12q4y1477i/?spm_id_from333.337.search-card.all.click&vd_source37dfd298d2133f3e1f3e3c…

如何用微信小程序写春联

​ 生活没有模板,只需心灯一盏。 如果笑能让你释然,那就开怀一笑;如果哭能让你减压,那就让泪水流下来。如果沉默是金,那就不用解释;如果放下能更好地前行,就别再扛着。 一、引入 Vant UI 1、通过 npm 安装 npm i @vant/weapp -S --production​​ 2、修改 app.json …

[SAP ABAP] 静态断点的使用

在 ABAP 编程环境中,静态断点通过关键字BREAK-POINT实现,当程序执行到这一语句时,会触发调试器中断程序的运行,允许开发人员检查当前状态并逐步跟踪后续代码逻辑 通常情况下,在代码的关键位置插入静态断点可以帮助开发…

96,【4】 buuctf web [BJDCTF2020]EzPHP

进入靶场 查看源代码 GFXEIM3YFZYGQ4A 一看就是编码后的 1nD3x.php 访问 得到源代码 <?php // 高亮显示当前 PHP 文件的源代码&#xff0c;用于调试或展示代码结构 highlight_file(__FILE__); // 关闭所有 PHP 错误报告&#xff0c;防止错误信息泄露可能的安全漏洞 erro…

基于深度学习的输电线路缺陷检测算法研究(论文+源码)

输电线路关键部件的缺陷检测对于电网安全运行至关重要&#xff0c;传统方法存在效率低、准确性不高等问题。本研究探讨了利用深度学习技术进行输电线路关键组件的缺陷检测&#xff0c;目的是提升检测的效率与准确度。选用了YOLOv8模型作为基础&#xff0c;并通过加入CA注意力机…

3、从langchain到rag

文章目录 本文介绍向量和向量数据库向量向量数据库 索引开始动手实现rag加载文档数据并建立索引将向量存放到向量数据库中检索生成构成一条链 本文介绍 从本节开始&#xff0c;有了上一节的langchain基础学习&#xff0c;接下来使用langchain实现一个rag应用&#xff0c;并稍微…

DeepSeek-R1大模型本地化部署

前言 Ollama作为一个轻量级、易上手的工具&#xff0c;可以帮助你在自己的电脑上快速部署和运行大型语言模型&#xff0c;无需依赖云端服务。通过加载各种开源模型&#xff0c;比如LLaMA、GPT-J等&#xff0c;并通过简单的命令行操作进行模型推理和测试。 此小结主要介绍使用…

【高级篇 / IPv6】(7.6) ❀ 03. 宽带IPv6 - ADSL拨号宽带上网配置 ❀ FortiGate 防火墙

【简介】大部分ADSL拨号宽带都支持IPv6&#xff0c;这里以ADSL拨号宽带为例&#xff0c;演示在FortiGate防火墙上的配置方法。 准备工作 同上篇文章一样&#xff0c;为了兼顾不熟悉FortiGate防火墙的朋友&#xff0c;我们从基础操作进行演示&#xff0c;熟练的朋友可以跳过这一…

Linux第104步_基于AP3216C之I2C实验

Linux之I2C实验是在AP3216C的基础上实现的&#xff0c;进一步熟悉修改设备树和编译设备树&#xff0c;以及学习如何编写I2C驱动和APP测试程序。 1、AP3216C的原理图 AP3216C集成了一个光强传感器ALS&#xff0c;一个接近传感器PS和一个红外LED&#xff0c;为三合一的环境传感…

基于单片机的盲人智能水杯系统(论文+源码)

1 总体方案设计 本次基于单片机的盲人智能水杯设计&#xff0c;采用的是DS18B20实现杯中水温的检测&#xff0c;采用HX711及应力片实现杯中水里的检测&#xff0c;采用DS1302实现时钟计时功能&#xff0c;采用TTS语音模块实现语音播报的功能&#xff0c;并结合STC89C52单片机作…

高清种子资源获取指南 | ✈️@seedlinkbot

在如今的数字时代&#xff0c;高清影视、音乐、游戏等资源的获取方式不断丰富。对于追求高质量资源的用户而言&#xff0c;一个高效的资源分享平台至关重要。而 ✈️seedlinkbot 正是这样一个便捷的资源获取工具&#xff0c;为用户提供高质量的种子资源索引和下载信息。 1. ✈️…

Spring Boot项目如何使用MyBatis实现分页查询

写在前面&#xff1a;大家好&#xff01;我是晴空๓。如果博客中有不足或者的错误的地方欢迎在评论区或者私信我指正&#xff0c;感谢大家的不吝赐教。我的唯一博客更新地址是&#xff1a;https://ac-fun.blog.csdn.net/。非常感谢大家的支持。一起加油&#xff0c;冲鸭&#x…

【论文笔记】Fast3R:前向并行muti-view重建方法

众所周知&#xff0c;DUSt3R只适合做稀疏视角重建&#xff0c;与sapnn3r的目的类似&#xff0c;这篇文章以并行的方法&#xff0c;扩展了DUSt3R在多视图重建中的能力。 abstract 多视角三维重建仍然是计算机视觉领域的核心挑战&#xff0c;尤其是在需要跨不同视角实现精确且可…