【AI大模型】Ollama部署本地大模型DeepSeek-R1,交互界面Open-WebUI,RagFlow构建私有知识库

文章目录

  • DeepSeek介绍
    • 公司背景
    • 核心技术
    • 产品与服务
    • 应用场景
    • 优势与特点
    • 访问与体验
    • 各个DeepSeek-R系列模型的硬件需求和适用场景
  • Ollama
    • 主要特点
    • 优势
    • 应用场景
    • 安装和使用
    • 配置环境变量
    • 总结
  • 安装open-webui
    • 下载和安装docker desktop
    • 配置镜像源
    • 安装open-webui
    • 运行和使用
  • RagFlow介绍
    • 主要功能
    • 适用场景
    • 优势
    • 下载及安装
    • 私有知识库
      • 1. 模型供应商配置
      • 2. 创建知识库
      • 3. 创建数据集
      • 4. 创建助理和对话

在这里插入图片描述

个人主页:道友老李
欢迎加入社区:道友老李的学习社区

DeepSeek介绍

DeepSeek官网

DeepSeek(深度求索)是一家专注于实现通用人工智能(AGI)的中国科技公司,致力于通过技术探索与创新,推动智能技术的广泛应用。以下是其核心信息的概述:


公司背景

  • 成立时间:2023年(具体时间未公开披露)
  • 总部:中国杭州
  • 使命:通过AGI技术提升人类生产力,推动社会进步。
  • 愿景:成为全球AGI领域的领导者。

核心技术

  1. 大语言模型(LLM)

    • 自主研发高性能基座模型(如DeepSeek-R1、DeepSeek-R2),支持长文本理解、复杂推理和多语言处理。
    • 模型参数量覆盖数十亿至千亿级,平衡性能与计算效率。
  2. 多模态AI

    • 整合文本、图像、语音等多模态数据,开发跨模态理解与生成能力。
  3. 搜索增强技术

    • 结合搜索引擎实时数据,提升模型在知识更新与事实准确性上的表现。

产品与服务

  • 通用大模型:面向开发者的开放API(如DeepSeek API),支持文本生成、代码编写等任务。
  • 行业定制模型:针对金融、医疗、教育等领域提供垂直场景优化方案。
  • 企业级平台:提供模型训练、部署及管理的全流程工具链(如Fine-tuning平台)。
  • 开源社区:部分模型和技术开源,促进开发者协作(如发布轻量版模型)。

应用场景

  • 智能客服:自动化应答与客户意图分析。
  • 内容生成:营销文案、代码、报告等自动化创作。
  • 数据分析:从非结构化数据中提取洞察,辅助决策。
  • 教育:个性化学习助手与智能题库生成。

优势与特点

  • 技术领先:模型性能在多项基准测试(如MMLU、HumanEval)中位居前列。
  • 场景深耕:聚焦企业级需求,提供高可用的行业解决方案。
  • 生态合作:与云计算厂商、硬件供应商及高校建立联合实验室。

访问与体验

  • 官网提供在线体验入口(如Chat界面)和开发者文档。
  • 部分模型可通过Hugging Face、GitHub等平台获取。

如需更详细的技术参数、商业合作或最新动态,建议访问其官方网站或查阅官方发布的白皮书。

各个DeepSeek-R系列模型的硬件需求和适用场景

在这里插入图片描述
我的电脑配置:
在这里插入图片描述
可以跑7b和14b

Ollama

ollama search

Ollama 是一个开源的 AI 推理框架,专注于模型压缩和部署。它的目标是帮助用户在本地或边缘设备上高效运行大型语言模型(LLM),通过量化和其他技术显著减少模型大小,同时保持高性能。

主要特点

  1. 模型压缩与优化

    • Ollama 提供了多种模型压缩技术,如 4-bit 和 8-bit 量化,使大模型能够在低资源环境下运行。
    • 支持主流语言模型(如 LLaMA、Vicuna 等)的适配和部署。
  2. 高性能推理

    • Ollama 能够在本地设备上实现低延迟、高吞吐量的推理,适合实时应用。
  3. 易于部署

    • 提供简洁的命令行界面(CLI),用户可以轻松下载模型、调整参数并运行推理服务。
    • 支持 Docker 部署,便于在云服务器或边缘设备上快速搭建。
  4. 社区驱动

    • Ollama 是一个开源项目,依赖于活跃的社区支持,用户可以根据需求贡献和改进功能。

优势

  • 轻量化:通过量化技术显著降低模型大小,适合资源受限的环境。
  • 高性能:优化了推理速度,能够在本地快速响应。
  • 灵活性:支持多种模型格式和后端(如 GGML、TensorRT 等)。
  • 易于上手:用户无需复杂的配置即可开始使用。

应用场景

  1. 本地开发与实验

    • 开发者可以轻松在本地运行 LLM,用于快速测试和原型设计。
  2. 边缘计算

    • 在边缘设备(如 Raspberry Pi)上部署轻量级 AI 服务。
  3. 实时推理服务

    • 快速搭建支持多语言模型的推理服务器,满足企业或个人需求。
  4. 教育与研究

    • 提供了一个易于使用的工具,适合教学和研究场景。

安装和使用

国内下载:Ollama下载

  1. 打开cmd控制台,输入:

    ollama
    

    可以看到帮助命令
    在这里插入图片描述

  2. 下载模型(以 DeepSeek-R系列为例):

    ollama pull deepseek-r1:1.5b
    
  3. 启动推理服务:

    ollama serve --port 11434
    
  4. 运行模型:

     ollama run deepseek-r1:1.5b
    

可以开始对话了。

配置环境变量

在这里插入图片描述
OLLAMA_MODELS 是修改OLLAMA下载的模型存储位置,默认是在C盘

总结

Ollama 是一个强大的工具,旨在简化大型语言模型的部署和推理过程。它通过模型压缩和优化技术,使得在本地或边缘设备上运行 AI 模型变得高效且易于管理。无论是开发者、研究人员还是企业用户,Ollama 都能提供灵活和支持,满足多种应用场景的需求。

安装open-webui

下载和安装docker desktop

官网地址:Docker Desktop
在这里插入图片描述

GitHub地址:Docker Desktop

在这里插入图片描述

配置镜像源

在这里插入图片描述
第一个是阿里云的镜像源,可登录阿里云平台查看

"registry-mirrors": ["https://${阿里云的}.mirror.aliyuncs.com","https://docker.m.daocloud.io","https://mirror.baidubce.com","https://docker.nju.edu.cn","https://mirror.iscas.ac.cn"]

安装open-webui

搜索open-webui
在这里插入图片描述
在这里插入图片描述
我这里已经安装过了。

运行和使用

在容器中运行open-webui,然后浏览器输入http://localhost:3000
在这里插入图片描述
进入设置
在这里插入图片描述
配置Ollama地址
在这里插入图片描述
配置好后,保存,正常的情况下,界面就会显示Ollama中已下载好的模型了
在这里插入图片描述
完成!可以开始对话了!

RagFlow介绍

RagFlow 是一个基于大语言模型的流程自动化工具,旨在帮助用户通过自然语言处理(NLP)技术来自动化和优化工作流程。它结合了先进的AI技术和直观的用户界面,使得非技术人员也能轻松实现流程自动化。

主要功能

  1. 智能对话交互:用户可以通过与RagFlow进行自然语言对话,定义、管理和优化各种工作流程。
  2. 任务自动化:支持多种任务类型,如数据处理、信息提取、报告生成等,帮助用户自动完成重复性工作。
  3. 跨系统集成:能够与主流的第三方服务(如Slack、Jira、Google Drive等)无缝集成,实现不同系统的数据流动和协同工作。
  4. 动态流程调整:根据实时数据和上下文环境,智能调整工作流程,确保流程始终高效运行。
  5. 可扩展性:支持大规模业务需求,适用于从个人到企业的各种场景。

适用场景

  • 企业流程优化:帮助企业在销售、 marketing、客服等环节实现自动化,提升效率。
  • 个人任务管理:用户可以通过RagFlow自动化个人日常任务,如行程安排、邮件处理等。
  • 数据整合与分析:通过自动化数据收集和处理,支持更高效的决策制定。

优势

  • 易用性:无需编程知识,用户即可快速上手。
  • 灵活性:支持定制化需求,满足不同用户的个性化要求。
  • 高效性:利用AI技术提升流程执行效率,减少人工干预。

RagFlow 通过将复杂的流程自动化转化为简单的对话交互,极大地提升了工作效率和用户体验。如果你有具体的使用场景或问题,可以进一步探讨如何利用RagFlow来优化你的工作流程!

下载及安装

  1. 从github上下载 ragflow或直接:
git clone https://github.com/infiniflow/ragflow.git
  1. 运行脚本:进入docker 文件夹,利用提前编译好的 Docker 镜像启动服务器
docker compose -f docker-compose-CN.yml up -d

这个过程会很慢,成功后,会自动运行容器中的服务:
在这里插入图片描述
浏览器上输入:http://localhost
在这里插入图片描述
第一个注册的账号就是管理员,登录成功
在这里插入图片描述

私有知识库

1. 模型供应商配置

点击头像,进入模型供应商配置
在这里插入图片描述
选择下面列表中的Ollama,然后进行模型配置
在这里插入图片描述
模型名称就是Ollama中下载的模型名称

2. 创建知识库

在这里插入图片描述
解析方法改成General,其他默认即可
在这里插入图片描述

3. 创建数据集

在这里插入图片描述
新增本地文件
在这里插入图片描述
执行解析,等待解析完成
在这里插入图片描述
在这里插入图片描述

4. 创建助理和对话

切换到聊天页,新建助理,选择知识库
在这里插入图片描述

切换到模型设置,调整一下最大token数
在这里插入图片描述
新建聊天,开始对话
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/895408.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

更加通用的Hexo多端部署原理及实现,适用于各种系统之间

本文推荐在作者的个人博客网站阅读:shenying.online 一、故事背景 故事发生在大学上学期间(而不是寒假)。上学期间,宿舍条件极其恶劣,半夜断电、空间狭小。我们大学垃圾条件使用游戏本的种种弊端被无限放大&#xff1…

开源、免费项目管理工具比较:2025最新整理30款

好用的开源、免费版项目管理系统有:1.Redmine;2. Taiga;3. OpenProject; 4.ProjectLibre; 5.GanttProject; 6.Tuleap; 7.Trac;8. Phabricator; 9.Notion; 10.…

组织结构改革:激活企业活力的 “源头活水”

难以适应市场变化、内部沟通与协作不畅、决策效率低下、运营成本增加、人才流失严重、员工士气下降、战略目标难以实现……企业如何根据市场环境变化和自身发展需求,灵活调整组织框架,赋能企业的持续健康发展? 某国有投资建设集团旗下的二级…

Mac之JDK安装

Mac之JDK安装 一.安装 jdk 打开终端输入命令:java -version 查看是否已安装 JDK Oracle 官方下载地址 根据自己Mac 系统安装 查看 Mac 系统,打开中断命令,输入: uname -a Compressed Archive 是压缩文档,下载的是一个 .tar.gz 压缩包 D…

【含文档+PPT+源码】基于Python的全国景区数据分析以及可视化实现

项目介绍 本课程演示的是一款基于Python的全国景区数据分析以及可视化实现,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。 包含:项目源码、项目文档、数据库脚本、软件工具等所有资料 带你从零开始部署运行本套系统 该…

SQL注入之布尔和时间盲注,sqli-labs

实验环境: sqli-labs,小皮面板搭建,edge浏览器 apache:2.4.39,MySQL:5.7 PHP:5.39 Python(pycharm2023):3 less-8 布尔盲注: 1.我这里是采用最简单的直接采…

基于SSM的农产品供销小程序+LW示例参考

1.项目介绍 系统角色:管理员、农户功能模块:用户管理、农户管理、产品分类管理、农产品管理、咨询管理、订单管理、收藏管理、购物车、充值、下单等技术选型:SSM,Vue(后端管理web),uniapp等测试…

前端可以不用依赖后端实现导出大数据了

theme: channing-cyan hightlight: channing-cyan 前言 在我们公司表格数据导出都是前端去处理。一开始数据量不大,倒没什么问题。但随着数据量的加大,问题也逐渐暴露出来。 一天的数据量有一来万条,导出一定时间范围的数据,30…

游戏引擎学习第99天

仓库:https://gitee.com/mrxiao_com/2d_game_2 黑板:制作一些光场(Light Field) 当前的目标是为游戏添加光照系统,并已完成了法线映射(normal maps)的管道,但还没有创建可以供这些正常映射采样的光场。为了继续推进&…

通过 Docker 安装和部署 KeyDB v6.3.4 的详细步骤

KeyDB 是一种高性能的开源内存数据库,最初是基于 Redis 项目开发的,但在性能、特性和功能上进行了许多增强和改进。它兼容 Redis 的大部分命令和数据结构,因此可以作为 Redis 的替代品使用,尤其是在需要更高性能和多线程支持的场景…

Android Studio 打包App问题

一、场景 windows 电脑C 盘空间越来越少,所有软件默认位置都往C盘用户目录写入数据,于是开始准备整理,Android Studio 相关的 .android 和 .gradle 目录成为了目标。 二、问题出现 1、将C盘的.gradle 目录拷贝到D盘,文件比较大&a…

鸿蒙HarmonyOS NEXT开发:横竖屏切换开发实践

文章目录 一、概述二、窗口旋转说明1、配置module.json5的orientation字段2、调用窗口的setPreferredOrientation方法 四、性能优化1、使用自定义组件冻结2、对图片使用autoResize3、排查一些耗时操作 四、常见场景示例1、视频类应用横竖屏开发2、游戏类应用横屏开发 五、其他常…

linux安装jdk 许可证确认 user did not accept the oracle-license-v1-1 license

一定要接受许可证,不然会出现 一、添加 ppa第三方软件源 sudo add-apt-repository ppa:ts.sch.gr/ppa二、更新系统软件包列表 sudo apt-get update三、接受许可证 echo debconf shared/accepted-oracle-license-v1-1 select true | sudo debconf-set-selection…

DeepSeek 助力 Vue 开发:打造丝滑的进度条

前言:哈喽,大家好,今天给大家分享一篇文章!并提供具体代码帮助大家深入理解,彻底掌握!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 目录 Deep…

2025年SEO自动优化工具

随着2025年互联网的快速发展,越来越多的企业和个人意识到,拥有一个排名靠前的网站对于吸引客户、增加流量、提高转化率至关重要。而要想让自己的网站脱颖而出,获得更多曝光,最重要的一项工作就是进行SEO优化。传统的SEO优化方式通…

华硕笔记本怎么一键恢复出厂系统_华硕笔记本一键恢复出厂系统教程

华硕笔记本怎么一键恢复出厂系统? 华硕一键恢复出厂系统是一个安全、高效、方便的恢复方式,让您轻松还原出厂设置,以获得更好的系统性能。如果您的华硕电脑遇到问题,可以使用华硕一键恢复出厂系统功能。下面小编就教大家华硕笔记本…

Unity 编辑器热更C# FastScriptReload

工具源码:https://github.com/handzlikchris/FastScriptReload 介绍 用于运行时修改C#后能快速重新编译C#并生效,避免每次改C#,unity全部代码重新编译,耗时旧且需要重启游戏。 使用 需要手动调整AssetPipeline自动刷新模式&…

vue纯静态实现 视频转GIF 功能(附源码)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、实现后的效果二、使用步骤1.引入库2.下载or复制出来js3. 前端实现 总结 前言 一天一个小demo 今天来一个vue纯静态实现 视频转GIF 功能 上一篇我们讲到了…

因果机器学习(CausalML)前沿创新思路

结合了传统因果推断与机器学习的因果机器学习是目前AI领域的前沿研究方向,其核心优势在于将因果逻辑融入数据驱动模型,从根本上解决了传统方法的缺陷。因此,它也是突破传统机器学习瓶颈的关键方向,不仅当下热度高,在未…

【CubeMX+STM32】SD卡 U盘文件系统 USB+FATFS

本篇,将使用CubeMXKeil, 创建一个 USBTF卡存储FatFS 的虚拟U盘读写工程。 目录 一、简述 二、CubeMX 配置 SDIO DMA FatFs USB 三、Keil 编辑代码 四、实验效果 串口助手,实现效果: U盘,识别效果: 一、简述 上…