玄子Share-本地部署 AI 大模型与构建知识库

玄子Share-本地部署 AI 大模型与构建知识库

部署环境概述

警告!OpenAI 宣布全面封锁中国 API 接入

昨天,许多开发者从 OpenAI 那收到了一份警告信

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

您好, 据我们的数据监测,贵组织正从 OpenAl 当前未支持的区域产生 API 访问流量。
您可以在官网查阅我们所支持的国家与地区名单。
请注意,自 79 日起,我们将对不在此支持名单上的区域实施 API 访问限制措施。
为了确保持续使用 OpenAl的各项服务,请在被支持的区域内登录访问。如有疑问,欢迎访问我们的帮助中心寻求解答。谢谢,
OpenAl 团队

大家都懂

本地部署 AI 大模型

  • 数据安全与隐私保护:在本地环境中运行AI模型,避免了将敏感数据传输至云端的风险,确保了用户数据的安全性和隐私性。
  • 稳定可靠的计算环境:无需依赖互联网连接或外部服务的稳定性,本地部署保障了应用服务的持续可用性,不受网络状况波动的影响。
  • 高性能与低延迟:利用本地资源进行模型推理可以显著减少响应时间,并优化整体性能,尤其是在处理实时请求时更为关键。
  • 定制化与控制:本地部署允许开发者根据具体需求调整模型配置和参数,实现高度的个性化服务构建,同时便于监控和维护模型性能。
  • 成本效益:对于企业来说,无需支付高昂的数据传输费用或订阅大型云平台的服务,尤其是在处理大规模数据集时,本地部署可以显著降低整体运营成本。
  • API调用与外部服务提供:通过API集成,本地部署的AI模型能够无缝地与其他系统和服务对接,增强业务流程自动化和智能化水平,为用户提供更加便捷、高效的体验。

构建 AI 模型知识库

  • 知识抽取与编码:首先,对本地的文本或文档进行处理,提取其中的关键信息和专业知识点,并将这些内容转化为向量表示。这通常利用预训练的语言模型(如BERT、ELMo等)来进行语言理解以及上下文理解。
  • 领域知识整合:通过构建针对特定领域的知识图谱或者使用相关的专业词汇库,帮助AI系统更好地理解与领域相关的问题和语境。这些知识可以是行业标准、术语、常见问题解答或专业知识点的集合。
  • 模型集成与优化:将生成的向量数据集成到现有AI系统中,通过调整或训练额外的模块使其能够理解和回应基于这些特定领域知识的问题。这可能包括对原始预训练模型进行微调(fine-tuning),以适应特定领域的语言和语境。
  • 强化学习与反馈循环:利用强化学习技术让AI在特定领域内进行自我优化,通过实际用户交互或专家评估来调整其响应策略,进一步提高准确性和相关性。
  • 持续更新与维护:随着新知识的积累和领域的发展,定期更新和扩展知识库,确保AI系统能够跟上行业动态,并提供更加精确、及时的答案。

总而言之,本地部署,训练数据,远程调用

下载 Ollama

官网下载 Ollama:https://ollama.com/

根据自己操作系统版本下载,下载完成后直接安装即可

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

配置 Ollama

大模型默认安装至C:\Users\Administrator\.ollama

模型大小普遍在 4~8G,有需求可配置环境变量,修改安装位置OLLAMA_MODELS

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

选择大模型

Ollama 官网右上角进入模型仓储,选择大模型下载,这里选用国产大模型 Qwen2

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

拉取大模型

大模型有多个参数,本地部署选用 qwen2:7b 即可,复制命令到 cmd 拉取

需科学上网,若无法拉取,可尝试直接复制大模型文件

ollama run qwen2:7b

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

若无模型训练需求,此时就可以直接使用了,可安装 open-webui https://github.com/open-webui/open-webui,以图形界面使用 AI 服务

嵌入式模型

使用 嵌入模型将本地文件或网络链接,转为向量信息,供 Qwen2 回答使用

ollama pull nomic-embed-text

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

构建知识库

官网下载 AnythingLLM:https://useanything.com/

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

配置知识库

选择基础大模型 Qwen2

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

选择嵌入模型

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

选择向量数据库

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

上传本地文件

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

转为向量数据

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

开始提问

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

API 接口调用

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

玄子Share-本地部署 AI 大模型与知识库 2024.06.26

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/35305.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

通过Spring-Data-Redis操作Redis

目录 一、搭建环境 &#xff08;1&#xff09;引入依赖 &#xff08;2&#xff09;自定义模板序列器 &#xff08;3&#xff09;编写配置文件 &#xff08;4&#xff09;操作方法 二、测试 一、搭建环境 &#xff08;1&#xff09;引入依赖 <dependencies><dep…

ai智能写作助手有哪些?3款AI工具推荐

ai智能写作助手有哪些&#xff1f;在数字化时代的浪潮中&#xff0c;AI智能写作助手如同智慧的灯塔&#xff0c;照亮了创作者们的道路。它们不仅极大地提升了写作效率&#xff0c;让文字流淌更加顺畅&#xff0c;更能够深入挖掘和激发创作者的内在灵感&#xff0c;将创意的火花…

大数据学习之 各种启动命令汇总

各种启动命令汇总&#xff1a; 可以将命令写入到一个可执行文件中&#xff0c;执行更加方便&#xff08;但是要赋予其权限&#xff0c;使其成为可执行文件&#xff1a;chmod x starthive.sh&#xff09; mysql 的启动与停止 # 启动 mysql -uroot -p123456 # 停止 ctrlzredis的启…

github配置可拉取项目到本地

首先配置用户名和邮箱&#xff1a; git config --global user.name 自己的名字git config --global user.email 自己的邮箱配置完之后检查一下&#xff1a; git config --global user.namegit config --global user.email如果提示的是自己配置好的名字和邮箱就Ok 然后拉取githu…

Sublime Text 设置

备份 {"font_size": 10,"index_files": true,"font_face": "Courier New","vintage_start_in_command_mode": false,"ignored_packages": ["Vintage"],"word_wrap": "false" }关闭…

Luminar Neo 1.20.0 (macOS Universal) - 创新 AI 图像编辑器

Luminar Neo 1.20.0 (macOS Universal) - 创新 AI 图像编辑器 利用尖端的人工智能生成技术&#xff0c;轻松增强照片效果 请访问原文链接&#xff1a;https://sysin.org/blog/luminar-neo/&#xff0c;查看最新版。原创作品&#xff0c;转载请保留出处。 作者主页&#xff1…

EasyPOI入门

EasyPOI入门 前言 EasyPOI是一个基于Apache POI的Java库&#xff0c;用于简化Excel文档的导入和导出操作。EasyPOI通过注解的方式&#xff0c;极大地减少了代码量和复杂度&#xff0c;使得Excel操作变得更加简单直观。本篇博客将介绍如何使用EasyPOI进行Excel文件的导入和导出…

Linux系统学习——指令四

Linux系统学习——指令四 Linux 系统学习——指令四查看文件MD5校验和fuser 指令基本语法常用选项访问类型使用示例 系统信息 Linux 系统学习——指令四 查看文件MD5校验和 在Linux中&#xff0c;你可以使用 md5sum 命令来查看一个文件的MD5校验和。以下是具体的操作方法&…

河南资信乙级预评价:人员需缴唯一社保吗?

河南资信乙级预评价中&#xff0c;人员确实需要缴纳唯一社保。以下是详细的解读和归纳&#xff1a; 一、社保唯一性的定义 社保唯一性指的是参与河南资信乙级预评价的咨询工程师&#xff08;投资&#xff09;必须在申请单位有唯一且连续的社保缴纳记录。这一要求旨在确保咨询…

【python013】pyinstaller打包PDF提取脚本为exe工具

1.在日常工作和学习中&#xff0c;遇到类似问题处理场景&#xff0c;如pdf文件核心内容截取&#xff0c;这里将文件打包成exe可执行文件&#xff0c;实现功能简便使用。 2.欢迎点赞、关注、批评、指正&#xff0c;互三走起来&#xff0c;小手动起来&#xff01; 3.欢迎点赞、关…

Pura 70 系列超高速风驰闪拍,捕捉美好,告别抓拍模糊

及时而准确的将画面定格&#xff0c;把事件最具有表现力的瞬间直观、真实地传达给观者&#xff0c;以使将抓拍影响的意义发挥最大化&#xff0c;由于抓拍摄影作品大多反映的是比较自然&#xff0c;真实的人和事&#xff0c;得到了社会的广泛认可&#xff0c;抓拍摄影也正日益成…

vue项目无后台版本打包上传到服务器

打包项目 也可以在文件目录下npm run build 生成dist文件夹 将dist文件夹里的所有文件拷贝到站点的根目录&#xff0c;这里使用宝塔面板进行操作 前提你得先创建站点&#xff0c;域名绑定等操作

直接调用 Java 线程的 run() 方法会发生什么?

文章目录 前言回顾run() 方法 vs start() 方法run()方法start()方法 直接调用 run() 方法的影响直接调用 run() 方法调用 start() 方法 示例解析结论个人简介 前言 在Java中&#xff0c;多线程编程是一个重要的概念&#xff0c;尤其是在处理并发任务时。线程是Java中实现多线程…

Pytest教程:Pytest插件原理

Pytest的插件系统是其强大功能的核心,它允许用户和开发者扩展和定制测试框架的行为。要深入理解Pytest插件的原理,我们需要从Pytest的架构和设计模式开始,然后深入到底层源码。 1.插件原理 1. Pytest的架构和设计模式 Pytest的设计遵循了几个关键的设计模式和原则,包括: …

#03动态规划

要点&#xff1a; 动态规划方法与贪心法、分治法的异同&#xff1b; 动态规划方法的基本要素与求解步骤&#xff1b; 动态规划方法的应用。 难点&#xff1a; 如何根据问题的最优子结构性质构造构造动态规划方法中的递归公式或动态规划方程。 动态规划的基本思想 动态规…

【计算机网络仿真】b站湖科大教书匠思科Packet Tracer——实验9 IPv4地址 — 划分子网

一、实验目的 1.学习划分子网的方法&#xff1b; 2.验证子网掩码的作用。 二、实验要求 1.使用Cisco Packet Tracer仿真平台&#xff1b; 2.观看B站湖科大教书匠仿真实验视频&#xff0c;完成对应实验。 三、实验内容 1.构建网络拓扑&#xff1b; 2.划分子网&#xff1b; …

vscode_cmake_stm32_lvgl移植及显示优化

1 LVGL移植 本文使用的环境如下&#xff1a; STM32H743FreeRTOSst7789 lcd(320*240) 下载 LVGL源码&#xff0c;本文使用Release v9.1.0&#xff1b; 将压缩包解压到工程目录&#xff0c;例如stm32h7xx_cmake_project/components/lvgl-9.1.0&#xff0c;如下所示&#xff1a; …

C#调用微软库的实现语音识别

早期&#xff0c; 我们用SpeechRecognitionEngine如下来进行语音识别&#xff0c;但是复杂的词条加上环境噪声&#xff0c;其实成功率是不高的。 SpeechRecognitionEngine recognizer new SpeechRecognitionEngine(new System.Globalization.CultureInfo("zh-CN"));…

算法04 模拟算法之一维数组相关内容详解【C++实现】

大家好&#xff0c;我是bigbigli&#xff0c;模拟算法我们将分为几个章节来讲&#xff0c;今天我们只看一维数组相关的题目 目录 模拟的概念 训练&#xff1a;开关灯 解析 参考代码 训练&#xff1a;数组变化 解析 参考代码 训练&#xff1a;折叠游戏 解析 参考代码 …

[leetcode]rotate-array 轮转数组

. - 力扣&#xff08;LeetCode&#xff09; class Solution { public:void reverse(vector<int>& nums, int start, int end) {while (start < end) {swap(nums[start], nums[end]);start 1;end - 1;}}void rotate(vector<int>& nums, int k) {k % num…