玄子Share-本地部署 AI 大模型与构建知识库

玄子Share-本地部署 AI 大模型与构建知识库

部署环境概述

警告!OpenAI 宣布全面封锁中国 API 接入

昨天,许多开发者从 OpenAI 那收到了一份警告信

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

您好, 据我们的数据监测,贵组织正从 OpenAl 当前未支持的区域产生 API 访问流量。
您可以在官网查阅我们所支持的国家与地区名单。
请注意,自 79 日起,我们将对不在此支持名单上的区域实施 API 访问限制措施。
为了确保持续使用 OpenAl的各项服务,请在被支持的区域内登录访问。如有疑问,欢迎访问我们的帮助中心寻求解答。谢谢,
OpenAl 团队

大家都懂

本地部署 AI 大模型

  • 数据安全与隐私保护:在本地环境中运行AI模型,避免了将敏感数据传输至云端的风险,确保了用户数据的安全性和隐私性。
  • 稳定可靠的计算环境:无需依赖互联网连接或外部服务的稳定性,本地部署保障了应用服务的持续可用性,不受网络状况波动的影响。
  • 高性能与低延迟:利用本地资源进行模型推理可以显著减少响应时间,并优化整体性能,尤其是在处理实时请求时更为关键。
  • 定制化与控制:本地部署允许开发者根据具体需求调整模型配置和参数,实现高度的个性化服务构建,同时便于监控和维护模型性能。
  • 成本效益:对于企业来说,无需支付高昂的数据传输费用或订阅大型云平台的服务,尤其是在处理大规模数据集时,本地部署可以显著降低整体运营成本。
  • API调用与外部服务提供:通过API集成,本地部署的AI模型能够无缝地与其他系统和服务对接,增强业务流程自动化和智能化水平,为用户提供更加便捷、高效的体验。

构建 AI 模型知识库

  • 知识抽取与编码:首先,对本地的文本或文档进行处理,提取其中的关键信息和专业知识点,并将这些内容转化为向量表示。这通常利用预训练的语言模型(如BERT、ELMo等)来进行语言理解以及上下文理解。
  • 领域知识整合:通过构建针对特定领域的知识图谱或者使用相关的专业词汇库,帮助AI系统更好地理解与领域相关的问题和语境。这些知识可以是行业标准、术语、常见问题解答或专业知识点的集合。
  • 模型集成与优化:将生成的向量数据集成到现有AI系统中,通过调整或训练额外的模块使其能够理解和回应基于这些特定领域知识的问题。这可能包括对原始预训练模型进行微调(fine-tuning),以适应特定领域的语言和语境。
  • 强化学习与反馈循环:利用强化学习技术让AI在特定领域内进行自我优化,通过实际用户交互或专家评估来调整其响应策略,进一步提高准确性和相关性。
  • 持续更新与维护:随着新知识的积累和领域的发展,定期更新和扩展知识库,确保AI系统能够跟上行业动态,并提供更加精确、及时的答案。

总而言之,本地部署,训练数据,远程调用

下载 Ollama

官网下载 Ollama:https://ollama.com/

根据自己操作系统版本下载,下载完成后直接安装即可

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

配置 Ollama

大模型默认安装至C:\Users\Administrator\.ollama

模型大小普遍在 4~8G,有需求可配置环境变量,修改安装位置OLLAMA_MODELS

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

选择大模型

Ollama 官网右上角进入模型仓储,选择大模型下载,这里选用国产大模型 Qwen2

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

拉取大模型

大模型有多个参数,本地部署选用 qwen2:7b 即可,复制命令到 cmd 拉取

需科学上网,若无法拉取,可尝试直接复制大模型文件

ollama run qwen2:7b

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

若无模型训练需求,此时就可以直接使用了,可安装 open-webui https://github.com/open-webui/open-webui,以图形界面使用 AI 服务

嵌入式模型

使用 嵌入模型将本地文件或网络链接,转为向量信息,供 Qwen2 回答使用

ollama pull nomic-embed-text

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

构建知识库

官网下载 AnythingLLM:https://useanything.com/

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

配置知识库

选择基础大模型 Qwen2

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

选择嵌入模型

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

选择向量数据库

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

上传本地文件

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

转为向量数据

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

开始提问

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

API 接口调用

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

玄子Share-本地部署 AI 大模型与知识库 2024.06.26

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/35305.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ai智能写作助手有哪些?3款AI工具推荐

ai智能写作助手有哪些?在数字化时代的浪潮中,AI智能写作助手如同智慧的灯塔,照亮了创作者们的道路。它们不仅极大地提升了写作效率,让文字流淌更加顺畅,更能够深入挖掘和激发创作者的内在灵感,将创意的火花…

github配置可拉取项目到本地

首先配置用户名和邮箱: git config --global user.name 自己的名字git config --global user.email 自己的邮箱配置完之后检查一下: git config --global user.namegit config --global user.email如果提示的是自己配置好的名字和邮箱就Ok 然后拉取githu…

Luminar Neo 1.20.0 (macOS Universal) - 创新 AI 图像编辑器

Luminar Neo 1.20.0 (macOS Universal) - 创新 AI 图像编辑器 利用尖端的人工智能生成技术,轻松增强照片效果 请访问原文链接:https://sysin.org/blog/luminar-neo/,查看最新版。原创作品,转载请保留出处。 作者主页&#xff1…

Linux系统学习——指令四

Linux系统学习——指令四 Linux 系统学习——指令四查看文件MD5校验和fuser 指令基本语法常用选项访问类型使用示例 系统信息 Linux 系统学习——指令四 查看文件MD5校验和 在Linux中,你可以使用 md5sum 命令来查看一个文件的MD5校验和。以下是具体的操作方法&…

河南资信乙级预评价:人员需缴唯一社保吗?

河南资信乙级预评价中,人员确实需要缴纳唯一社保。以下是详细的解读和归纳: 一、社保唯一性的定义 社保唯一性指的是参与河南资信乙级预评价的咨询工程师(投资)必须在申请单位有唯一且连续的社保缴纳记录。这一要求旨在确保咨询…

【python013】pyinstaller打包PDF提取脚本为exe工具

1.在日常工作和学习中,遇到类似问题处理场景,如pdf文件核心内容截取,这里将文件打包成exe可执行文件,实现功能简便使用。 2.欢迎点赞、关注、批评、指正,互三走起来,小手动起来! 3.欢迎点赞、关…

Pura 70 系列超高速风驰闪拍,捕捉美好,告别抓拍模糊

及时而准确的将画面定格,把事件最具有表现力的瞬间直观、真实地传达给观者,以使将抓拍影响的意义发挥最大化,由于抓拍摄影作品大多反映的是比较自然,真实的人和事,得到了社会的广泛认可,抓拍摄影也正日益成…

vue项目无后台版本打包上传到服务器

打包项目 也可以在文件目录下npm run build 生成dist文件夹 将dist文件夹里的所有文件拷贝到站点的根目录,这里使用宝塔面板进行操作 前提你得先创建站点,域名绑定等操作

#03动态规划

要点: 动态规划方法与贪心法、分治法的异同; 动态规划方法的基本要素与求解步骤; 动态规划方法的应用。 难点: 如何根据问题的最优子结构性质构造构造动态规划方法中的递归公式或动态规划方程。 动态规划的基本思想 动态规…

【计算机网络仿真】b站湖科大教书匠思科Packet Tracer——实验9 IPv4地址 — 划分子网

一、实验目的 1.学习划分子网的方法; 2.验证子网掩码的作用。 二、实验要求 1.使用Cisco Packet Tracer仿真平台; 2.观看B站湖科大教书匠仿真实验视频,完成对应实验。 三、实验内容 1.构建网络拓扑; 2.划分子网; …

vscode_cmake_stm32_lvgl移植及显示优化

1 LVGL移植 本文使用的环境如下: STM32H743FreeRTOSst7789 lcd(320*240) 下载 LVGL源码,本文使用Release v9.1.0; 将压缩包解压到工程目录,例如stm32h7xx_cmake_project/components/lvgl-9.1.0,如下所示: …

算法04 模拟算法之一维数组相关内容详解【C++实现】

大家好,我是bigbigli,模拟算法我们将分为几个章节来讲,今天我们只看一维数组相关的题目 目录 模拟的概念 训练:开关灯 解析 参考代码 训练:数组变化 解析 参考代码 训练:折叠游戏 解析 参考代码 …

[leetcode]rotate-array 轮转数组

. - 力扣&#xff08;LeetCode&#xff09; class Solution { public:void reverse(vector<int>& nums, int start, int end) {while (start < end) {swap(nums[start], nums[end]);start 1;end - 1;}}void rotate(vector<int>& nums, int k) {k % num…

酷开系统丨酷开科技AI赋能数字大屏,开启智能家居新纪元

在当今数字化时代&#xff0c;人工智能&#xff08;AI&#xff09;技术的崛起无疑为科技领域带来了革命性的变化。酷开科技&#xff0c;正以其独特的"AI数字大屏"战略&#xff0c;将创新理念转化为现实&#xff0c;引领行业发展新潮流。 酷开科技的智能电视操作系统…

BarTender版软件下载及安装教程

​根据行业数据显示强大的配套应用软件甚至能够管理系统安全性、网络打印功能、文档发布、打印作业记录等&#xff0c;为满足不同的需要和预算&#xff0c;BarTender 提供四个版本&#xff0c;每个都拥有卓越的功能和特性。根据软件大数据显示多国语言支持&#xff1a;轻松设计…

文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《兼顾配电网韧性提升的电动汽车换电站容量优化配置方法 》

本专栏栏目提供文章与程序复现思路&#xff0c;具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

6.25长难句打卡

“Carry a book with you at all times” can actually work, too—providing you dip in often enough, so that reading becomes the default state from which you temporarily surface to take care of business, before dropping back down. “随时随身携带书籍”实际上也…

【Launcher3】解决谷歌桌面的小部件重启后消失问题

1-问题摘要 这次主要解决困扰了我很久的时钟消失问题&#xff0c;大概是去年10月刚开始做EDLA项目的时候&#xff0c;需要定制谷歌桌面&#xff0c;桌面布局大概要改成这样&#xff1a; 时间显示在谷歌搜索框的上方,而安卓原生桌面大概是这样子的 我们开发一开始是使用小部件…

web刷题记录

[HDCTF 2023]SearchMaster 打开环境&#xff0c;首先的提示信息就是告诉我们&#xff0c;可以用post传参的方式来传入参数data 首先考虑的还是rce&#xff0c;但是这里发现&#xff0c;不管输入那种命令&#xff0c;它都会直接显示在中间的那一小行里面&#xff0c;而实际的命令…

视觉与运动控制6

基于驱动器的控制功能 驱动器的系统性能和运算能力有限需要单独的运动控制器。 V/F恒压频比控制 开环控制方法&#xff0c;应用最广泛、最简单&#xff0c;只需要电机数据即可。适用于控制精度和动态响应要求不高的应用。控制原理&#xff1a;保持点击内磁通量恒定&#xff…