FastGPT Docker Compose本地部署与硅基流动免费AI接口集成指南

本文参考:https://doc.tryfastgpt.ai/docs/development/

一、背景与技术优势

FastGPT是基于LLM的知识库问答系统,支持自定义数据训练与多模型接入。硅基流动(SiliconFlow)作为AI基础设施平台,提供高性能大模型推理引擎SiliconLLM和免费API服务。通过Docker部署FastGPT并结合硅基流动API,可实现低成本、高灵活性的AI应用开发。

技术优势

  1. 本地数据隐私:敏感数据无需上传云端,符合《数据安全法》要求。

  2. 成本优化:硅基流动提供Qwen2-7B、GLM-4-9B等模型永久免费API,降低Token成本。

  3. 性能加速:硅基流动自研推理引擎SiliconLLM生成速度较开源产品快10倍。

二、环境准备

1. 系统要求

  • 操作系统:Linux(推荐Ubuntu 22.04)

  • 硬件:至少8GB内存,推荐NVIDIA GPU(如RTX 3060)

  • 软件:Docker 24.0+、Docker Compose 2.20+

2. 安装Docker与Docker Compose

Centos7一键安装docker

yum install nano -y

nano install_docker.sh

#!/bin/bash
​
# 设置阿里云的YUM仓库
cat > /etc/yum.repos.d/docker-ce.repo <<EOF
[docker-ce-stable]
name=Docker CE Stable - \$basearch
baseurl=https://mirrors.aliyun.com/docker-ce/linux/centos/7/\$basearch/stable
enabled=1
gpgcheck=1
gpgkey=https://mirrors.aliyun.com/docker-ce/linux/centos/gpg
EOF
​
# 安装所需的包
yum install -y yum-utils device-mapper-persistent-data lvm2
​
# 更新YUM缓存
yum makecache fast
​
# 安装nano
yum -y install nano
​
# 安装Docker CE
yum install -y docker-ce
​
# 启用Docker服务(开机自启)
systemctl enable docker
​
# 启动Docker服务
systemctl start docker
​
echo "Docker has been installed and started!"
​
# chmod +x install_docker.sh;sh install_docker.sh
​

docker阿里云镜像

sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<EOF
{"registry-mirrors": ["https://docker.1panel.live"]
}
EOF
sudo systemctl daemon-reload
sudo systemctl restart docker

三、FastGPT Docker部署

1. 创建项目目录

进入你的安装根目录,例如/home

mkdir fastgpt && cd fastgpt

2. 下载配置文件

curl -O https://raw.githubusercontent.com/labring/FastGPT/main/projects/app/data/config.json
curl -o docker-compose.yml https://raw.githubusercontent.com/labring/FastGPT/main/deploy/docker/docker-compose-pgvector.yml

config.json 2025年4月21日

// 已使用 json5 进行解析,会自动去掉注释,无需手动去除
{"feConfigs": {"lafEnv": "https://laf.dev", // laf环境。 https://laf.run (杭州阿里云) ,或者私有化的laf环境。如果使用 Laf openapi 功能,需要最新版的 laf 。"mcpServerProxyEndpoint": "" // mcp server 代理地址,例如: http://localhost:3005},"systemEnv": {"vectorMaxProcess": 10, // 向量处理线程数量"qaMaxProcess": 10, // 问答拆分线程数量"vlmMaxProcess": 10, // 图片理解模型最大处理进程"tokenWorkers": 30, // Token 计算线程保持数,会持续占用内存,不能设置太大。"hnswEfSearch": 100, // 向量搜索参数,仅对 PG 和 OB 生效。越大,搜索越精确,但是速度越慢。设置为100,有99%+精度。"customPdfParse": {"url": "", // 自定义 PDF 解析服务地址"key": "", // 自定义 PDF 解析服务密钥"doc2xKey": "", // doc2x 服务密钥"price": 0 // PDF 解析服务价格}}
}

docker-compose. yml PgVector版本 2025年4月21日

# 数据库的默认账号和密码仅首次运行时设置有效
# 如果修改了账号密码,记得改数据库和项目连接参数,别只改一处~
# 该配置文件只是给快速启动,测试使用。正式使用,记得务必修改账号密码,以及调整合适的知识库参数,共享内存等。
# 如何无法访问 dockerhub 和 git,可以用阿里云(阿里云没有arm包)
​
version: '3.3'
services:# dbpg:image: pgvector/pgvector:0.8.0-pg15 # docker hub# image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.8.0-pg15 # 阿里云container_name: pgrestart: always# ports: # 生产环境建议不要暴露#   - 5432:5432networks:- fastgptenvironment:# 这里的配置只有首次运行生效。修改后,重启镜像是不会生效的。需要把持久化数据删除再重启,才有效果- POSTGRES_USER=username- POSTGRES_PASSWORD=password- POSTGRES_DB=postgresvolumes:- ./pg/data:/var/lib/postgresql/datamongo:image: mongo:5.0.18 # dockerhub# image: registry.cn-hangzhou.aliyuncs.com/fastgpt/mongo:5.0.18 # 阿里云# image: mongo:4.4.29 # cpu不支持AVX时候使用container_name: mongorestart: always# ports:#   - 27017:27017networks:- fastgptcommand: mongod --keyFile /data/mongodb.key --replSet rs0environment:- MONGO_INITDB_ROOT_USERNAME=myusername- MONGO_INITDB_ROOT_PASSWORD=mypasswordvolumes:- ./mongo/data:/data/dbentrypoint:- bash- -c- |openssl rand -base64 128 > /data/mongodb.keychmod 400 /data/mongodb.keychown 999:999 /data/mongodb.keyecho 'const isInited = rs.status().ok === 1if(!isInited){rs.initiate({_id: "rs0",members: [{ _id: 0, host: "mongo:27017" }]})}' > /data/initReplicaSet.js# 启动MongoDB服务exec docker-entrypoint.sh "$$@" &
​# 等待MongoDB服务启动until mongo -u myusername -p mypassword --authenticationDatabase admin --eval "print('waited for connection')"; doecho "Waiting for MongoDB to start..."sleep 2done
​# 执行初始化副本集的脚本mongo -u myusername -p mypassword --authenticationDatabase admin /data/initReplicaSet.js
​# 等待docker-entrypoint.sh脚本执行的MongoDB服务进程wait $$!
​redis:image: redis:7.2-alpinecontainer_name: redis# ports:# - 6379:6379networks:- fastgptrestart: alwayscommand: |redis-server --requirepass mypassword --loglevel warning --maxclients 10000 --appendonly yes --save 60 10 --maxmemory 4gb --maxmemory-policy noevictionvolumes:- ./redis/data:/data
​# fastgptsandbox:container_name: sandboximage: ghcr.io/labring/fastgpt-sandbox:v4.9.6 # git# image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:v4.9.6 # 阿里云networks:- fastgptrestart: alwaysfastgpt-mcp-server:container_name: fastgpt-mcp-serverimage: ghcr.io/labring/fastgpt-mcp_server:v4.9.6 # git# image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-mcp_server:v4.9.6 # 阿里云ports:- 3005:3000networks:- fastgptrestart: alwaysenvironment:- FASTGPT_ENDPOINT=http://fastgpt:3000fastgpt:container_name: fastgptimage: ghcr.io/labring/fastgpt:v4.9.6 # git# image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.9.6 # 阿里云ports:- 3000:3000networks:- fastgptdepends_on:- mongo- pg- sandboxrestart: alwaysenvironment:# 前端外部可访问的地址,用于自动补全文件资源路径。例如 https:fastgpt.cn,不能填 localhost。这个值可以不填,不填则发给模型的图片会是一个相对路径,而不是全路径,模型可能伪造Host。- FE_DOMAIN=# root 密码,用户名为: root。如果需要修改 root 密码,直接修改这个环境变量,并重启即可。- DEFAULT_ROOT_PSW=1234# AI Proxy 的地址,如果配了该地址,优先使用- AIPROXY_API_ENDPOINT=http://aiproxy:3000# AI Proxy 的 Admin Token,与 AI Proxy 中的环境变量 ADMIN_KEY- AIPROXY_API_TOKEN=aiproxy# 数据库最大连接数- DB_MAX_LINK=30# 登录凭证密钥- TOKEN_KEY=any# root的密钥,常用于升级时候的初始化请求- ROOT_KEY=root_key# 文件阅读加密- FILE_TOKEN_KEY=filetoken# MongoDB 连接参数. 用户名myusername,密码mypassword。- MONGODB_URI=mongodb://myusername:mypassword@mongo:27017/fastgpt?authSource=admin# pg 连接参数- PG_URL=postgresql://username:password@pg:5432/postgres# Redis 连接参数- REDIS_URL=redis://default:mypassword@redis:6379# sandbox 地址- SANDBOX_URL=http://sandbox:3000# 日志等级: debug, info, warn, error- LOG_LEVEL=info- STORE_LOG_LEVEL=warn# 工作流最大运行次数- WORKFLOW_MAX_RUN_TIMES=1000# 批量执行节点,最大输入长度- WORKFLOW_MAX_LOOP_TIMES=100# 自定义跨域,不配置时,默认都允许跨域(多个域名通过逗号分割)- ALLOWED_ORIGINS=# 是否开启IP限制,默认不开启- USE_IP_LIMIT=false# 对话文件过期天数- CHAT_FILE_EXPIRE_TIME=7volumes:- ./config.json:/app/data/config.json
​# AI Proxyaiproxy:image: ghcr.io/labring/aiproxy:v0.1.7# image: registry.cn-hangzhou.aliyuncs.com/labring/aiproxy:v0.1.7 # 阿里云container_name: aiproxyrestart: unless-stoppeddepends_on:aiproxy_pg:condition: service_healthynetworks:- fastgptenvironment:# 对应 fastgpt 里的AIPROXY_API_TOKEN- ADMIN_KEY=aiproxy# 错误日志详情保存时间(小时)- LOG_DETAIL_STORAGE_HOURS=1# 数据库连接地址- SQL_DSN=postgres://postgres:aiproxy@aiproxy_pg:5432/aiproxy# 最大重试次数- RETRY_TIMES=3# 不需要计费- BILLING_ENABLED=false# 不需要严格检测模型- DISABLE_MODEL_CONFIG=truehealthcheck:test: ['CMD', 'curl', '-f', 'http://localhost:3000/api/status']interval: 5stimeout: 5sretries: 10aiproxy_pg:image: pgvector/pgvector:0.8.0-pg15 # docker hub# image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.8.0-pg15 # 阿里云restart: unless-stoppedcontainer_name: aiproxy_pgvolumes:- ./aiproxy_pg:/var/lib/postgresql/datanetworks:- fastgptenvironment:TZ: Asia/ShanghaiPOSTGRES_USER: postgresPOSTGRES_DB: aiproxyPOSTGRES_PASSWORD: aiproxyhealthcheck:test: ['CMD', 'pg_isready', '-U', 'postgres', '-d', 'aiproxy']interval: 5stimeout: 5sretries: 10
networks:fastgpt:

3. 修改配置文件

编辑docker-compose.yml​:

services:fastgpt:environment:- OPENAI_BASE_URL=https://api.siliconflow.cn/v1  # 硅基流动API端点- CHAT_API_KEY=your_api_key_here  # 替换为实际API密钥

4. 启动容器

docker-compose up -d

5. 验证部署

访问http://localhost:3000​,若看到FastGPT界面,则部署成功。

访问 FastGPT

目前可以通过 ip:3000​ 直接访问(注意开放防火墙)。登录用户名为 root​,密码为docker-compose.yml​环境变量里设置的 DEFAULT_ROOT_PSW​。

如果需要域名访问,请自行安装并配置 Nginx。

首次运行,会自动初始化 root 用户,密码为 1234​(与环境变量中的DEFAULT_ROOT_PSW​一致),日志可能会提示一次MongoServerError: Unable to read from a snapshot due to pending collection catalog changes;​可忽略。

image

四、硅基流动免费API配置

1. 注册与申请API密钥

  1. 访问硅基流动官网(cloud.siliconflow.cn),使用邀请码PnsFln9M​注册。

  2. 登录后进入“API密钥”页面,创建新密钥并复制。

image

image

2. 模型选择与配置

硅基流动支持的模型包括:

  • Qwen2-7B(免费)

  • DeepSeek-R1(需付费或试用)

在FastGPT中配置模型

image

示例为Qwen2.5-7B-Instruct

image

image

自定义请求地址:

https://api.siliconflow.cn/v1/chat/completions

自定义请求 Key:

输入你的秘钥

五、集成与测试

1. 创建知识库

  1. 在FastGPT控制台上传文档(PDF/TXT等)。

  2. 选择“知识库管理”→“新建知识库”,配置向量化模型(如M3E)。

image

然后进入数据库添加知识文件

image

image

image

六、常见问题与解决方案

问题描述解决方案
MongoDB版本不兼容修改docker-compose.yml​中的Mongo镜像版本为4.4.24。
API密钥无效检查密钥格式是否正确,确保未包含空格或特殊字符。
模型响应速度慢调整模型参数(如降低温度),或升级GPU资源。
端口冲突修改docker-compose.yml​中的端口映射(如8080:3000​)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/76647.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

19_大模型微调和训练之-基于LLamaFactory+LoRA微调LLama3

基于LLamaFactory微调_LLama3的LoRA微调 1. 基本概念1.1. LoRA微调的基本原理1.2. LoRA与QLoRA1.3. 什么是 GGUF 2.LLaMA-Factory介绍3. 实操3.1 实验环境3.2 基座模型3.3 安装 LLaMA-Factory 框架3.3.1 前置条件 3.4 数据准备3.5 微调和训练模型torch.cuda.OutOfMemoryError: …

Linux Wlan-四次握手(eapol)框架流程

协议基础 基于 IEEE 802.1X 标准实现的协议 抓包基础 使用上一章文章的TPLINK wn722n v1网卡在2.4G 频段抓包&#xff08;v2、v3是不支持混杂模式的&#xff09; eapol的四个交互流程 根据不同的认证模式不同&#xff0c;两者的Auth流程有所不同&#xff0c;但是握手流程基…

基于亚马逊云科技 Amazon Bedrock Tool Use 实现 Generative UI

背景 在当前 AI 应用开发浪潮中&#xff0c;越来越多的开发者专注于构建基于大语言模型&#xff08;LLM&#xff09;的 chatbot 和 AI Agent。然而&#xff0c;传统的纯文本对话形式存在局限性&#xff0c;无法为用户提供足够直观和丰富的交互体验。为了增强用户体验&#xff…

第 2 篇:初探时间序列 - 可视化与基本概念

第 2 篇&#xff1a;初探时间序列 - 可视化与基本概念 (图片来源: Luke Chesser on Unsplash) 在上一篇《你好&#xff0c;时间序列&#xff01;》中&#xff0c;我们了解了什么是时间序列数据以及学习它的重要性。现在&#xff0c;是时候卷起袖子&#xff0c;真正开始接触和探…

Linux服务器配置Anaconda环境、Pytorch库(图文并茂的教程)

引言&#xff1a;为了方便后续新进组的 师弟/师妹 使用课题组的服务器&#xff0c;特此编文&#xff08;ps&#xff1a;我导从教至今四年&#xff0c;还未招师妹&#xff09; ✅ NLP 研 2 选手的学习笔记 笔者简介&#xff1a;Wang Linyong&#xff0c;NPU&#xff0c;2023级&a…

Spring-AOP分析

Spring分析-AOP 1.案例引入 在上一篇文章中&#xff0c;【Spring–IOC】【https://www.cnblogs.com/jackjavacpp/p/18829545】&#xff0c;我们了解到了IOC容器的创建过程&#xff0c;在文末也提到了AOP相关&#xff0c;但是没有作细致分析&#xff0c;这篇文章就结合示例&am…

【Python网络爬虫开发】从基础到实战的完整指南

目录 前言&#xff1a;技术背景与价值当前技术痛点解决方案概述目标读者说明 一、技术原理剖析核心概念图解核心作用讲解关键技术模块技术选型对比 二、实战演示环境配置要求核心代码实现&#xff08;10个案例&#xff09;案例1&#xff1a;基础静态页面抓取案例2&#xff1a;动…

服务器监控软件推荐

以下是几款常用的服务器监控软件推荐&#xff0c;涵盖开源和商业方案&#xff0c;适用于不同规模和需求&#xff1a; 一、开源免费方案 Prometheus Grafana 特点&#xff1a;时序数据库 可视化仪表盘&#xff0c;支持多维度监控和告警。适用场景&#xff1a;云原生、Kubernet…

编译原理实验(四)———— LR(1)分析法

一、实验目的 掌握LR(1)分析法的基本原理与实现流程。通过构造LR(1)分析表&#xff0c;验证符号串是否符合给定文法规则。理解LR(1)分析中向前搜索符&#xff08;Lookahead Symbol&#xff09;的作用&#xff0c;解决移进-归约冲突。 二、实验题目 1.对下列文法&#xff0c;用…

vue3 主题模式 结合 element-plus的主题

vue3 主题模式 结合 element-plus的主题 npm i element-plus --save-dev在 Vue 3 中&#xff0c;实现主题模式主要有以下几种方式 1.使用 CSS 变量&#xff08;自定义属性&#xff09; CSS 变量是一种在 CSS 中定义可重用值的方式。在主题模式中&#xff0c;可以将颜色、字体…

科大讯飞Q1营收46.6亿同比增长27.7%,扣非净利同比增长48.3%

4月21日盘后&#xff0c;AI龙头科大讯飞&#xff08;002230.SZ&#xff09;发布2024年报&#xff0c;公司全年实现营业收入233.43亿元&#xff0c;同比增长18.79%&#xff0c;同期归母净利润为5.6亿元。 公司核心赛道业务保持快速增长&#xff0c;消费者、教育、汽车、医疗业务…

Day5-UFS总结

UFS 传输协议的本质&#xff1a;两个收发器件&#xff0c;对需要传输的数据&#xff0c;一层一层的封装和解析&#xff0c;利用封装增加的额外信息&#xff0c;做一些数据处理&#xff0c;完成源地址到目标地址的数据传输功能。 应用协议的本质&#xff1a;基于某种传输协议之…

嵌入式工程师( C / C++ )笔试面试题汇总

注&#xff1a;本文为 “嵌入式工程师笔试面试题” 相关文章合辑。 未整理去重。 如有内容异常&#xff0c;请看原文。 嵌入式必会 C 语言笔试题汇总 Z 沉浮 嵌入式之旅 2021 年 01 月 19 日 00:00 用预处理指令 #define 声明一个常数&#xff0c;用以表明 1 年中有多少秒&a…

29-JavaScript基础语法(函数)

知识目标 理解函数的基本概念&#xff1b;掌握函数的定义和调用&#xff1b;理解函数参数和返回值及作用域&#xff1b;掌握函数高阶用法。 1. 理解函数的基本概念 明确函数在 JavaScript 里是一段可重复使用的代码块&#xff0c;它能接收输入参数&#xff0c;执行特定任务&…

AI答题pk机器人来袭

AI答题PK机器人是一种具备知识问答竞赛功能的人工智能程序。以下为您详细介绍&#xff1a; 一、实时对战&#xff1a;能在答题排位PK升级赛中&#xff0c;与用户进行1V1在线实时PK答题 。比如在一些知识竞赛类APP中&#xff0c;用户可匹配到AI机器人对手&#xff0c;在规定时…

PclSharp ——pcl的c#nuget包

简介&#xff1a; NuGet Gallery | PclSharp 1.8.1.20180820-beta07 下载.NET Framework 4.5.2 Developer Pack&#xff1a; 下载 .NET Framework 4.5.2 Developer Pack Offline Installer 离线安装nupkg&#xff1a; nupkg是visual studio 的NuGet Package的一个包文件 安…

【Unity笔记】Unity音视频播放监听器封装笔记:VideoPlayer + AudioSource事件触发与编辑器扩展

关键点 Unity VideoPlayer 播放结束事件Unity AudioSource 播放检测 Unity音视频播放监听器封装笔记&#xff1a;VideoPlayer AudioSource事件触发与编辑器扩展 在 Unity 的多媒体开发中&#xff0c;我们经常需要监听 VideoPlayer 或 AudioSource 的播放状态&#xff0c;以便…

WPF常用技巧汇总

主要用于记录工作中发现的一些问题和常见的解决方法。 此文会持续更新。 >abp new Evan.MyWpfApp -t wpf --old --framework .net8 1. 解决不同屏幕分辨率下的锯齿问题 UseLayoutRounding"True" <Grid UseLayoutRounding"True"><Border Mar…

分数线降低,25西电马克思主义学院(考研录取情况)

1、马克思主义学院各个方向 2、马克思主义学院近三年复试分数线对比 学长、学姐分析 由表可看出&#xff1a; 1、马克思主义理论25年相较于24年下降10分&#xff0c;为355分 3、25vs24推免/统招人数对比 学长、学姐分析 由表可看出&#xff1a; 1、 马克思主义学院25年共接…

【Linux网络】构建UDP服务器与字典翻译系统

&#x1f4e2;博客主页&#xff1a;https://blog.csdn.net/2301_779549673 &#x1f4e2;博客仓库&#xff1a;https://gitee.com/JohnKingW/linux_test/tree/master/lesson &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1f4dd; 如有错误敬请指正&#xff01; &…