基于PAI+专属网关+私网连接:构建全链路 Deepseek 云上私有化部署与模型调用架构

DeepSeek - R1 是由深度求索公司推出的首款推理模型,该模型在数学、代码和推理任务上的表现优异,市场反馈火爆。在大模型技术商业化进程中,企业级用户普遍面临四大核心挑战:

  • 算力投入成本高昂:构建千亿参数级模型的训练与推理集群需巨额开支,导致中小企业难以跨越技术准入门槛;
  • 算力资源供应紧张:一线城市 GPU 集群受限于硬件供应短缺与资源抢占激烈,算力资源不足;
  • 模型部署复杂:从算法适配、性能调优到业务系统集成的端到端部署周期动辄数月,部署困难;
  • 数据安全合规风险:传统公网调用模式存在数据泄露隐患,难以满足企业对核心数据安全防护的严苛要求。

对于对数据主权敏感、业务全球化、需长期技术自主权的企业来说,其在 AI 商业化进程中实现技术可控、成本可控、风险可控尤为重要,基于以上基本诉求,此类客户更加注重:

  1. 自主可控的 AI 部署能力:
  • 需要灵活管理模型版本、算法优化路径,而非完全依赖第三方 API 接口。
  • 可定制模型(如微调预训练模型或集成自研算法)。
  1. 数据隐私与合规性保障:
  • 核心业务数据(如客户隐私、生产数据、财务数据)需在私有网络内处理,避免公网暴露风险。
  1. 跨区域业务协同需求:
  • 全球化业务需在不同区域(如亚洲、欧洲、美洲)部署低延迟的AI推理服务。
  1. 成本与资源效率优化:
  • AI 推理使用量大,避免 API 的高单价调用成本,需自主可控的按需弹性调度算力资源。

为了解决以上问题,阿里云推荐使用基于阿里云 PAI+ 专属网关 + 私网连接解决方案:破解大模型落地的技术与资源瓶颈。

阿里云 PAI 目前已经支持一键部署 DeepSeek-V3、DeepSeek-R1 模型,结合乌兰察布的 GPU 资源与阿里云 CEN 全球骨干网能力,配合使用专属网关 + 私网连接,企业可快速搭建:

  1. 全球骨干级内网通道:通过 CEN 云企业网打通全球 VPC 与本地混合云,实现内网级访问延迟

  2. 全链路零公网暴露:专属网关 + 私网连接确保模型调用、数据传输全程私有化

  3. 东数西算算力网络:低成本利用乌兰察布算力资源,支撑全球业务的 AI 推理需求

通过此方案可以帮助企业级用户搭建东数西算核心算力网络,快速构建零公网暴露的云上私有化部署与模型调用架构。

场景示例

本文以下图场景为例。某企业在阿里云华东(上海)地域创建了专有网络 VPC1,在该 VPC1 中有业务环境。为了业务环境的稳定性和安全性,该企业希望在乌兰察布使用 PAI 部署一套自有的云上 Deepseek 模型调用环境,提供给上海的业务集群使用,并要求私网访问,以构建全链路私有化部署与模型调用架构。
在这里插入图片描述

前提条件

  • 您已在乌兰察布地域创建了专有网络 VPC1,并在两个可用区内创建两台交换机
    VSW1、VSW2,创建了对应的安全组。具体操作,请参见创建专有网络,创建和管理交换机。
  • 您已在上海地域创建了专有网络 VPC2,并在两个可用区内创建两台交换机
    VSW3、VSW4,创建了对应的安全组。具体操作,请参见创建专有网络,创建和管理交换机。
  • 您已分别在 VSW3 和 VSW4 中创建 ECS01 和 ECS02 实例。
  • 您已创建云企业网 CEN,并分别在上海、乌兰察布创建好转发路由器 TR,并将 VPC1 和 VPC2 互相打通,具体步骤请参考跨地域
    VPC 互通。

步骤一:使用模型在线服务 EAS,一键搭建 DeepSeek-R1 模型

  1. 登录人工智能平台 PAI。

  2. 在顶部菜单栏,选择 PAI 所属的地域。

  3. 在左侧导航栏,选择模型部署 > 模型在线服务( EAS )。

  4. 在推理服务中,点击部署服务。

  5. 在场景化模型部署中,选择 LLM 大语言模型部署。
    在这里插入图片描述
    在这里插入图片描述

  6. 点击部署。

步骤二:在 EAS 模型在线服务中创建专属网关,打通服务调用所属 VPC

  1. 在模型在线服务( EAS )菜单栏中,切换到专属网关页签,新建专属网关 > 新建后付费专属网关。
    在这里插入图片描述

  2. 在模型在线服务( EAS )菜单栏中,切换到专属网关页签,新建专属网关 > 新建后付费专属网关(按量付费)。

  3. 购买完成后,为专属网关添加专有网络。
    单击专属网关名称,在开通相关服务后,在网关详情页面网关访问控制 > 专有网络页签,添加乌兰察布地域专有网络 VPC1 ,交换机 VSW2。创建后,在乌兰察布地域进入私网连接 > 终端节点,可以看到专属网关自动已经创建好对应的接口终端节点。
    在这里插入图片描述
    在这里插入图片描述

  4. 为专属网关关联其他 VPC,本文选择华东(上海)地域 VPC1。
    在这里插入图片描述
    在这里插入图片描述

创建后,在云解析 Privatezone > 域名设置里,可以看到专属网关已自动创建好对应的 VPC 内网解析。
在这里插入图片描述
5. 修改专属网关白名单设置,放通对应的 VPC 网段。
在这里插入图片描述
在这里插入图片描述

步骤三:将模型在线服务 EAS 加入到对应专属网关

  1. 在模型在线服务( EAS )菜单栏中,切换到推理服务页签,在对应模型服务的操作菜单中点击更新。
    在这里插入图片描述
  2. 在页签的右上角点击切换为自定义部署,下拉菜单到服务功能页签,选择已经创建的专属网关,并更新配置。
    在这里插入图片描述
    在这里插入图片描述
  3. 在模型在线服务( EAS )菜单栏中,切换到推理服务页签,在对应模型服务的服务方式菜单中点击调用信息。
    在这里插入图片描述
    选择 VPC 地址调用,可以看到对应的模型服务地址以及 Token 信息
    在这里插入图片描述

步骤四:测试使用私网调用 EAS 模型服务

  1. 登录上海地域 VPC2 内的 ECS01,并将 EAS 模型服务对应的 Token 添加到环境变量中。

执行以下命令,将环境变量设置追加到 ~/.bashrc 文件中:
# 用对应的调用 Token 代替 <你的EAS的TOKEN>

echo "export EAS_TOKEN=<你的EAS的TOKEN>" >> ~/.bashrc

执行以下命令,刷新环境变量设置

source ~/.bashrc

在这里插入图片描述
2. 使用私网 HTTP / HTTPS 调用模型服务

示意如下,其中,< model_name > 请替换为模型列表接口 <EAS_ENDPOINT>/v1/models 获取的模型名称,< EAS_ENDPOINT > 请替换为 EAS VPC 地址调用的域名。

备注:调用方式可以为 HTTP / HTTPS.

curl -X POST \-H "Content-Type: application/json" \    -H "Authorization: Bearer $EAS_TOKEN" \    -d '{"model": "<model_name>",        "messages": [        {      "role": "system",            "content": "You are a helpful assistant."        },        {            "role": "user",            "content": "hello!"       }        ]    }' \    <EAS_ENDPOINT>/v1/chat/completions

返回成功响应表明私网调用 DeepSeek - R1 通道 已成功建立。
在这里插入图片描述

(可选)步骤五:使用 EAS 专属网关公网调用能力

  1. 为专属网关添加公网访问能力。

单击专属网关名称,在开通相关服务后,在网关详情页面网关访问控制 > 公网页签,打开访问入口按钮,并添加公网访问白名单。
在这里插入图片描述
2. 使用公网 HTTP / HTTPS 调用模型服务

示意如下,< EAS_TOKEN > 请替换为 EAS 的 Token 信息,< model_name > 请替换为模型列表接口 <EAS_ENDPOINT>/v1/models 获取的模型名称,

< EAS_ENDPOINT > 请替换为 EAS 公网调用的地址。

备注:调用方式可以为 HTTP / HTTPS.

curl -X POST \-H "Content-Type: application/json" \-H "Authorization:  <EAS_TOKEN>" \-d '{"model": "<model_name>","messages": [{"role": "system","content": "You are a helpful assistant."},{"role": "user","content": "hello!"}]}' \<EAS_ENDPOINT>/v1/chat/completions

使用本地设备测试,返回成功响应表明公网调用 DeepSeek - R1 通道 已成功建立。
在这里插入图片描述
阿里云通过 PAI+ 专属网关 + 私网连接方案,为企业级用户构建了技术可控、成本优化、安全可靠的 AI 私有化部署调用路径。该方案不仅解决了算力资源紧张与部署复杂度高的痛点,全链路私有化部署和全球低延迟算力网络,也满足了企业对数据主权、全球化业务部署及长期技术自主的需求。凭借乌兰察布算力资源与 CEN 骨干网的协同,企业可快速实现大模型的高效落地,为 AI 技术的规模化应用提供了可信赖的基础设施支撑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/76170.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【APM】How to enable Trace to Logs on Grafana?

系列文章目录 【APM】Observability Solution 【APM】Build an environment for Traces, Metrics and Logs of App by OpenTelemetry 【APM】NET Traces, Metrics and Logs to OLTP 【APM】How to enable Trace to Logs on Grafana? 前言 本文将介绍如何在Grafana上启用 …

在 Excel 中使用通义灵码辅助开发 VBA 程序

VBA 简介 VBA 是一种用于微软办公套件&#xff08;如 Word、Excel、PowerPoint 等&#xff09;的编程语言&#xff0c;它本质上是一种内嵌的脚本&#xff0c;或者可以认为是一段命令&#xff0c;其标准叫法被称为宏。 VBA 只能依赖于对应的软件进行开发&#xff0c;例如本文就…

vscode终端运行windows服务器的conda出错

远程windows服务器可以运行&#xff0c;本地vscode不能。 打开vscode settings.json文件 添加conda所在路径

紫外相机的应用范围及介绍

&#xff08;一&#xff09;工业领域 半导体制造&#xff1a;在晶圆制造和检测过程中&#xff0c;紫外相机起着关键作用。它可用于裸晶圆检测&#xff0c;能准确识别出制造过程中偶然引入的微粒&#xff08;如灰尘&#xff09;或因处理不当造成的划痕等缺陷。对于图案晶圆检查…

08软件测试需求分析案例-删除用户

删除用户是后台管理菜单的一个功能模块&#xff0c;只有admin才有删除用户的权限。不可删除admin。 1.1 通读文档 通读需求规格说明书是提取信息&#xff0c;提出问题&#xff0c;输出具有逻辑、规则、流程的业务步骤。 信息&#xff1a;此功能应为用户提供确认删除的功能。…

Oracle DBMS_SCHEDULER 与 DBMS_JOB 的对比

Oracle DBMS_SCHEDULER 与 DBMS_JOB 的对比 一 基本概述对比 特性DBMS_JOB (旧版)DBMS_SCHEDULER (新版)引入版本Oracle 7 (1992年)Oracle 10g R1 (2003年)当前状态已过时但仍支持推荐使用的标准设计目的基础作业调度企业级作业调度系统 二 功能特性对比 2.1 作业定义能力 …

Linux网络编程实战:从字节序到UDP协议栈的深度解析与开发指南

网路通信的三大要素&#xff1a;协议&#xff0c;端口和IP 知识点1【字节序】 多字节在主机中的存放数据 把多字节看成一个整体存储的顺序。 为什么我们在文件中没有这个概念呢&#xff1f; 因为文件是字节流&#xff08;流指针&#xff09;&#xff0c;流是以一个字节为操…

mvccc

. MVCC (多版本并发控制) 概念&#xff1a; MVCC 是一种并发控制技术&#xff0c;用于在数据库中实现并发事务的读写操作&#xff0c;同时保证事务的隔离性。MVCC 的核心思想是&#xff0c;在数据库中维护数据的多个版本&#xff0c;每个事务在读取数据时&#xff0c;读取的是…

Kotlin整数相除精度损失roundToInt

Kotlin整数相除精度损失roundToInt import kotlin.math.roundToIntfun main() {val a 0.0fval delta 0.1ffor (i in 0..10) {val r a i * deltaprintln("float${r} toInt${r.toInt()} (0.5 toInt)${(r 0.5).toInt()} round${Math.round(r)} roundToInt${r.roundToInt…

“星睿O6” AI PC开发套件评测 - Windows on Arm 安装指南和性能测评

引言 Radxa联合此芯科技和安谋科技推出全新的"星睿O6"迷你 ITX 主板。该系统搭载了 CIX P1&#xff08;CD8180&#xff09;12 核 Armv9 处理器&#xff0c;拥有高达30T算力的NPU和高性能的GPU&#xff0c;最高配备64GB LPDDR内存&#xff0c;并提供了如 5GbE、HDMI …

redis-事务(MULTI、EXEC、DISCARD、WATCH与lua脚本、包含lua脚本的简单介绍、乐观锁抢购案例的实现)

https://juejin.cn/post/6891158857708797959 首先Redis事务在实际的场景应用上也占着比较重要的地位,例如在秒杀场景中,我们就可以利用Redis事务中的watch命令监听key,实现乐观锁,保证不会出现冲突,也防止商品超卖。 另外就是Redis事务也是面试过程中面试官着重照顾的基础…

Redis-07-常见Redis使用场景

文章目录 01.缓存数据&#xff08;Cache&#xff09;02.布式锁&#xff08;Distributed Lock&#xff09;03.计数器&#xff08;Counter&#xff09;04.排行榜&#xff08;Leaderboard&#xff09;05.消息队列&#xff08;Message Queue&#xff09;06.限流&#xff08;Rate Li…

长亭2月公开赛Web-ssrfme

环境部署 拉取环境报错&#xff1a; 可以尝试拉取一下ubuntu:16.04&#xff0c;看是否能拉取成功 将wersion&#xff1a;"3"删掉 我拉去成功之后&#xff0c;再去拉取环境&#xff0c;成功&#xff01; 访问环境 测试ssrf 源码 <?php highlight_file(__file__…

RK3506+net9+VS2022跨平台调试C#程序

下载GetVsDbg.sh &#xff0c;这脚本会下载一个压缩包&#xff0c;然后解压缩&#xff0c;设置x权限等等。但是目标板子连不上&#xff0c;就想办法获取到下载路径&#xff0c;修改这个脚本&#xff0c;显示这个下载链接后&#xff0c;复制一下&#xff0c;用电脑下下来 修改好…

MySQL GTID集合运算函数总结

MySQL GTID 有一些运算函数可以帮助我们在运维工作中提高运维效率。 1 GTID内置函数 MySQL 包含GTID_SUBSET、GTID_SUBTRACT、WAIT_FOR_EXECUTED_GTID_SET、WAIT_UNTIL_SQL_THREAD_AFTER_GTIDS 4个内置函数&#xff0c;用于GTID集合的基本运算。 1.1 GTID_SUBSET(set1,set2) …

Java学习手册:Java内存模型

Java内存模型&#xff08;Java Memory Model&#xff0c;简称JMM&#xff09;是Java语言中用于定义线程之间如何共享和操作内存的规范。它描述了Java程序中变量的内存可见性行为&#xff0c;并定义了线程之间的通信规则。理解Java内存模型对于编写正确的并发程序至关重要。本文…

神经网络优化 - 高维变量的非凸优化

网络优化是指寻找一个神经网络模型来使得经验(或结构)风险最小化的过程&#xff0c;包括模型选择以及参数学习等。 关于经验风险最小化和结构风险最小化&#xff0c;请参考博文&#xff1a; 认识机器学习中的经验风险最小化准则_样本均值近似与经验风险最小化的关系-CSDN博客…

Python自学第2天:条件语句,循环语句

条件语句 1.条件判断 score 60 if score > 90:print("优秀") elif score > 60:print("及格") else:print("不及格") 注意&#xff1a; 1、每个条件后面要使用冒号 :&#xff0c;表示接下来是满足条件后要执行的语句块。2、使用缩进来划…

C# dll 打包进exe

Framework4.x推荐使用 Costura.Fody 1. 安装 NuGet 包 Install-Package Costura.Fody工程自动生成packages文件夹&#xff0c;300M左右。生成FodyWeavers.xml、FodyWeavers.xsd文件。 2. 自动嵌入 编译后&#xff0c;所有依赖的 DLL 会被自动嵌入到 EXE 中。 运行时自动解压…

Redis之缓存更新策略

缓存更新策略 文章目录 缓存更新策略一、策略对比二、常见的缓存更新策略三、如何选择策略四、实际应用示例五、使用 Cache-Aside TTL 的方式&#xff0c;实现缓存商铺信息详情1.引入StringRedisTemplate2.将查询商铺信息加入缓存3.更新商铺信息时移除缓存总结 六、注意事项 一…