【AI】DeepSeek 概念/影响/使用/部署

在大年三十那天,不知道你是否留意到,“deepseek”这个词出现在了各大热搜榜单上。这引起了我的关注,出于学习的兴趣,我深入研究了一番,才有了这篇文章的诞生。

概念

那么,什么是DeepSeek?首先百度一下!

噢,原来是一个AI大模型,那就进入官网看看 DeepSeek

不管三七二十一,先注册一个账号再说

登录进去

这不跟ChatGPT一样吗!

影响

那么为什么会突然霸榜,来看看最近的新闻资讯

根据这些新闻标题,可看出DeepSeek触动了美国的利益,遭到了美国方面的DDOS攻击和封杀

链接一:被美军限制的DeepSeek,究竟是啥?

中国公司的DeepSeek模型产品推出后,跃上美国苹果App商店免费下载排行榜冠军,撼动科技圈和华尔街。除掀起广泛讨论外,也引发所谓“安全隐忧”。

报道称,美国海军向美国消费者新闻与商业频道证实,已向相关人员发出邮件示警,提醒“不得以任何形式下载、安装或使用DeepSeek模型”。

与OpenAI开发的ChatGPT相比,DeepSeek不仅率先实现了媲美OpenAI-o1模型的效果,还大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本达到了GPT-o1级别的表现,引发海外AI圈的广泛讨论。

小的算力用新的方法也能创造奇迹。

链接二:DeepSeek崛起背后的暗流:全球AI技术博弈下的DDoS攻击

然而,伴随着DeepSeek国际影响力的持续攀升,其面临的挑战也愈发复杂和严峻,自从DeepSeek发布性能比肩OpenAIo1正式版,且成本显著降低的DeepSeek-R1模型后,随即遭受一系列有针对性的网络攻击,对DeepSeek的日常运营构成严重威胁,攻击背后的动机与意图不免让人怀疑。这一现象不仅凸显了DeepSeek在全球AI领域的重要战略地位,更折射出国际人工智能技术博弈的复杂性与激烈程度,值得深思与警醒。

链接三:僵尸网络进场,针对 DeepSeek 网络攻击再升级

1月30日凌晨,即农历大年初二,奇安信XLab实验室监测发现,针对DeepSeek(深度求索)线上服务的攻击烈度突然升级,其攻击指令较1月28日暴增上百倍。XLab实验室观察到至少有2个僵尸网络参与攻击,共发起了两波次攻击。

使用

提问模板

1、背景+需求+约束条件

  • 背景:我是一个互联网打工人,自媒体小白。  
  • 需求:我想学习如何运营自媒体。  
  • 约束条件:不需要考虑视频剪辑部分。

2、背景+问题+要求+细节

  • 背景:我正在用Python开发一个天气API,使用Flask框架…
  • 问题:如何实现用户输入城市后返回实时天气数据?
  • 要求:请提供代码片段,并解释关键参数。
  • 细节:① 尝试用requests库但返回404;② 需免费API密钥。

分享今天看到的公众号文章

第一篇文章:使用DeepSeek必备的10个技巧

该文详细对比了DS和ChatGPT,以及介绍了V3模型和R1模型的区别和使用示例

第二篇文章:语言学博士谈 DeepSeek 最佳使用方式

详细介绍了DS推理模型R1对我们的作用和使用姿势

第三篇文章:完整攻略:如何用好DeepSeek,一文汇总!

本地部署

本地部署大模型的意义:

1.数据隐私与安全:本地部署能确保敏感数据不出本地,避免数据泄露风险,尤其适用于医疗、金融等对隐私要求高的行业。

2.定制化需求:本地部署允许根据特定需求调整和优化模型,提升在特定任务上的表现,满足个性化需求。

3.网络与延迟问题:本地部署减少了对网络的依赖,避免了网络不稳定或延迟对实时应用的影响,适合需要快速响应的场景。

4.成本控制:长期使用云服务的成本较高,本地部署虽然初期投入大,但长期来看可能更经济,尤其在大规模应用中。

5.合规要求:某些行业或地区有严格的数据存储和处理规定,本地部署有助于满足这些合规要求。

6.技术掌控:本地部署让用户完全控制模型和基础设施,便于进行深度优化和扩展,适合有技术能力的团队。

7.离线环境需求:在没有网络连接的环境中,本地部署是唯一可行的选择,如偏远地区或军事应用。

8.避免供应商锁定:本地部署减少对特定云服务商的依赖,增强自主性,避免因服务商政策变化带来的风险。

总结来说,本地部署大模型在隐私、定制化、延迟、成本、合规、技术控制、离线需求和避免供应商锁定等方面具有优势,适合有特定需求的用户。

一、命令行使用

1、下载安装:Ollama

Ollama 是一个提供本地部署大型语言模型的工具和平台,旨在帮助用户在自己的设备上运行和管理大模型。它允许开发者和企业使用像 GPT-3、GPT-4 等大型语言模型,但与常规的云服务不同,Ollama 让这些模型可以在本地机器上运行,从而实现更好的控制和隐私保护。

支持Mac、Linux、Windows三个操作系统,大同小异,本文仅演示Windows系统部署

2、验证是否成功安装

3、 在 Ollama 上找到DS-R1大模型。本文仅演示部署R1,V3体积太大,我的机器承受不了

4、根据自身的需求和电脑配置选择模型大小

在大模型的规格描述中,“多少 b” 代表的是 参数量(参数规模,Parameters),而 b 在这里指的是“billion”(十亿),上图1.5b就是指15亿个参数。 下面是一个模型大小配置参考表格,大家可根据自己的电脑配置来自行选择,当然了,部署的本地模型越大,使用的深度求索效果就越好。

复制命令,到本地CMD命令行执行 

5、完成后,界面出现success,表示成功部署到本地

6、验证使用

刚安装完直接使用貌似有点小BUG,关闭后重新运行就没问题了

以后每次启动,就直接通过以下命令启动

ollama run deepseek-r1:1.5b

离线模式写了个小学生作文

如果想退出模型,在终端输入:/bye即可,或者直接关闭窗口

大模型安装路径:

二、网页使用

本地命令行使用还是不太直观,可以选择 Chatbox AI 进行网页端访问,提高可交互性。

Chatbox AI 是一款跨平台的 AI 客户端应用和智能助手,支持多种先进的 AI 模型和 API,可在 Windows、macOS、Android、iOS、Linux 以及网页版上使用。 

1、点击“启动网页版”

2、选择下面的“使用自己的API KEY/本地模型”

3、选择 Ollama API

4、配置环境变量

如何将 Chatbox 连接到远程 Ollama 服务:逐步指南 - Chatbox 帮助中心:指南与常见问题

 

5、再次打开设置,选择刚才下载的本地模型

 6、设置简体中文

7、完成,使用测试,说实话,这个思考过程的展示还是很棒的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/67579.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MapReduce简单应用(一)——WordCount

目录 1. 执行过程1.1 分割1.2 Map1.3 Combine1.4 Reduce 2. 代码和结果2.1 pom.xml中依赖配置2.2 工具类util2.3 WordCount2.4 结果 参考 1. 执行过程 假设WordCount的两个输入文本text1.txt和text2.txt如下。 Hello World Bye WorldHello Hadoop Bye Hadoop1.1 分割 将每个文…

Dest1ny漏洞库:用友 U8 Cloud ReleaseRepMngAction SQL 注入漏洞(CNVD-2024-33023)

大家好,今天是Dest1ny漏洞库的专题!! 会时不时发送新的漏洞资讯!! 大家多多关注,多多点赞!!! 0x01 产品简介 用友U8 Cloud是用友推出的新一代云ERP,主要聚…

2.1.2 Bayer阵列与去马赛克

文章目录 Bayer阵列去马赛克方法 Bayer阵列 由于传感器只能感受到光的强度,而无法感知颜色,所以需要用红、绿、蓝颜色的滤光片将光中的R、G、B亮度滤出,再通过R、G、B的组合得到各种色彩。Bayer阵列是使用一个传感器获得彩色图像的方法&#…

红黑树的学习

红黑树的概念 红黑树,是一种二叉搜索树,但在每个结点上增加一个存储位表示结点的颜色,可以是Red或 Black。 通过对任何一条从根到叶子的路径上各个结点着色方式的限制,红黑树确保没有一条路径会比其他路径长出俩倍,因…

2025年01月31日Github流行趋势

项目名称:Qwen2.5项目地址url:https://github.com/QwenLM/Qwen2.5项目语言:Shell历史star数:13199今日star数:459项目维护者:jklj077, JustinLin610, bug-orz, huybery, JianxinMa项目简介:Qwen…

人工智能|基本概念|人工智能相关重要概念---AI定义以及模型相关知识

一、 前言: 最近deepseek(深度求索)公司的开源自然语言处理模型非常火爆。 本人很早就对人工智能比较感兴趣,但由于种种原因没有过多的深入此领域,仅仅是做了一点初步的了解,借着这个deepseek&#xff0…

Python GIL(全局解释器锁)机制对多线程性能影响的深度分析

在Python开发领域,GIL(Global Interpreter Lock)一直是一个广受关注的技术话题。在3.13已经默认将GIL去除,在详细介绍3.13的更亲前,我们先要留了解GIL的技术本质、其对Python程序性能的影响。本文将主要基于CPython&am…

Git 版本控制:基础介绍与常用操作

目录 Git 的基本概念 Git 安装与配置 Git 常用命令与操作 1. 初始化本地仓库 2. 版本控制工作流程 3. 分支管理 4. 解决冲突 5. 回退和撤销 6. 查看提交日志 前言 在软件开发过程中,开发者常常需要在现有程序的基础上进行修改和扩展。但如果不加以管理&am…

(笔记+作业)书生大模型实战营春节卷王班---L0G2000 Python 基础知识

学员闯关手册:https://aicarrier.feishu.cn/wiki/QtJnweAW1iFl8LkoMKGcsUS9nld 课程视频:https://www.bilibili.com/video/BV13U1VYmEUr/ 课程文档:https://github.com/InternLM/Tutorial/tree/camp4/docs/L0/Python 关卡作业:htt…

仿真设计|基于51单片机的高速路口货车称重系统仿真

目录 具体实现功能 设计介绍 51单片机简介 资料内容 仿真实现(protues8.7) 程序(Keil5) 全部内容 资料获取 具体实现功能 (1)LCD1602液晶第一行显示当前的车辆重量,第二行显示车辆重量…

Ubuntu Server 安装 XFCE4桌面

Ubuntu Server没有桌面环境,一些软件有桌面环境使用起来才更加方便,所以我尝试安装桌面环境。常用的桌面环境有:GNOME、KDE Plasma、XFCE4等。这里我选择安装XFCE4桌面环境,主要因为它是一个极轻量级的桌面环境,适合内…

2025:影刀RPA使用新实践--CSDN博客下载

文章目录 一键CSDN博客下载器程序说明指导说明使用步骤 获取方法 一键CSDN博客下载器 程序说明 配置信息:CSDN账号(手机号/邮箱/用户名)、密码、博客文件类型支持markdown格式、html格式(默认值markdown格式)、博客保…

深度学习的应用

目录 一、机器视觉 1.1 应用场景 1.2 常见的计算机视觉任务 1.2.1 图像分类 1.2.2 目标检测 1.2.3 图像分割 二、自然语言处理 三、推荐系统 3.1 常用的推荐系统算法实现方案 四、图像分类实验补充 4.1 CIFAR-100 数据集实验 实验代码 4.2 CIFAR-10 实验代码 深…

前端js高级25.1.30

原型:函数的组成结构 通过这个图我们需要知道。 假设我们创建了一个Foo函数。 规则:Function.protoType是函数显示原型。__proto__是隐式对象。 Function、Object、Foo函数的__proto__指向了Function.protoType说明。这三个都依托function函数来创建。…

为AI聊天工具添加一个知识系统 之80 详细设计之21 符号逻辑 之1

本文要点 要点 前面我们讨论了本项目中的正则表达式。现在我们将前面讨论的正则表达式视为狭义的符号文本及其符号规则rule(认识的原则--认识上认识对象的约束),进而在更广泛的视角下将其视为符号逻辑及其符号原则principle(知识…

.NET Core缓存

目录 缓存的概念 客户端响应缓存 cache-control 服务器端响应缓存 内存缓存(In-memory cache) 用法 GetOrCreateAsync 缓存过期时间策略 缓存的过期时间 解决方法: 两种过期时间策略: 绝对过期时间 滑动过期时间 两…

自动驾驶---苏箐对智驾产品的思考

1 前言 对于更高级别的自动驾驶,很多人都有不同的思考,方案也好,产品也罢。最近在圈内一位知名的自动驾驶专家苏箐发表了他自己对于自动驾驶未来的思考。 苏箐是地平线的副总裁兼首席架构师,同时也是高阶智能驾驶解决方案SuperDri…

Sklearn 中的逻辑回归

逻辑回归的数学模型 基本模型 逻辑回归主要用于处理二分类问题。二分类问题对于模型的输出包含 0 和 1,是一个不连续的值。分类问题的结果一般不能由线性函数求出。这里就需要一个特别的函数来求解,这里引入一个新的函数 Sigmoid 函数,也成…

FPGA|使用quartus II通过AS下载POF固件

1、将开发板设置到AS下载挡位,或者把下载线插入到AS端口 2、打开quartus II,选择Tools→Programmer→ Mode选择Active Serial Programming 3、点击左侧Add file…,选择 .pof 文件 →start 4、勾选program和verify(可选&#xff0…

浅谈网络 | 容器网络之Flannel

目录 云原生网络架构深度解构:Flannel的设计哲学与实现机制Flannel架构解析:三层核心设计原则UDP模式(用户态隧道)VXLAN模式(内核态隧道)Host-GW模式(直连路由) 生产环境架构选型与调…