SpringAI+DeepSeek大模型应用开发——1 AI概述

AI领域常用词汇

LLM(LargeLanguage Model,大语言模型)

能理解和生成自然语言的巨型AI模型,通过海量文本训练。例子:GPT-4、Claude、DeepSeek、文心一言、通义干问。

  • G(Generative)生成式: 根据上文预测之后应该出现哪个文本,从而形成连续的文本输出

  • P(Pre-trained)预训练: 通过大规模的文本数据进行预训练,让大模型可以理解人类语言的语法、词性。

  • T(Transformer)Transformer: 深度学习的一种神经网络模型。多数AIGC模型都依赖于此

感知能力:海量文本训练,接收用户输入文本,,PDF,图片==>OCR==>转成文本,但是会损失很多信息,如颜色布局,色调等

机器学习

基于数据,通过统计和优化方法训练模型。包括监督学习、无监督学习和强化学习等子领域。应用: 游戏AI、推荐引擎

深度学习(DeepLearning)

解释:模仿人脑神经网络结构的机器学习方法,需要大量数据和算力。

例子:图像识别、语音转文字。

神经网络(NeuralNetwork)

解释:由多层"虚拟神经元"组成的计算模型,AI学习的基础架构。

NLP(NaturalLanguageProcessing,自然语言处理)

解释:让计算机理解、生成人类语言的技术。

应用:机器翻译、情感分析。

多模态(Multimodal)

能同时处理文本、图像、语音等多种类型数据的AI。

例子:GPT-4V 可以分析图片内容并回答问题。

  1. 视觉感知:端到端视觉感知,输入图片,直接能获取所有信息

  2. 多模态感知:包括声音语气语调,视频时序等信息

  3. 推理能力:利用CoT和ToT思维链,模型思考问题前,进行问题拆解

  4. 工作流+多智能体:各个AI各司其职协作完成任务,缺点是任务分工还是人为定好的

  5. 模型即Agent-深度搜索:模型自主决定什么时候搜索或整理信息

检索增强生成(RAG)

对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库

例子:RAG广泛应用于各种自然语言处理任务,包括问答系统、知识图谱构建、智能客服等,能够显著提升大模型在实际业务场景中的表现。

更多更专业的名词可参考Spring AI Alibaba 项目的介绍:Chat Client,里面有可运行的代码,工具(Function Calling) 向量存储(Vector Store)

AI Agent

Agent直译过来就是代理,结合AI来看就是 智能体,核心:实现AI自主完成任务==>收到任务指令==>感知环境+独立思考+主动实践

行动能力

  1. 初级-大模型函数调用:模型感觉要调用某个工具==>生成一段API调用文本==>过滤器识别==>找到对应的功能函数去调用==>返回答案

  2. 训练模型控制浏览器(manus操作网页来源)

  3. MCP模型上下文协议:统一各个API工具接口的格式,比如股票接口和计算器接口 都有TypeC格式去接入模型

记忆能力

  1. 增加上下文长度

  2. RAG(检索增强生成)==>延长模型对话记忆==>中途总结前面的对话+偶尔回顾==>记忆模块

  3. DeepSeek稀疏注意力机制

manus

  1. 规划+工具==>生成待办事项todo

  2. 调用搜索工具搜索网页,待办事项打勾

DeepSeek
  • 基础模型(V3):通用模型,高效便捷,适用于绝大多数任务, “ 规范性”任务 ,聪明且听话

  • 深度思考(R1):文本推理模型,复杂推理和深度分析任务,如数理逻辑推理和编程代码,聪明但不听话

  • 联网搜索:RAG(检索增强生成),知识库更新至24年7月

如何提问?

  • 基础模型(V3):“过程-结果”清晰(指令)

  • 深度思考(R1):目标清晰,结果可以模糊(推理)

提示词结构

  1. 定义AI的角色: 经验丰富的数据分析师 具备十年销售经验的SaaS系统商务

  2. 期望达成什么目标效果: 通过该文案吸引潜在客户,促成消 费……通过该报告为相关企业管理 者提供……策略支撑

  3. 具体任务描述: 写一份关于XXX活动的小红书宣推文案 写一份关于XX事件的舆论分析报告 (XX活动/事件相关背景信息如下……)

  4. Objective(操作要求) 字数要求、段落结构、用词风格、 内容要点、输出格式…

Manus能力

  1. 展示窗口

  2. 调用搜索工具

  3. 浏览网页

  4. 命令行

  5. 多轮搜索

  6. 编程和部署

Spring AI

一个大模型应用框架。目标:将人工智能领域无缝接入Spring 生态体系,快速改造传统项目

为什么选择 SpringAI?

目前大模型应用开发最常见的框架就是LangChain,然而LangChain是基于Python语言,虽然有LangChain4j,但是对于大量使用Spring生态的应用来说,适配性就稍微差了些;

而Spring公司推出的SpringAI框架,充分利用了Spring框架中AOP、IOC的能力,可以与现有的Java项目无缝融合,非常方便;

  • JDK版本至少是JDK17,SpringBoot也必须是3.x的版本;

  • 如果是比较老的项目,也可以考虑采用LangChain4j,它要求的最低JDK版本为JDK8。

  • SpringAI官方文档:Spring AI Reference

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/77729.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot 基本原理

SpringBoot 为我们做的自动配置,确实方便快捷,但一直搞不明白它的内部启动原理,这次就来一步步解开 SpringBoot 的神秘面纱,让它不再神秘。 目录 SpringBootApplication 背后的秘密 Configuration ComponentScan EnableAutoC…

2025.4.17总结

工作:今天对需求的测试设计进行了完善,然后,对测试设计进行了评审,最后提了个问题单。 反思这个过程,要说不足的地方,就是评审的时候总觉得自己吐字不清晰,表达能力早就想提升了,但…

2021-11-14 C++三七二十一数

缘由c编程怎么写&#xff0c;紧急求解-编程语言-CSDN问答 void 三七二十一数() {//缘由https://ask.csdn.net/questions/7566632?spm1005.2025.3001.5141int n 0, a 0, b 0, p 1;std::cin >> n;while (n--){std::cin >> a >> b;while (a<b){if (a %…

大模型面经 | DeepSpeed中ZeRO-1、ZeRO-2和ZeRO-3的区别是什么?

大家好,我是皮先生!! 今天给大家分享一些关于大模型面试常见的面试题,希望对大家的面试有所帮助。 往期回顾: 大模型面经 | 春招、秋招算法面试常考八股文附答案(RAG专题一) 大模型面经 | 春招、秋招算法面试常考八股文附答案(RAG专题二) 大模型面经 | 春招、秋招算法…

spring boot 文件上传

1.编写文件上传的表单页面 <!DOCTYPE html> <html lang"en" xmlns:th"http://www.thymeleaf.org"> <head><meta charset"UTF-8"><meta http-equiv"Content-Type" content"text/html; charsetUTF-8&qu…

机器学习核心算法全解析:从基础到进阶的 18 大算法模型

在机器学习领域&#xff0c;算法模型是解决实际问题的核心工具。 不同的算法适用于不同的数据场景和任务需求&#xff0c;理解它们的原理与应用是掌握机器学习的关键。 以下将详细解析 18 个核心算法模型&#xff0c;涵盖监督学习、无监督学习、集成学习和深度学习等多个领域…

5G网络切片:精准分配资源,提升网络效率的关键技术

5G网络切片&#xff1a;精准分配资源&#xff0c;提升网络效率的关键技术 随着5G技术的广泛应用&#xff0c;网络切片&#xff08;Network Slicing&#xff09;作为其核心创新之一&#xff0c;正在改变传统网络架构。它通过将物理网络划分为多个逻辑网络&#xff08;切片&…

Spring Boot中Excel处理完全指南

文章目录 1. Excel处理基础知识1.1 为什么需要在应用中处理Excel文件&#xff1f;1.2 Java中的Excel处理库介绍1.2.1 Apache POI1.2.2 EasyExcel1.2.3 JExcel1.2.4 Apache POI SXSSF 1.3 Spring Boot中集成Excel处理 2. 在Spring Boot中集成Excel处理库2.1 集成Apache POI2.1.1…

Elasticsearch 8.18 中提供了原生连接 (Native Joins)

作者&#xff1a;来自 Elastic Costin Leau 探索 LOOKUP JOIN&#xff0c;这是一条在 Elasticsearch 8.18 的技术预览中提供的新 ES|QL 命令。 很高兴宣布 LOOKUP JOIN —— 这是一条在 Elasticsearch 8.18 的技术预览中提供的新 ES|QL 命令&#xff0c;旨在执行左 joins 以进行…

2025年渗透测试面试题总结-拷打题库03(题目+回答)

网络安全领域各种资源&#xff0c;学习文档&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具&#xff0c;欢迎关注。 目录 2025年渗透测试面试题总结-拷打题库03 一、Windows与Linux系统提权思路 Windows提权 Linux提权 二、…

【华为】OSPF震荡引起CPU占用率高怎么解决?

原创&#xff1a;厦门微思网络 现象描述 如图所示&#xff0c;Switch_1、Switch_2、Switch_3和Switch_4配置了OSPF协议&#xff0c;发现Switch_1设备的CPU占用率高&#xff0c;ROUT任务占用率明显高于其他任务并且产生路由震荡。 故障组网图 原因分析 网络中IP地址冲突导致…

Everything 安装教程与使用教程(附安装包)

文章目录 前言一、Everything 介绍二、Everything 安装教程1.Everything 安装包下载2.选择安装文件3.选择安装语言4.接受许可协议5.选择安装位置6.配置安装选项7.完成安装 三、Everything 使用教程1.启动软件2.简单关键词搜索3.按类型搜索 前言 在日常使用电脑时&#xff0c;随…

极狐GitLab CI/CD 流水线计算分钟数如何管理?

极狐GitLab 是 GitLab 在中国的发行版&#xff0c;关于中文参考文档和资料有&#xff1a; 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 计算分钟管理 (PREMIUM SELF) 在极狐GitLab 16.1 中&#xff0c;从 CI/CD 分钟数重命名为计算配额或计算分钟数。 管理员可…

Containerd 1.7.2 离线安装与配置全指南(生产级优化)

Containerd 1.7.2 离线安装与配置全指南&#xff08;生产级优化&#xff09; 摘要&#xff1a;本文详细讲解在无外网环境下部署 Containerd 1.7.2 容器运行时的完整流程&#xff0c;涵盖二进制包安装、私有镜像仓库配置、Systemd服务集成等关键步骤&#xff0c;并提供生产环境…

33-公交车司机管理系统

技术&#xff1a; 基于 B/S 架构 SpringBootMySQLvueelementui 环境&#xff1a; Idea mysql maven jdk1.8 node 用户端功能 1.首页:展示车辆信息及车辆位置和线路信息 2.模块:车辆信息及车辆位置和线路信息 3.公告、论坛 4.在线留言 5.个人中心:修改个人信息 司机端功能…

基于 OpenCV 的图像与视频处理

基于 OpenCV 的图像处理 一、实验背景 OpenCV 是一个开源的计算机视觉库&#xff0c;广泛应用于图像处理、视频分析、目标检测等领域。通过学习 OpenCV&#xff0c;可以快速实现图像和视频的处理功能&#xff0c;为复杂的应用开发 奠定基础。本实验旨在通过实际代码示例&…

Linux 常用指令用户手册

Linux 常用指令用户手册 适合新手入门 & 日常速查 目录 基础操作文件与目录管理权限与所有权文本处理压缩与解压系统监控网络操作进程管理实用小技巧 1. 基础操作 1.1 查看系统信息 # 查看内核版本 uname -a# 查看系统发行版信息&#xff08;适用于 Debian/Ubuntu&…

长效IP与短效IP:如何选择适合业务的代理类型

在当今数据驱动的互联网环境中&#xff0c;代理IP已成为企业运营、数据采集和网络安全的关键工具。其中长效IP与短效IP作为两种主流代理类型&#xff0c;因特性差异被应用于不同场景。本文将深入解析二者的区别&#xff0c;并提供实际场景中的选择建议。 一、长效IP与短效IP&a…

数据结构|排序算法(三)选择排序 堆排序 归并排序

一、选择排序 1.算法思想 选择排序&#xff08;Selection Sort&#xff09;是一种简单直观的排序算法&#xff0c;其基本思想是&#xff1a;每次都从待排序部分中选出最小的一个数据和待排序的第一个数据交换。 将待排序序列分为已排序和未排序两部分&#xff0c;初始时已排…

Vue3 + TypeScript,关于item[key]的报错处理方法

处理方法1&#xff1a;// ts-ignore 注释忽略报错 处理方法2&#xff1a;item 设置为 any 类型