AI_背景知识

AI背景知识

      • 一、生成式预训练模型(GPT: Generative Pre-trained Transformer)
      • 二、大语言模型(LLM: Large Language Model)
          • 1、大语言模型、GPT、Transormer 关系
          • 2、Transformer的多功能:从翻译到代码生成
      • 三、词向量检索
          • 1,词向量检索概念
          • 2,Embedding
      • 四、Prompt

一、生成式预训练模型(GPT: Generative Pre-trained Transformer)

当谈论ChatGPT的技术时,我们实际上在讨论OpenAI GPT模型。这是一个基于Transformer架构的大型语言模型,通过两个主要步骤进行训练:预训练和微调。

  • 训练过程:预训练和微调。
    首先,在预训练阶段,模型使用大量没有标签的文本数据(如维基百科、新闻、小说等),通过预测下一个单词来学习语言的规则和结构。这就像模型在自己练习写作,从中学习了语法、用词方式等。

    然后,在微调阶段,少量有标签的数据用于训练模型更好地完成特定任务,比如回答问题、分类文本等。模型在这里会根据任务的指导进行微调,就好像是在特定情境中应用它所学到的知识。

总之,OpenAI GPT模型的技术基础是Transformer网络,它通过预先学习语言的规则和微调以适应不同任务,从而在多种应用中表现出色。这就像是一个学写作的大脑,在不同任务中灵活运用所学,让它变得聪明而有用。

二、大语言模型(LLM: Large Language Model)

1、大语言模型、GPT、Transormer 关系
  • 大语言模型、GPT和Transformer之间存在密切的关系,它们在自然语言处理和深度学习领域发挥重要作用。具体关系如下:

    • Transformer: Transformer是一种神经网络架构,最初设计用于机器翻译任务。它引入了注意力机制,通过编码器和解码器组件,能够有效地对序列数据进行建模。Transformer的关键创新是注意力机制,它能够处理长距离依赖关系,使得模型能够更好地捕捉上下文信息。

    • 大语言模型: 大语言模型是基于Transformer架构的语言模型,旨在对自然语言进行建模和理解。这些模型通常在大规模无监督数据上进行预训练,以学习语言的结构和规律。GPT和BERT等模型都属于大语言模型的范畴,它们通过预训练的方式捕捉了丰富的语言信息。

    • GPT (Generative Pre-trained Transformer): GPT是基于Transformer架构和自监督预训练技术构建的模型。它是一种句子级别的生成模型,能够根据上下文生成连贯的文本。GPT模型通过预测下一个单词来学习语言的规则,然后在生成式任务中表现出色,比如文本生成、摘要生成和对话生成。

    因此,大语言模型是在Transformer架构基础上构建的,它们通过自监督预训练来学习语言的特性。GPT是基于大语言模型的具体任务模型,使用Transformer架构和预训练技术,为生成式任务提供了强大的能力。总之,这三者共同构成了现代自然语言处理领域中的重要技术组成部分。

2、Transformer的多功能:从翻译到代码生成
  • 虽然Transformer最初是为了机器翻译任务而设计的,但其特性使得它在编写代码方面也表现出色的原因有以下几点:

    • 基于文本流的代码生成能力: 软件开发涉及大量的源代码编写,而源代码本质上是文本。GPT模型被训练用于预测下一个单词,这使其可以生成高质量的源代码。模型可以在生成代码的过程中融入软件开发标准、API接口等复杂性,有效地生成符合规范的代码。

    • 上下文理解: 源代码通常需要在特定上下文中才能正确理解其含义。不同代码块之间可能存在微妙的差异,但它们功能相似。GPT模型能够根据上下文生成更具语法正确性和可读性的代码,从而更好地满足软件开发需求。

    • 词向量表达: 源代码的语法结构是有规律的,它通常由特定领域的元素构成,这些元素具有明确的语义。GPT模型通过在大规模文本数据上进行预训练,学习到了丰富的词向量表示能力。这使得模型能够更好地理解代码中的语义和结构,生成更准确和高效的代码。

    综上所述,基于Transformer的GPT模型在编写代码方面表现良好的原因在于其文本生成能力、上下文理解以及通过预训练获得的词向量表达能力。这些特性使GPT能够有效地生成高质量的源代码,满足开发人员在软件编写过程中的需求。

三、词向量检索

1,词向量检索概念

词向量检索:通过数字化的“词义”找到相似文本

  • 词向量检索是一种文本查找方法,把文字变成数字,然后计算它们的相似度,找到相似的文字。

    这个过程分成几步:

    • (1,整理文本: 先把原文分成词,去掉没用的词,留下有用的。

    • (2,变成向量: 用方法把每个词变成一个数字向量。这个向量有很多数,代表词的意思。

    • (3,处理查询: 把你的搜索词也变成向量,然后计算它和其他文本向量的相似度,找到最相似的。

    • (4,给结果: 把计算出来的相似度排序,呈现给你最相关的文本。

    这个技术用在搜索引擎、推荐系统等地方。通过数字化的方式,更准确地衡量文本之间的相似度,让查找更准确、更快速

2,Embedding
  • OpenAI的Embedding是一种技术,用于将词语或句子转换成密集向量。这些向量可用于自然语言处理任务,如文本分类、情感分析和机器翻译。

    在OpenAI的Embedding中,每个单词或句子都会被映射到向量空间中的一个点。与传统的one-hot编码不同,Embedding能够捕获词语之间的相似性和关系,使得机器学习算法更能理解自然语言表达的含义。

    • 例如,在情感分析中,通过使用Embedding,我们可以将情感倾向相似的单词或短语映射到相似的向量空间位置。
    • 这样,我们能够使用这些向量来训练机器学习模型,从而更准确地预测文本的情感。

四、Prompt

  • 在AI中,Prompt是指给模型的文本指导,用于初始化和引导模型生成类似自然语言的输出。它可以是一段或多段文字,定义了模型生成的内容和风格。

    为什么要用Prompt?因为它可以:

    • 1,引导生成: 帮助模型理解任务或上下文,生成更准确的输出。
    • 2,定制风格: 通过Prompt,你可以让模型以特定风格、语气生成内容。
    • 3,提供上下文: 当用户与AI交互时,Prompt可以传递之前的信息,生成有连贯性的回应。

    未来是否会继续使用Prompt取决于技术发展。虽然可能出现新方法,但在目前,Prompt仍然是不可或缺的。在许多NLP应用中,它是引导模型生成准确输出的关键工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/27445.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

力扣:55. 跳跃游戏(Python3)

题目: 给定一个非负整数数组 nums ,你最初位于数组的 第一个下标 。 数组中的每个元素代表你在该位置可以跳跃的最大长度。 判断你是否能够到达最后一个下标。 来源:力扣(LeetCode) 链接:力扣 示例&#xf…

想要保证办公协同文档的安全?这个权限科普你一定要看

企业在设置办公协同文档的时候,通常需要设置权限来确保数据的安全和保密性,并控制用户对文档的访问和编辑权限。looklook今天就从办公协同文档的权限出发,来和大家聊聊这些常见的权限设置。 办公协同文档的权限 1.阅读权限:只允许…

【vim 学习系列文章 4 - vim与系统剪切板之间的交互】

文章目录 背景1.1.1 vim支持clipboard 检查1.1.2 vim的寄存器 上篇文章:【vim 学习系列文章 3 - vim 选中、删除、复制、修改引号或括号内的内容】 背景 从vim中拷贝些文字去其它地方粘贴,都需要用鼠标选中vim的文字后,Ctrlc、Ctrlv&#x…

怎么绘制汤姆索亚历险记思维导图?掌握这几个绘制步骤就可以

怎么绘制汤姆索亚历险记思维导图?如果你正在为学习汤姆索亚历险记而感到困惑,或者你想要更好地理解小说中的人物关系、情节和舞台背景,那么一个清晰的思维导图就可以帮助你梳理思路。那么下面就给大家介绍一下绘制步骤。 在进行思维导图绘制的…

前端面试的性能优化部分(7)每天10个小知识点

目录 系列文章目录前端面试的性能优化部分(1)每天10个小知识点前端面试的性能优化部分(2)每天10个小知识点前端面试的性能优化部分(3)每天10个小知识点前端面试的性能优化部分(4)每天…

docker容器监控:Cadvisor +Prometheus+Grafana的安装部署

目录 Cadvisor PrometheusGrafana的安装部署 一、安装docker: 1、安装docker-ce 2、阿里云镜像加速器 3、下载组件镜像 4、创建自定义网络 二、部署Cadvisor 1、被监控主机上部署Cadvisor容器 2、访问cAdvisor页面 三、安装prometheus 1、部署Prometheus…

Clion开发Stm32之存储模块(W25Q64)驱动编写

前言 涵盖之前文章: Clion开发STM32之HAL库SPI封装(基础库) W25Q64驱动 头文件 #ifndef F1XX_TEMPLATE_MODULE_W25Q64_H #define F1XX_TEMPLATE_MODULE_W25Q64_H#include "sys_core.h" /* Private typedef ---------------------------------------------------…

LNMP搭建

LNMP:目前成熟的企业网站的应用模式之一,指的是一套协同工作的系统和相关软件 能够提供静态页面服务,也可以提供动态web服务。 这是一个缩写 L linux系统,操作系统。 N nginx网站服务,也可也理解为前端&#xff0c…

.ps1和.bat的区别

.ps1和.bat的区别 .ps1 和 .bat 是两种不同的脚本文件类型,分别用于 PowerShell 和 Windows 批处理。它们在语法、功能和用途上有很大的区别: 1. 文件类型: .ps1 是 PowerShell 脚本文件的扩展名,用于编写和执行 PowerShell 脚…

c++画出分割图像,水平线和垂直线

1、pca 找到图像某个区域的垂直线&#xff0c;并画出来 // 1、 斑块的框 血管二值化图&#xff0c;pca 找到垂直血管壁的直线, 还是根据斑块找主轴方向吧// Step 1: 提取斑块左右范围内的血管像素点坐标&#xff0c;std::vector<cv::Point> points;for (int y 0; y <…

公文校对要点:确保准确性和规范性

公文校对是确保文档准确性和规范性的重要步骤。以下是公文校对的要点&#xff1a; 1.拼写和语法检查&#xff1a;仔细检查文档中的拼写错误和语法错误。确保词语的正确拼写&#xff0c;并使用正确的语法结构和标点符号。 2.信息准确性&#xff1a;核对文档中的事实和数据&#…

MySQL流程控制(二十八)

二八佳人体似酥&#xff0c;腰悬利剑斩愚夫&#xff0c;虽然不见人头落,暗里教君骨髓枯。 上一章简单介绍了MySQL变量(二十七) ,如果没有看过,请观看上一章 一. 定义条件与处理程序 定义条件是事先定义程序执行过程中可能遇到的问题&#xff0c;处理程序定义了在遇到问题时应…

三言两语说透webpack对vue的编译

目录 1.写在前面 2.前置条件 3.源码分析 4.大厂面试回答 5.总结 1.写在前面 Webpack作为当下最流行的前端构建工具&#xff0c;它可以处理模块化的JavaScript项目&#xff0c;进行代码打包和优化。在Vue项目中&#xff0c;Webpack发挥着不可或缺的作用&#xff0c;它负责…

广州VR制作 | 利用VR元宇宙平台开展林地管理培训的优势

在林业领域&#xff0c;实地调查是获取准确数据和深入了解森林生态的重要手段。然而&#xff0c;传统的实地调查方法存在诸多问题&#xff0c;如时间成本高、人力物力投入大、安全风险高等。为了解决这些教学痛点&#xff0c;我们引入了虚拟现实(VR)技术&#xff0c;通过虚拟林…

我的创作纪念日【第一个2048day】

机缘 初心&#xff1a;研究生期间&#xff0c;帮老师做一个项目&#xff0c;过程中学习的东西想记录下来&#xff0c;于是&#xff0c;就选择了CADN让技术分享成为工作的一部分 收获 获得了1800多粉丝的关注获得了63万的访问量&#xff0c;其中《C#设计模式》专栏深受大家喜欢…

低代码平台:初创公司的理想选择

对于初创公司而言&#xff0c;时间和资源是宝贵的。他们需要快速构建和部署应用程序&#xff0c;以满足业务需求&#xff0c;提高效率&#xff0c;并保持竞争优势。在这个背景下&#xff0c;低代码平台成为了初创公司的一个理想选择。而Zoho Creator作为一款出色的低代码平台&a…

Python中的Pathlib可以完美替代os.path

相信现在依然有很多人习惯于使用os来处理文件/文件夹/路径等&#xff0c;但其实Python自带的Pathlib库处理这些更优雅、更安全&#xff0c;你会发现很多大型开源项目都在使用它 先看这个引例&#xff0c;假设我们需要获取某个文件夹下所有的txt文件&#xff0c;基于os会写成如…

chatgpt openai API报错openai.error.APIConnectionError

openai.error.APIConnectionError: Error communicating with OpenAI: 报错信息无用方案问题查看urllib3版本方法 可行方案法1法2&#xff1a;自己找包安装 报错信息 raise error.APIConnectionError( openai.error.APIConnectionError: Error communicating with OpenAI: HTT…

Linux ARM64架构 动态替换 altinstructions

文章目录 简介一、altinstructions节1.1 .altinstructions1.2 .rela.altinstructions 二、内核模块重定位源码分析参考资料 简介 在内核开发中&#xff0c;有时需要对内核代码进行修补&#xff0c;以解决bug、优化性能或引入新功能。替代指令&#xff08;altinstructions&…

Connection reset原因分析及解决思路

Connection reset原因分析及解决思路 我们在开发过程中经常会出现Connection reset问题&#xff0c;包括http调用&#xff0c;数据库连接等场景。出现Connection reset的原因很多&#xff0c;本文从tcp层面简单介绍下Connection reset出现的原因和问题&#xff0c;以及在实际开…