大模型为什么会有 tokens 限制？

大模型为什么会有 tokens 限制？

news/2025/10/22 17:45:51/文章来源:https://blog.csdn.net/2301_78285120/article/details/136074511

人是以字数来计算文本长度，大语言模型（LLM）是以 token 数来计算长度的。LLM 使用 token 把一个句子分解成若干部分。

token 可以是一个单词、一个单词中的一个部分、甚至是一个字符，具体取决于它使用的标记化方法 (tokenization method)。比如：句子 “ChatGPT is great !” 可能会被分割成 [“Chat”, “G”, “PT”, " is", " great", “!”] 这 6 个 tokens。

上下文 token 长度为什么会有限制？有以下3方面的相互制约：文本长短、注意力、算力，这3方面不可能同时满足，也就是存在“不可能三角”，如下图所示：

也就是说：上下文文本越长，越难聚焦充分注意力（Transformer 网络的注意力机制），难以完整理解；注意力限制下，短文本无法完整解读复杂信息；处理长文本需要大量算力，从而提高了成本。

根本原因还是大模型的 Transformer 网络结构的自注意力机制，自注意力机制的计算量会随着上下文长度的增加呈平方级增长，比如：上下文增加32倍时，计算量实际会增长1000倍。这就构成了“不可能三角”中的第一组矛盾：上下文文本长短与注意力。

另外在大模型实际部署时，企业端根本无法提供很大的算力支持，这也就倒逼厂商无论是扩大模型参数还是文本长度，都要紧守算力一关。但现阶段要想突破更长的文本技术，就不得不消耗更多的算力，于是就形成了文本长短与算力之间的第二组矛盾。

大模型如何突破 tokens 限制？

突破大模型的 tokens 限制主要采用以下 3种方法。

方法一：采用 LongLoRA 微调技术重建自注意力计算方式。

通过 LongLoRA 微调技术将长文本划分为不同的组，在每个组里进行计算，而不用计算每个词之间的关系，从而降低计算量，提供生成速度。

方法二：采用 RAG 技术给大模型开“外挂”。

将长文本切分为多个短文本处理，大模型在处理长文本时，会在向量数据库中对短文本进行检索，以此来获得多个短文本回答构成的长文本。每次只加载所需要的短文本片段，从而避开了模型无法一次读入整个长文本的问题。

方法三：提升大模型支持的上下文长度。

对大模型的上下文长度持续优化，比如：以 OpenLLaMA-3B 和 OpenLLaMA-7B 模型为起点，在其基础上进行微调，产生了LONGLLaMA 新模型。该模型很容易外推到更长的序列，在 8K tokens上训练的模型，很容易外推到 256K 窗口大小。

在技术侧这3种方法到底如何实现？可以参与我们下面的技术群

技术交流&资料

技术要学会分享、交流，不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。

成立了大模型技术交流群，本文完整代码、相关资料、技术交流&答疑，均可加我们的交流群获取，群友已超过2000人，添加时最好的备注方式为：来源+兴趣方向，方便找到志同道合的朋友。

方式①、微信搜索公众号：机器学习社区，后台回复：加群
方式②、添加微信号：mlc2060，备注：来自CSDN + 技术交流

通俗易懂讲解大模型系列

做大模型也有1年多了，聊聊这段时间的感悟！
用通俗易懂的方式讲解：大模型算法工程师最全面试题汇总
用通俗易懂的方式讲解：不要再苦苦寻觅了！AI 大模型面试指南（含答案）的最全总结来了！
用通俗易懂的方式讲解：我的大模型岗位面试总结：共24家，9个offer
用通俗易懂的方式讲解：大模型 RAG 在 LangChain 中的应用实战
用通俗易懂的方式讲解：一文讲清大模型 RAG 技术全流程
用通俗易懂的方式讲解：如何提升大模型 Agent 的能力?
用通俗易懂的方式讲解：ChatGPT 开放的多模态的DALL-E 3功能，好玩到停不下来！
用通俗易懂的方式讲解：基于扩散模型（Diffusion）,文生图 AnyText 的效果太棒了
用通俗易懂的方式讲解：在 CPU 服务器上部署 ChatGLM3-6B 模型
用通俗易懂的方式讲解：使用 LangChain 和大模型生成海报文案
用通俗易懂的方式讲解：ChatGLM3-6B 部署指南
用通俗易懂的方式讲解：使用 LangChain 封装自定义的 LLM，太棒了
用通俗易懂的方式讲解：基于 Langchain 和 ChatChat 部署本地知识库问答系统
用通俗易懂的方式讲解：在 Ubuntu 22 上安装 CUDA、Nvidia 显卡驱动、PyTorch等大模型基础环境
用通俗易懂的方式讲解：Llama2 部署讲解及试用方式
用通俗易懂的方式讲解：基于 LangChain 和 ChatGLM2 打造自有知识库问答系统
用通俗易懂的方式讲解：一份保姆级的 Stable Diffusion 部署教程，开启你的炼丹之路
用通俗易懂的方式讲解：对 embedding 模型进行微调，我的大模型召回效果提升了太多了
用通俗易懂的方式讲解：LlamaIndex 官方发布高清大图，纵览高级 RAG技术
用通俗易懂的方式讲解：为什么大模型 Advanced RAG 方法对于AI的未来至关重要？
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成
用通俗易懂的方式讲解：基于 Langchain 框架，利用 MongoDB 矢量搜索实现大模型 RAG 高级检索方法
用通俗易懂的方式讲解：使用Llama-2、PgVector和LlamaIndex，构建大模型 RAG 全流程

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/673005.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

为电子表格嵌入数据库，Excel/WPS一键升级为管理系统

为电子表格嵌入数据库，Excel/WPS一键升级为管理系统

将Excel表格转化为管理系统，这款工具能够实现只需导入表格数据，即可自动生成相应的软件和APP。表格办公的烦恼，有遇到吧？ 对于具有一定规模的企业而言，各类表格如同繁星般众多，既有日常使用的常规表格&a…

阅读更多...

泰克示波器——TBS2000系列界面整体介绍

泰克示波器——TBS2000系列界面整体介绍

目录 1.1 通道区域面板标识1.2 示波器测试输出（检测探针与设置的好坏）1.3 面板其他快捷按钮1.4 波器整体界面 1.1 通道区域面板标识在通道面板的下方标识有示波器的通道属性以及参数值，如我使用的型号为“TBS2104X”的示波器，面…

阅读更多...

格子表单GRID-FORM | 文档网站搭建（VitePress）与部署（Github Pages）

格子表单GRID-FORM | 文档网站搭建（VitePress）与部署（Github Pages）

格子表单/GRID-FORM已在Github 开源，如能帮到您麻烦给个星🤝 GRID-FORM 系列文章基于 VUE3 可视化低代码表单设计器嵌套表单与自定义脚本交互文档网站搭建（VitePress）与部署（Github Pages） 效果预览格…

阅读更多...

如何使用VMware分享出来的虚拟机系统（OVF文件）

如何使用VMware分享出来的虚拟机系统（OVF文件）

前言这几天看到很多小伙伴都在安装虚拟机，但成不成就不知道了。所以小白准备把自己安装完成的系统打包分享给小伙伴。如果你需要已经安装完成的虚拟系统，可以获取哦！打开即用！ 虚拟机系统包括： Win10 专业版 Wi…

阅读更多...

关于git经常会碰到的几个场景分析

关于git经常会碰到的几个场景分析

1.把其他远程分支代码同步合并到本地分支，比如：git将另一个远程分支origin/develop代码合入我现在的本地分支B,本地分支对应的远程分支是origin/b。要将远程分支 origin/develop 的代码合并到本地分支 B（对应的远程分支是 origin/B&#xf…

阅读更多...

anaconda+pytorch+pycharm安装总结

anaconda+pytorch+pycharm安装总结

1.下载最新的Anaconda,目前是python3.11适用 anaconda官网安装教程卸载并重新安装的教程 （如果找不到火绒清理注册表垃圾的位置可以拉到文章底部查看） 2.pytorch安装，注意python版本、cuda版本和pytorch版本的适配安装教程 3.pycharm安装和…

阅读更多...

C++: 模板初阶

C++: 模板初阶

目录引子： 函数模板格式： 例子： 函数模板的实例化： 隐形实例化：让编译器根据实参推演模板参数的实际类型显式实例化： 在函数名后的<>中指定模板参数的实际类型模板参数的匹配原则类模…

阅读更多...

ssm+vue的校园一卡通密钥管理系统（有报告）。Javaee项目，ssm vue前后端分离项目。

ssm+vue的校园一卡通密钥管理系统（有报告）。Javaee项目，ssm vue前后端分离项目。

演示视频： ssmvue的校园一卡通密钥管理系统（有报告）。Javaee项目，ssm vue前后端分离项目。项目介绍： 采用M（model）V（view）C（controller）三层体系…

阅读更多...

C++入门学习（二十五）do-while循环

C++入门学习（二十五）do-while循环

do { // 代码块，至少会执行一次 } while (条件); 对比一下while和do-while循环： 因为while循环先判断条件，所以数字10直接就没有进入for循环里，卡在了判断条件这一步，所以就没有输出数据； do-while循环是…

阅读更多...

clickhouse计算前后两点间经纬度距离

clickhouse计算前后两点间经纬度距离

问题计算如图所示前后两点经纬度的距离？ 方法 1、用开窗函数将如图所示数据下移一行 selectlongitude lon1,latitude lat1,min(longitude) over(order by time1 asc rows between 1 PRECEDING and 1 PRECEDING) lon2,min(latitude) over(order by time1 asc row…

阅读更多...

查询到List后再进行分页（mybatis-plus

查询到List后再进行分页（mybatis-plus

如果您需要首先获取符合条件的所有数据，然后在内存中进行筛选，以满足特定条件，而不是在数据库层面进行条件查询，您可以继续使用您的原始实现。但是，为了正确实现分页，您需要对分页结果进行调整。以下是一个…

阅读更多...

Vagrant 虚拟机工具基本操作指南

Vagrant 虚拟机工具基本操作指南

Vagrant 虚拟机工具基本操作指南 #虚拟机 # #vargant# #ubuntu# ‍ 虚拟机virtualbox ,VMWare及WSL等大家都很了解了，那Vagrant是什么东西？ 它是一组命令行工具，可以象Docker管理容器一样管理虚拟机，这样快速创…

阅读更多...

$鸿蒙OS导入项目报错不能运行 @ohos\hvigor\bin\hvigor.js‘$

鸿蒙OS导入项目报错不能运行 @ohos\hvigor\bin\hvigor.js‘

在自学HarmonyOS时，想在DevEco Studio导入官方示例代码：待办列表（ArkTS）报错 C:\Users\woods\Downloads\test01\ToDoListArkTS\node_modules\ohos\hvigor\bin\hvigor.js --mode module -p moduleentrydefault -p productdefault …

阅读更多...

03-抓包_封包_协议_APP_小程序_PC应用_WEB应用

03-抓包_封包_协议_APP_小程序_PC应用_WEB应用

抓包_封包_协议_APP_小程序_PC应用_WEB应用一、参考工具二、演示案例：2.1、WEB应用站点操作数据抓包-浏览器审查查看元素网络监听2.2、APP&小程序&PC抓包HTTP/S数据-Charles&Fiddler&Burpsuite2.3、程序进程&网络接口&其他协议抓包-WireSh…

阅读更多...

《剑指 Offer》专项突破版 - 面试题 35 : 最小时间差（两种方法 + C++ 实现）

《剑指 Offer》专项突破版 - 面试题 35 : 最小时间差（两种方法 + C++ 实现）

目录前言一、排序二、数组前言题目链接：LCR 035. 最小时间差 - 力扣（LeetCode） 题目： 给定一组范围在 00:00 至 23:59 的时间，求任意两个时间之间的最小时间差（以分钟数表示）。例如&…

阅读更多...

YOLO部署实战（2）：使用OpenCV优化视频转图片流程并设置帧数

YOLO部署实战（2）：使用OpenCV优化视频转图片流程并设置帧数

在计算机视觉和图像处理领域，OpenCV是一个强大的开源库，它为处理图像和视频提供了丰富的工具和功能。本文将介绍如何使用OpenCV将视频文件转换为一系列图片，并演示如何通过设置转换的帧数来优化这一过程。 1 Win10配置OpenCV 在Windows操作…

阅读更多...

数据结构与算法之美学习笔记：50 | 索引：如何在海量数据中快速查找某个数据？

数据结构与算法之美学习笔记：50 | 索引：如何在海量数据中快速查找某个数据？

目录前言为什么需要索引？索引的需求定义构建索引常用的数据结构有哪些？总结引申前言本节课程思维导图： 在第 48 节中，我们讲了 MySQL 数据库索引的实现原理。MySQL 底层依赖的是 B 树这种数据结构。留言里有同学问我&#xff…

阅读更多...

提示由于找不到msvcp120dll无法继续执行此代码怎么办

提示由于找不到msvcp120dll无法继续执行此代码怎么办

在计算机系统中，MSVCP120.dll是一个至关重要的动态链接库文件，它是Microsoft Visual C Redistributable Package的一部分，对于许多基于Windows的应用程序运行至关重要。当系统提示“msvcp120dll丢失”时，意味着该文件可能由于误删…

阅读更多...

C++之RTTI实现原理

C++之RTTI实现原理

相关系列文章 C无锁队列的原理与实现如何写出高质量的函数？快来学习这些coding技巧从C容器中获取存储数据的类型 C之多层 if-else-if 结构优化(一) C之多层 if-else-if 结构优化(二) C之多层 if-else-if 结构优化(三) C之Pimpl惯用法 C之RTTI实现原理目录 1.引言…

阅读更多...

汇编笔记 01

汇编笔记 01

小蒟蒻的汇编自学笔记，如有错误，望不吝赐教文章目录笔记编辑器，启动！debug功能CS & IPmovaddsub汇编语言寄存器的英文全称中英对照表muldivandor 笔记编辑器，启动！ 进入 debug 模式 debug功能 …

阅读更多...

最新文章