清华学霸引爆“长文本”大战,大模型的应用前景清晰了吗?

文 | 智能相对论

作者 | 沈浪

Long-LLM(长文本大模型)时代似乎来得有些突然,而引爆这场热潮的,竟是一家由清华学霸牵头的本土AI初创企业。

前不久,月之暗面(Moonshot AI)公司宣布旗下对话式 AI 助理产品 Kimi 应用现已支持200万字无损上下文输入。

对比去年10月份Kimi上线时仅支持的20万字,这一波升级直接提升了10倍文本处理能力,同时也引起了强烈的市场反应,特别是在资本市场,Kimi概念股应运而生,诸如九安医疗、华策影视、中广天择等都受益于Kimi概念而实现了股价不同程度的涨幅。

这些刺激更让大模型领域彻底卷起了长文本大战。

01  “长文本”大战,卷的不是字数而是财力

阿里率先完成自家的大模型产品升级,强化长文本处理能力,免费面向大众开放最高1000万字的长文本处理能力。

360则紧随其后,宣布旗下360智脑正式内测500万字的长文本功能,并在360AI浏览器开放给用户使用。

而百度也宣布在下个月进行版本升级,开放长文本能力,文字范围会在200万-500万字。

目前,文心一言的文本上限大致为2.8万字。而像GPT-4Turbo-128k公布的文本范围也不过为10万汉字,Claude3200k上下文约16万汉字。

可以说,这一波热潮直接把国内的大模型厂商一下子都拉进了百万量级的长文本竞赛,而主流厂商的入局也为这场“长文本”大战增添了很多看头。

目前来看,“长文本”大战的赛点主要呈现在两个方面。

一方面,是大模型的支持文本参数。类似阿里通义千问的1000万字、360智脑的500万字、百度文心一言的200万-500万字、Kimi的200万字等等,都在极力向市场争“彩头”,告诉用户自家的长文本处理能力足够“长”。

另一方面,是长文本处理能力的开放程度。有意思的是,Kimi是免费开放给用户使用的,阿里通义千问的长文本处理功能也是免费的,360智脑、百度文心一言也没有要收费的意思。——以“长文本”大战为例,今年的大模型竞争远比去年要“卷”得多。

还记得去年大火的妙鸭相机,以及各式各样的图片生成式服务,都或多或少地通过各种形式如充值、办会员等,要求用户付费才能体验。

今年大模型领域的这把“火”烧得旺,也烧的离奇地“free”。

为什么?

Kimi自升级以来,就有大量用户不断涌入,激增的流量更是一度让月之暗面(Moonshot AI)的服务器承受了巨大的压力,一度陷入宕机,旗下的App和小程序都无法正常使用。

根据月之暗面(Moonshot AI)发布的官方消息,从3.20观测到流量异常增高后,已经进行了5次扩容工作。推理资源会持续配合流量进行扩容,以尽量承载持续增长的用户量。

简单来说,用户对长文本功能是非常有兴趣的,相关的市场需求还在保持持续性的、爆炸性的增长。同时,大量的用户涌进,不仅提高了大模型产品的知名度,更重要的是在大量用户的基础上通过类似于UGC的模式去探索大模型的应用,或许更能进一步推动Long-LLM(长文本大模型)的商业化进程。

当然,在这个过程中,不可避免地就得投入大量资金,一旦商业化加速,大模型厂商就得做好“卷”财力的准备。

阿里通义千问目前免费对所有人开放高达万页的文档处理能力,如果要计算成本,按照目前最便宜的市价0.1元/页,10000页的文档光解析费用就要1000元,这还不包括解析完成之后大模型处理文档的成本。考虑到通义千问网页、APP、钉钉等多个端口的用户基数,需要投入的资金恐怕不会是个小数目。

大模型的商业化在开始阶段并非“赚钱”,而是“烧钱”。

02  长文本,直接“接驳”商业化场景

在大模型的商业化进程上,长文本的爆火是很关键的一环。

就大模型的技术原理而言,解决长文本问题是必要的。因为文本长度的提高,对应的模型能解决问题的边界也将大幅提升,两者呈现出明显的正向关系。

传统的文本处理模型受限于训练结构,可支持的文本范围都不算长,在处理复杂任务和深度专业知识(这一类知识往往都是长篇巨著)时,只能拆解输入训练,由此就有可能导致输出的结果上下文逻辑不连贯不顺畅等问题。

区别于传统的文本处理模型,长文本模型就具备更准确的文本理解和生成能力以及更强大的跨领域迁移能力。这对于打造垂直领域的行业专家是一个非常必要的能力支持,比如面向一些长篇巨制的医疗文献、法律文件、财务报告等,长文本模型就具备更好的理解能力,对应完成跨领域学习和应用,从而打造出更专业的医疗助理、法律助理以及金融助理等应用。

话不多说,实践一下。

在这里,「智能相对论」向阿里通义千问相继“投喂”了几本长达数百页的专业书籍,涵盖以《高产母猪饲养技术有问必答》为代表的农业养殖、以《犬猫营养需要》为代表的宠物喂养等等小众领域。

结果所能实现的效果确实令人惊讶,阿里通义千问不仅能高度概括总结这些长篇巨著的主要内容,还能有针对性的给出具体篇章的知识解答。比如,在《高产母猪饲养技术有问必答》一书中,「智能相对论」向其提问“夏季高温提问应该如何饲养母猪?”很快就得到了书中的精炼解答。

这意味着什么?只要用户有足够多的专业书籍“投喂”给大模型,那么大模型就可以成长为一个专业的专家助理,帮助用户快速解答相关专业问题。

在日常生活中,或许有很多书籍是我们没办法去仔细阅读和学习的,但是只要有长文本大模型予以支持,那么基本上人人都能创造一个专业的垂直领域助理。

这或许会颠覆现在我们获取信息、知识的渠道,去百度搜索或是去知乎提问、亦或是去小红书讨论这些路径都将被替代。

在Kimi开放20万字文本处理能力的时候,其做了一个简单的对比,20万字等于什么?答案是等于先秦的全部古籍。随着长文本大模型进入百万量级的迭代,那么这些能力还能实现进一步的进化,对应所赋予场景应用的机会就是无限的。

如今,在AI领域,Agent的话题也很火,被认为是下一个主流的应用形态。那么,打造Agent的关键是什么?答案正是大模型的长文本处理能力。

比如,Kimi就在帮助元隆雅图等公司进行营销升级,基于长文本处理能力来提供爆品文案分析、文案写作、市场分析、辅助营销策划等功能。

尽管现在很多相关的应用还处在探索阶段,但是谁又能确定下一个爆款应用不是出自自家的大模型+某个C端用户的想法/某个企业客户的业务融合?正因如此,大模型厂商们才不顾一切的升级并开放长文本功能,为下一场应用上的爆火做准备。

目前,长本文的火爆还只是技术上的,接下来的爆点大概率将是应用上的爆发。

03  写在最后

2024年是大模型大规模走向商业化的关键一年。从Kimi的火爆程度来看,以长文本为代表的技术迭代走向C端引发了非常积极的反馈。同时,在「智能相对论」的实践中,也预感这一能力随着技术的成熟和完善,必然会在C端用户的手中被“玩出花来”。

只是目前很多的“玩法”还缺乏打磨,显得比较粗糙。OpenAI在发布GPT商店时,就期望要打造一个全新的生态,人人都能创造自己的专属GPTs。

现在,摆在大众面前的长文本热潮,其实就是一个全民时代到来的信号。只要用户有书,会投喂,那么同样可以在国内的大模型平台上打造出属于自己想要的专业助理,进而延伸到应用端的火爆。

当然,在这个过程中,书籍的版权问题、平台的审核问题以及巨大的流量涌入所带来的诸多挑战和问题,也是大模型走向商业化的难点。但是,其根本的方向是清晰的,Long-LLM(长文本大模型)时代已经拉开序幕,从技术到应用,接下来大模型厂商们有得卷了。

说实在,就目前各大厂商公布的参数,从500万到1000万,基本上也足够用了。大模型在长文本技术层面或许不会再有什么值得卷了,哪怕是有也只是背地里正常迭代和发展。

接下来的爆点只能是往应用层面来看。不管是To C还是To B,谁家的平台最先把大众化的应用探索并验证出来,再加以打磨推向大众市场,那么谁就有可能成为下一个市场的宠儿。

*本文图片均来源于网络 

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/787287.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux 环境安装配置

安装java17 1.下载安装包 wget https://download.oracle.com/java/17/latest/jdk-17_linux-x64_bin.tar.gz 2.解压到自定义目录/usr/local/java mkdir /usr/local/java tar zxvf jdk-17_linux-x64_bin.tar.gz -C /usr/local/java 3.配置环境变量 echo export PATH$PATH:/…

金三银四面试题(十):Java基础问题(1)

这部分面试题多用于面试的热身运动,对很多找实习和准备毕业找工作的小伙伴至关重要。 访问修饰符 在 Java 中,提供了四种访问权限控制: public private protected 以及什么都不写(default) 修饰符当前类同包子包其他…

SSM学习——Spring AOP与AspectJ

Spring AOP与AspectJ 概念 AOP的全称为Aspect-Oriented Programming,即面向切面编程。 想象你是汉堡店的厨师,每一份汉堡都有好几层,这每一层都可以视作一个切面。现在有一位顾客想要品尝到不同风味肉馅的汉堡,如果按照传统的方…

【java】关于String、StringBuffer和StringBuilder的那些事

在之前的文章中我们曾简单介绍过String这个引用类型变量,其实它还有许多特性,还有StringBuffer和StringBuilder这两个方法在字符串操作中也有非常重要的地位,接下来就由小编带大家梳理一下吧👊 目录 一、String 1、构造方法 2、…

独立开发者用微信小程序赚钱

微信小程序能实现赚钱,赚多赚少的问题。 本人就上线了一款小程序 ,集结者assemble ,现在上了广告了,收益不是很多,但胜在持续,税后收入,也还在持续推广中。 开发小程序赚大钱得找到变现模式&a…

0基础学习Mybatis系列数据库操作框架——目录结构

大纲 配置的修改代码的修改Main.java文件所在包下新增org.example.model包新增org.example.mapper包 单元测试 在《0基础学习Mybatis系列数据库操作框架——最小Demo》一文中,我们用最简单的方法组织出一个Mybatis应用项目。为了后续构建更符合日常开发环境的项目&a…

归并排序和分治

归并排序 归并排序是利用归并的思想实现的排序方法,该算法采用经典的分治策略(分治法将问题分成一些小的问题然后递归求解,而治的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。 分而治之 可以看到这种结构…

书生浦语全链条开源开放体系

开放了高质量语料数据 预训练 微调 评测 评测框架 部署 智能体 例如把openlab对于计算机视觉的封装

LeetCode-894. 所有可能的真二叉树【树 递归 记忆化搜索 动态规划 二叉树】

LeetCode-894. 所有可能的真二叉树【树 递归 记忆化搜索 动态规划 二叉树】 题目描述:解题思路一:分治,递归解题思路二:动态规划。关键思路是如果构造节点数目为 n 的真二叉树,此时可以从节点数目序列为 [(1,n−2),(3,…

Linux网络编程二(TCP图解三次握手及四次挥手、TCP滑动窗口、MSS、TCP状态转换、多进程/多线程服务器实现)

文章目录 1、TCP三次握手(1) 第一次握手(2) 第二次握手(3) 第三次握手 2、TCP四次挥手(1) 一次挥手(2) 二次挥手(3) 三次挥手(4) 四次挥手 3、TCP滑动窗口4、TCP状态时序图5、多进程并发服务器6、多线程并发服务器 1、TCP三次握手 TCP三次握手(TCP three-way handshake)是TCP协…

选择SD-WAN带宽时需要考虑什么?

部署SD-WAN之前,企业需要考虑关系到带宽大小的一系列因素,以确保其网络能够满足业务需求并保持高效运行。以下是一些在确定SD-WAN带宽时需要考虑的关键因素: 企业规模和用户数量: 企业规模和用户数量是决定带宽需求的重要因素之一…

Vue的前世今生与安装配置

vue的前世今生 Vue.js是一个流行的前端JavaScript框架,用于构建用户界面与单页应用程序(SPA)。它的诞生和发展可以概括为以下几个重要阶段: 初创阶段:Vue由中国人尤雨溪(Evan You)创建于2014年…

人工智能聊天机器人都有哪些?分享3款神奇的软件!

在数字化浪潮中,人工智能聊天机器人以其独特的魅力和实用性,逐渐成为我们生活中不可或缺的一部分。它们能够与用户进行智能互动,提供多元化的服务,让我们的生活更加便捷和高效。那么,市场上究竟有哪些领先的人工智能聊…

智能停车场物联网远程监控解决方案

智能停车场物联网远程监控解决方案 智能停车场物联网远程监控解决方案是一种集成了现代物联网技术、大数据分析以及云计算等先进技术手段,对停车场进行全面智能化管理的综合系统。它通过实时感知、精准采集和高效传输各类停车数据,实现对停车场运营状态…

springcloud基本使用二(远程调用)

创建两个springboot maven子项目 子项目名称分别为order-server和user-server 配置user-server子项目: 所需依赖: <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId> </dependenc…

站群CMS系统

站群CMS系统是一种用于批量建立和管理网站的内容管理系统&#xff0c;它能够帮助用户快速创建大量的网站&#xff0c;并实现对这些网站的集中管理。以下是三个在使用广泛的站群CMS系统&#xff0c;它们各具特色&#xff0c;可以满足不同用户的需求。 1. Z-BlogPHP Z-BlogPHP是…

4年经验来面试20K的测试岗,一问三不知,我还真不如去招应届生。

公司前段缺人&#xff0c;也面了不少测试&#xff0c;结果竟然没有一个合适的。一开始瞄准的就是中级的水准&#xff0c;也没指望来大牛&#xff0c;提供的薪资在10-20k&#xff0c;面试的人很多&#xff0c;但平均水平很让人失望。看简历很多都是4年工作经验&#xff0c;但面试…

vue使用i18n

&#x1f388;个人主页&#xff1a;靓仔很忙i &#x1f4bb;B 站主页&#xff1a;&#x1f449;B站&#x1f448; &#x1f389;欢迎 &#x1f44d;点赞✍评论⭐收藏 &#x1f917;收录专栏&#xff1a;前端 &#x1f91d;希望本文对您有所裨益&#xff0c;如有不足之处&#x…

力扣热题100_链表_141_环形链表

文章目录 题目链接解题思路解题代码 题目链接 141. 环形链表 给你一个链表的头节点 head &#xff0c;判断链表中是否有环。 如果链表中有某个节点&#xff0c;可以通过连续跟踪 next 指针再次到达&#xff0c;则链表中存在环。 为了表示给定链表中的环&#xff0c;评测系统…

2024年网络安全运营体系建设方案

以下是部分WORD内容&#xff0c;请您参阅。如需下载完整WORD文件&#xff0c;请前往星球获取&#xff1a; 网络安全运营监控工作整体构想 工作目标及原则 工作目标 为进一步落实强化公司网络安全保障&#xff0c;有效支撑公司数字化转型战略&#xff0c;建立健全公司网省两级协…