国内类似ChatGPT的大模型应用有哪些?发展情况如何了

第一部分:几个容易混淆的概念

图片

很多人,包括很多粉丝的科技博主,经常把ChatGPT和预训练大模型混为一谈,因此有必要先做一个澄清。预训练大语言模型属于预训练大模型的一类,而ChatGPT、文心一言又是预训练大语言模型的一个具体应用(如下图所示)。

图片

而我们今天讨论的主要是预训练大语言模型的应用,也就是我们能看得见摸得着的东西。

第二部分 国外预训练大语言模型典型应用

图片

\1. 大名鼎鼎的ChatGPT。OpenAI于2022年11月30日发布了ChatGPT,背后是微软(主要投资方)。ChatGPT一经发布就惊艳了四方,而且仅仅2个月就突破了1亿用户,打破世界纪录成为彻底的网红产品。相比较而言TikTok(抖音国际版)达到1亿用户用时9个月,Instagram(照片墙)则花了两年半的时间,Facebook当时也花了852天,可见ChatGPT有多强。

\2. 谷歌:Bard。谷歌在2023年2月9日,在巴黎发布了Bard,是专门为对抗ChatGPT出的聊天机器人产品。然而,谷歌给大家期望过高,这个产品发布会上竟然不慎翻车了,出现了一个明显的事实错误。大家可自行搜索百度,了解详情。谷歌在AI领域的领导者地位毋庸置疑,期待后续改进。

3.Anthropic: Claude. Claude大模型应用跟ChatGPT类似。Anthoropic同样是一家小有名气的创业公司,据说OpenAI核心技术人员有一部分离开,加入了Claude的开发中。

图片

第三部分 国内预训练大模型典型应用及进展

图片

\1. 百度:文心一言。2023年3月16日百度发布了文心一言,类似于ChatGPT的产品。百度做搜索引擎起家,是最早布局大模型的公司之一,因此能够实现国内率先的发布。不过,在前一天3月15日,ChatGPT进行了迭代和发布,给文心一言的发布造成不小压力。

图片

\2. 阿里:通义千问。阿里于2023年4月7日发布了“通义千问”,但并未大张旗鼓的召开新闻发布会,而是采用了邀请客户体验的方式。目前通义千问已经有人体验了,知乎上有人和文心一言做了对比测试,大家可以自行搜索。

\3. 华为:盘古大模型。华为于2023年4月8日在由中国人工智能学会主办的人工智能大模型技术高峰论坛上展示了盘古大模型的进展及其应用。不过这次是大模型,并没有类似ChatGPT的应用出来。

图片

\4. 腾讯:混元大模型。同样这次说的是大模型,并非ChatGPT类似的应用。腾讯总裁刘炽平表示,腾讯不会匆忙推出产品,而是将花费时间打造一个经过多次迭代后的长期发展机会。

\5. 京东:ChatJD。2023年2月5日,京东宣布将于未来发布类似于ChatGPT的应用——ChatJD,聚焦的是产业版。但发布时间未知。

\6. 商汤:2023年4月10日下午举办了技术交流日活动,分享人工智能技术的前沿进展,并公布其在大模型方面的最新情况。商汤研发的大语言模型被命名为“商量SenseChat”

\7. 科大讯飞:科大讯飞将于2023年5月6日发布了讯飞星火认知大模型,具有文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力 7 大核心能力。讯飞背后有中科大/中科院,语音/NLP相关领域还是十分不错的。

此外,旷世、快手等也有大模型方面的布局,近期没有消息,这里就不一一列举。

第四部分 对国内AI的发展应持有敬畏之心

图片

不得不承认,不管是百度的文心一言还是阿里的通义千问,跟ChatGPT相比还是有些差距的。但大可不必抱着喷的心态来看待这个问题。在我国,现在即便是大厂,做这件事情本身也挺不容易。主要有如下原因:

\1. 训练用的芯片被美国卡脖子。根据升级后的美国禁令条例,英伟达超算和云端训练产品A100 和H100、AMD的MI250和MI250X等GPU产品均在禁售范围之内。尤其是Nivida H100系列,这么强的芯片根本就不卖给中国;现在连A100都给限制了。为了曲线救国,国外芯片厂商也得是调整参数后才能卖给我国。因此,大家只能用之前的存货或其他算力低的芯片。(参考《美国出口管理条例》)

\2. 研发成本高。根据艾瑞咨询,ChatGPT计算资源成本很高,迭代训练一次需要460万美元。以及需要高端人才、科学家等研发成本。对国内公司而言,这一样是真金白银、每天都在烧钱。

\3. 使用成本高。目前,国内的ChatGPT类应用还没有探索出来商业化之路,每一次交互都会耗费底层大量的算力资源。毕竟研发完成以后还要跑起来的。

因此,相互理解最好,多给国内公司点个赞。模型毕竟会不断迭代的,相信未来的产品会越来越好!我们在AI的赛道上也有自己的东西!

图片

2024年3月份更新:

在过去的一年里,大模型发展非常迅速,国内据说已经有几百个做大模型的公司。有的在卷底层大模型,有的在卷大模型工具链,也有的在卷应用。这里补充列举一些做大模型基座的公司,供大家参考。

做大模型的公司,目前大体可分为四类:互联网大厂、垂类AI公司、初创公司、学术派机构。具体可参考如下值得关注的清单:

1. 互联网大厂

图片

2. 垂类AI公司

图片

3. 初创公司

图片

4. 学术机构派

图片

上述榜单只是在笔者的认知里,列举了其中一些比较有代表性的。没在清单里的也同样优秀,大家加油!争取早日突破老美的封锁,早日让我国在AI领域引领世界~

2024年5月份更新:

5月份最大的新闻是大模型相关产品降价狂潮,具体汇总如下:

5月15日字节公布了豆包主力模型在企业市场的定价。并称“1块钱能买到豆包主力模型的125万tokens,相当于三本《三国演义》。”(一个中文词语、英文单词、数字、符号计为1个token)

5月21日,阿里云宣布通义千问旗下9款商业化及开源模型降价的同时,也对标表明了“1块钱可以买200万tokens,相当于5本《新华字典》的文字量。”

几小时后,百度智能云迅速跟进,宣布文心大模型的两款主力模型ENIRE Speed和ENIRE Lite全面免费。

随后,科大讯飞宣布,讯飞星火API能力正式免费开放。同日,腾讯云也宣布,其主力模型之一混元-lite模型的价格从0.008元/千tokens调整为全面免费。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/20515.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

node基础-持续更新

node基础 1.node模块2.node环境搭建3.fs模块4.ES模块和CommonJS模块4.1 更改后缀名4.2 package.json配置支持es模块4.3 变量别名4.4 CommonJS模块 5.打造自己的脚手架工具5.1创建自定义全局指令5.2 使用commander处理--help参数5.3 处理自定义指令5.4 逻辑代码模块化拆分5.5 命…

iPad里的图片如何导出 iPad的照片如何管理

我们的设备中充满了各种重要的照片和视频,特别是iPad,作为苹果公司的一款强大的平板电脑,它不仅能够捕捉生活中的精彩瞬间,还可以存储和展示我们珍贵的回忆。然而,随着照片数量的不断增加,有效地管理和导出…

对boot项目拆分成cloud项目的笔记

引言:这里我用的是新版本的技术栈 spring-boot-starter-parent >3.2.5 mybatis-spring-boot-starter >3.0.3 mybatis-plus-boot-starter >3.5.5 spring-cloud-dependencies …

JVMの内存泄漏内存溢出案例分析

1、内存溢出 内存溢出指的是程序在申请内存时,没有足够的内存可供分配,导致无法满足程序的内存需求,常见的内存溢出情况包括堆内存溢出(Heap Overflow)和栈溢出(Stack Overflow): …

AI去衣技术中的几何着色:揭秘数字时尚的魔法

在数字化时代,人工智能(AI)正以前所未有的速度改变我们的生活,从智能家居到自动驾驶汽车,再到个性化医疗。然而,AI的影响远不止于此。它正在重塑我们对艺术、设计和时尚的理解。特别是在数字时尚领域&#…

Unity打包Webgl端进行 全屏幕自适应

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 一:修改 index.html二:将非移动端设备,canvas元素的宽度和高度会设置为100%。三:修改style.css总结 下载地址&#x…

Solidity学习-投票合约示例

以下的合约有一些复杂,但展示了很多Solidity的语言特性。它实现了一个投票合约。 当然,电子投票的主要问题是如何将投票权分配给正确的人员以及如何防止被操纵。 我们不会在这里解决所有的问题,但至少我们会展示如何进行委托投票,…

《java数据结构》--详解Map和Set

概念 Map和set是一种专门用来进行搜索的容器或者数据结构,其搜索的效率与其具体的实例化子类有关。在之前我们常见的搜索方式一般有两种: 一种是直接遍历,这种方法的时间复杂度为O(N),如果元素比较多的话效率会十分低下另一种是…

Leecode---动态规划---打家劫舍 / 乘积最大子数组

动态规划法: 思路: (1)状态定义:dp[i]代表前i家能偷盗的最大金额 (2)状态初始化:如果只有一家,只能偷这家dp[0]nums[0];如果有两家,因为是连通的&…

看图猜成语微信小程序源码

后台可以自行设置关卡、等级、也可以一键部署, 开通流量主之后实现躺赚,你懂得。 个人号也可以开通,审核一次性必过。 类目选择 教育,源码仅供您参考! 源码下载 https://download.csdn.net/download/huayula/8938579…

【计算机毕业设计】基于SSM+Vue的网上花店系统【源码+lw+部署文档】

目录 目 录 1 绪论 1.1 选题背景 1.2 选题意义 1.3 研究内容 2 系统开发技术 2.1 Java语言 2.2 SSM框架 2.3 MYSQL数据库 2.4 Vue框架 3 系统分析 3.1可行性研究 3.1.1经济可行性 3.1.2时间可行性 3.1.3操作可行性 3.2系统性能分析 3.2.1系统易用性 3.2.2系统健壮性 3.2.3系统…

电脑没电关机,wsl和docker又挂了,附解决过程

如题,开了个会没带笔记本电源,点啊弄关机后docker打不开,我以为是docker坏了,结果docker报错: An unexpected error occurred while executing a WSL command. Either shut down WSL down with wsl --shutdown, and/or…

【蓝桥杯国赛】双指针

适用于以下的情境: ① 数组 / 字符串中,有多少个满足情况的连续区间。 ② 数组 / 字符串,合并。 【第十三届pythonB组试题:近似gcd】 1. 题目描述 2. 难度:⭐⭐⭐⭐ 3. 思考分析: 具体参考&#xff…

依据SAM大模型识别的英国农田(农业田野)边界(FIBOA)矢量数据集

简介 fiboa 是一项旨在提高农田边界数据互操作性和相关农业数据的合作计划。最近推出的 fiboa 不仅仅是一个规范,它还是一个全面的系统,包括符合规范的数据、不断完善规范的讨论以及积极促进其发展的活跃社区。本项目的重点是促进创建更多有关田地边界和…

黑马程序员——Spring框架——day03

目录: AOP AOP简介 问题导入AOP简介和作用【理解】AOP的应用场景为什么要学AOPAOP入门案例【重点】 问题导入AOP入门案例思路分析AOP入门案例实现AOP中的核心概念AOP工作流程【理解】 问题导入AOP工作流程AOP核心概念在测试类中验证代理对象AOP切入点表达式 问题导…

【python】爬虫记录每小时金价

数据来源: https://www.cngold.org/img_date/ 因为这个网站是数据随时变动的,用requests、BeautifulSoup的方式解析html的话,数据的位置显示的是“--”,并不能取到数据。 所以采用webdriver访问网站,然后从界面上获取…

C语言 指针——函数指针的典型应用:计算定积分

目录 梯形法计算函数的定积分 函数指针的典型应用 梯形法计算函数的定积分 函数指针的典型应用 用函数指针编写计算任意函数定积分的 通用 函数

Vivado 比特流编译时间获取以及FPGA电压温度获取(实用)

Vivado 比特流编译时间获取以及FPGA电压温度获取 语言 :Verilg HDL 、VHDL EDA工具:ISE、Vivado Vivado 比特流编译时间获取以及FPGA电压温度获取一、引言二、 获取FPGA 当前程序的编译时间verilog中直接调用下面源语2. FPGA电压温度获取(1&a…

es的总结

es的collapse es的collapse只能针对一个字段聚合(针对大数据量去重),如果以age为聚合字段,则会展示第一条数据,如果需要展示多个字段,需要创建新的字段,如下 POST testleh/_update_by_query {…