OpenAI封锁中国?国产大模型开启价格战?收好这份LLM选购指南,带你搞定极致性价比 | ShowMeAI

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!



1. Cloud LLM capability, cost, performance | 一份开发者最实用的大模型「性价比」计算手册

这是 Harlan Lewis 整理的大语言模型 (LLM) 对比清单,从capability 能力cost 成本throughput 吞吐量 三个指标,对国外最新主流大模型进行了打分,并绘制了可视化图。


完整版本如下所示 👇

模型数量:27 (国外为主)

更新频率:非常及时

推荐指数:⭐⭐⭐⭐⭐


开发者最常使用 & 近期推出的领先大模型,都被加入了这份表单。比如,Claude 3.5、GPT-4o、Gemini 1.5、Llama 3、Groq、Phi、Command R+ 等大模型系列,以及来自中国的 DeepSeek-V2。

评价指标包含两部分。上半部分 (黄色背景) 是各大模型在 MMLU、MATH、GPQA、HumanEval、MT Bench 等基准测试中的得分;下半部分 (白色背景) 是各大模型在各项测评指标中的得分,包括上下文窗口、最大输出 token 数、吞吐量、速率限制、1M token 的输入成本 & 输出成本……


根据作者设定的评价指标,有几个关键结论值得注意:

  • 👍 GPT-4o 功能一骑绝尘,吞吐量仅仅次于最快的模型,成本也控制得非常好。
  • 👍 Gemini 1.5 Flash 吞吐量遥遥领先 (不包括 Groq) ,在基准测试中表现不错,每个 token 的成本也控制到较低。
  • Gemini 1.5 Flash 和 GPT-4o 这两个模型一起,几乎覆盖了各种功能/速度/成本需求的任务,完全取代了5月份之前的开发方案
  • 👎 Claude 3 Opus 功能靠前,但吞吐量低,且每个token的成本很高。它与初始版本的 GPT-4 相比还算有优势,但与最新的前沿大模型 (GPT-4o、GPT-4 Turbo、Gemini 1.5 Pro、Llama 3 70B) 相比,Claude 3 Opus 在成本方面完全没有竞争力。
  • Groq 系列大模型有多种版本,且吞吐量和成本都有巨大的领先优势。但因为它的云API服务还不成熟,所以没有在表单中呈现出来。

原始的 Google 在线表单,作者维护和更新都非常及时。你可以访问 👇 下方链接获取最新版

官网 → https://docs.google.com/spreadsheets/d/1foc98Jtbi0-GUsNySddvL0b2a7EuVQw8MoaQlWaDT-w



2. Artificial Analysis | 一份更完备、更客观的 AI大模型 (LLM) 购物指南

Artificial Analysis 是目前看到最完备的大模型性能对比网站啦!

不仅基于数据进行了大量分析和可视化,还给出了 质量、价格、性能、速度、上下文窗口等关键指标的 详细排名,帮你选择最合适的大模型和API提供商。


感受下网站风格和主要内容 👇

模型数量:38 (国外为主)

更新频率:非常及时

推荐指数:⭐⭐⭐⭐⭐


网站对比维度非常丰富,可视化图 & 结论也很清晰,而且支持自定义交互,非常实用!

  • 各能力维度的比较 (Quality Comparison by Ability)
  • 质量 vs. 吞吐量 (Quality vs. Throughput)
  • 质量 vs. 价格 (Quality vs. Price)
  • 吞吐量 (Throughput)
  • 定价:输入和输出价格 (Pricing: Input and Output prices)
  • ……

整体来看,各关键指标中得分高的大模型有 👇

  • 质量 (Quality):GPT-4o、GPT-4 Turbo、Claude 3 Opus、Llama 3 (70B)
  • 吞吐量 (Throughput):Gemma 7B、Gemini 1.5 Flash、Llama 3 (8B)、GPT-3.5 Turbo Instruct
  • 延迟 (Latency):Mistral 7B、Mistral Medium、Mixtral 8x7B、Mixtral 8x22B
  • 价格 (Price):Gemma 7B、OpenChat 3.5、DeepSeek-V2、Llama 3 (8B)
  • 上下文窗口 (Context Window):Gemini 1.5 Flash、Gemini 1.5 Pro、Claude 3 Opus、Claude 3 Sonnet

单拿出价格一栏,可以看到大模型输入/输出价格的明显变化。右侧交互框支持勾选自己想添加参与比价的其他大模型

整个网站收录了国外主流前沿大模型,国内的依旧只有 DeepSeek-V2-Chat 大模型入选。网站底部有这些大模型清单,点击还可以跳转到每个大模型的专属介绍页面。

官网 → https://artificialanalysis.ai



3. LLM API Pricing Calculator | 大模型 API 价格计算器,一步到位的价格计算助手

这个网站非常有意思!

手动设定大模型的输入& 输出值,网站下方可以直接显示各个大模型的费用额度。而且!网站还支持 tokens、Words、Characters 这三种不同的计算类型 👏 再也不用自己苦哈哈地换算了~


网站截图如下 👇 赶紧加入收藏夹~

模型数量:25 (国外)

更新频率:比较及时

推荐指数:⭐⭐⭐⭐⭐


唯一比较可惜的点在于,网站收录的大模型数量比较少 (当然主流的也都包括啦),而且木有国产大模型~

官网 → https://docsbot.ai/tools/gpt-openai-api-pricing-calculator



4. The Fastest AI | 各大模型 token 生成速度对比网站,三个指标综合测评

这是一个专门对比各大模型 token 生成速度的网站,并且非常科学地设定和计算了3个指标的得分。而且表单顶部还支持交互筛选。

  • TTFT:到首个 token 的时间 (Time To First Token)
  • TPS:每秒 token 数量 (Tokens Per Second)
  • Total Time:从请求发出到最终 token 生成的总时间 (From request to final token)

绿色背景表示生成速度快,红色背景表示慢 👇

模型数量:56 (国外)

更新频率:非常及时

推荐指数:⭐⭐⭐⭐⭐


原网站底部,对指标的定义和计算方式,有非常清晰的解释说明。感兴趣可以访问下方链接 👇

官网 → https://thefastest.ai



5. LLM Pricing | 包含最多大模型&供应商的比价网站,简明清晰

LLM Pricing 应该是传播度最广泛的比价网站之一

网站整合了大模型官网、云服务供应商等多种渠道的价格信息,并对输入&输出价格进行了比较。


以下是网页截图 👇 更新还算及时,可以收藏当作比价小助手!

模型数量:63 (国外)

更新频率:非常及时

推荐指数:⭐⭐⭐⭐


网站收录了 60+ 主流厂商和前沿大模型,挺全面的!唯一可惜的就是,木有国内的大模型~ 所以还是要自己比较价格和性能了~

官网 → https://llm-price.com



6. AIGCRank | 国内外AI大语言模型API价格对比

终于!有一个中文的大模型的对比网站了

AIGCRank 是一个专门汇总和比较全球主要AI模型提供商的价格信息的工具,提供最新的大语言模型价格数据,以及一些免费的AI大模型API。

模型数量:138 (国内外主流大模型)

更新频率:比较及时

推荐指数:⭐⭐⭐⭐

官网 → https://aigcrank.cn/llmprice/



7. 大模型性能全景图 | 一份文档追全球 400 家大模型进展

这是国内开发者维护的一份大模型全景图,整理了近 400 个国内外大模型&性能参数,并据此整理了学霸榜、全球开源榜、国内开源榜、多模态榜、贵榜 、宜榜等多个实用榜单,还把参数进行了可视化供直观判断。

模型数量:376 (国内外几乎所有重要大模型)

更新频率:比较及时

推荐指数:⭐⭐⭐⭐

链接 → https://langgptai.feishu.cn/wiki/HteYwsIMpimxO8kFqJ8cylqEnoe?table=tbl2mBh6CE5ezghR&view=vewbhF3k1V

◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!

◉ > 前往 🎡ShowMeAI,获取结构化成长路径和全套资料库,用知识加速每一次技术进步!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/36472.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3d合并模型一直加载有哪些原因---模大狮模型网

当在3D软件中合并3d模型时,可能会遇到加载时间过长或持续加载的情况。这可能是由以下原因之一引起的: 一:模型复杂度 合并的模型可能非常复杂,包含大量的面片、顶点或纹理等。这会增加加载和处理的时间。解决方法是优化模型&…

【第二周】基础语法学习

目录 前言初始化项目文件介绍基本介绍JSWXMLWXSS 常见组件基础组件视图容器match-mediamovable-area/viewpage-containerscroll-viewswiper 表单组件自定义组件 模板语法数据绑定单向数据绑定双向数据绑定 列表渲染条件渲染模板引用 事件系统事件类型事件绑定阻止冒泡互斥事件事…

股指期权交割日期是什么时候?在每个月几号?

今天带你了解股指期权交割日期是什么时候?在每个月几号?期权交割日是指合约到期之日,即投资者需要履行买卖合约的义务。 股指期权的交割日期通常是期权合约到期日的第三个星期五。如果这一天是公共假日,则交割日可能会提前到前一…

Transformers 安装及 google-t5/t5-small 机器翻译示例

文章目录 Github文档推荐文章简介安装官方示例google-t5/t5-small使用脚本进行训练Pytorch 机器翻译数据集下载数据集格式转换 Github https://github.com/huggingface/transformers 文档 https://huggingface.co/docs/transformers/indexhttps://github.com/huggingface/tr…

计算机二级Access操作题总结——综合应用

属性表相关 例1: 不允许输入和修改其中的数据→【是否锁定】 例2: 单击“退出”按钮(名为“bt2”),调用设计好的宏“mEmp”来关闭窗体。 分组和汇总 对“rSell”报表进行适当设置,使每名雇员的姓名显示在该雇员所售书籍信…

三品PDM项目成功上线 垣发集团携手三品软件迈向智能未来

项目背景 随着全球工业化和城市化进程的不断加快,高空作业车的市场需求日益增长。河南垣发专用车辆集团有限公司(以下简称“垣发集团”)自2014年成立以来,一直专注于高空作业车系列产品的研发与制造。 作为一家科技导向型企业&am…

Java AWT BorderLayout的使用

目录 背景: 代码例子: 代码详解: 效果展示: 总结: 背景: BoderLayout是Java AWT(Abstract Window Toolkit)和Swing图形用户界面(GUI)库中的一个布局管理器。它用于安排组件(如按钮、标签、面板等)在容器(如窗户、面板等)中的位置。BorderLayout容器划分为五个区域:北(NO…

硬盘空间告急?监控服务器容量,钉钉及时提醒!

在日常的服务器维护中,硬盘容量的监控是非常重要的。如果硬盘容量超过某个阈值,可能会导致服务器无法正常运行,影响业务的正常运作。为了避免这种情况,我们可以编写一个Shell脚本,定期检查硬盘容量,当超过设…

微服务框架中的Eureka和Ribbon的个人理解

微服务框架需要学习的东西很多,基本上我把它分为了五个模块: 第一:微服务技术模块 分为三个常用小模块: 1.微服务治理: 注册发现 远程调用 配置管理 网关路由 2.微服务保护: 流量控制 系统保护 熔断降级 服…

springcloud第4季 分布式事务seata实现AT模式案例

一 seata案例 1.1 背景说明 本案例使用seata的at模式,模拟分布式事务场景:【下订单,减库存,扣余额,改状态】 1.2 初始化脚本 1.2.1 新建seata_order_024 库 1.新建undol_log表 -- for AT mode you must to init…

锐捷AP从其它项目拆下,怎么也加入不了到现在这个网络里来

环境: AP 产品型号:RG-RAP2260G 问题描述: 锐捷AP从其它项目拆下,怎么也加入不了到现在这个网络里来,现网是WIFI5的,想把2260G用来升级,恢复出厂设置后,插上网线,现网找不到这个AP 解决方案: 1.通电重置AP后,连接AP WiFi进入管理页面,要求先快速配置 2.开始配置…

MySQL的隔离级别详解

MySQL的隔离级别详解 MySQL是一个广泛使用的关系数据库管理系统,其事务处理能力是其核心功能之一。事务处理中的隔离级别决定了一个事务在读取或写入数据时如何受到其他并发事务的影响。MySQL提供了四种标准的隔离级别,每种隔离级别在性能和一致性之间做…

算法力扣刷题记录十【19.删除链表的倒数第N个节点】

前言 链表练习,继续 题目:力扣【19.删除链表的倒数第N个节点】 题目阅读 给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 示例 1: 输入:head [1,2,3,4,5], n 2 输出:[1…

服务器出现意外情况。(Exception from HRESULT: 0x80010105(RPC E SERVERFAULT))

这种情况一般出现在excel2007版本,下载了什么阅读器之类的 2007改不了这个加载项,需要重装一个其他版本(2010版本可以) 然后如下操作修改为COM加载项

Python湍流隐式模型耗散粘性方程和大涡流模拟

🎯要点 🎯达朗贝尔一维波动通解,二维变速模拟 | 🎯达朗贝尔算子解双曲波形微分方程 | 🎯耗散系统粘性伯格斯方程快速傅里叶变换算法 | 🎯二维线性和非线性对流扩散解和湍流隐式建模 📜偏微分方…

[行业原型] Web端原型案例:康欣医疗后台管理系统

​医疗管理系统是一个业务复杂,功能庞大的系统,以下为HIS医院管理系统的常见模块,供大家参考。 本周为大家带来Web端原型案例:康欣医疗后台管理系统,先上原型: 完整文档加班主任微信号 添加班主任回复 “1…

8个Unity开发高手都在用的秘密技巧!

1. 不要重新发明轮子,使用内置的引擎工具 在使用任何引擎时,比如Unity或Unreal Engine,一些开发者,主要是来自计算机科学领域的开发者,可能会倾向于从头开始开发大型算法或结构,而不去了解引擎中是否已经存…

我给我的学校写了个校园墙小程序

目录 前言 正文 事先声明 项目介绍 关于Github的一些点 ①贡献值的记录 ②Github中的Project是什么 ③Release和Package有什么区别 ④开源许可证之间的区别 尾声 🔭 Hi,I’m Pleasure1234🌱 I’m currently learning Vue.js,SpringBoot,Computer Securit…

vector的自实现(迭代器失效问题)与继承续讲

引子:在生活中,我们使用vector很频繁,我们是不是可以自己来实现一个呢?,其实也不难,我们在学过数据结构,就很easy啦! As we all kowmn,vector基础有以下函数! from my …

git 初基本使用-----------笔记(结合idea)

Git命令 下载git 打开Git官网(git-scm.com),根据自己电脑的操作系统选择相应的Git版本,点击“Download”。 基本的git命令使用 可以在项目文件下右击“Git Bash Here” ,也可以命令终端下cd到指定目录执行初始化命令…