2023 年热门的大型语言模型 (LLMs)汇总【更新至9月26】

一、全景地图

整理了一张大语言模型的血缘图谱,如下图所示:

图中的大语言模型,都是自己做过评测的,主观了点,但是原汁原味,有好的可以推荐给我。

二、ChatGPT系列

ChaTGP是商业版本大语言模型的正统,但是因为各种各样的关系,衍生出来了三个不同的方向,从而形成了ChatGPT系,这里面包括ChatGPT,Claude和Bing Chat。这三者的血缘关系如下图所示:

目前为止,以上三者是大语言模型的天花板,从战力水平和能力层次来讲:ChatGPT = Bing Chat > Claude。Claude是ChatGPT项目前成员出走搞出来的东西,水平仅次于ChatGPT。微软是OpenAI最大的股东,所以Bing Chat是否构建在ChatGPT基础之上,所以二者战力水平相当。

附件:openAI 发展大事记

2020 6 OpenAI 发布了 GPT-3 ,这是一种基于互联网上数万亿个单词训练的语言模型。 它还宣布,一个相关的 API ,简称为“ API” ,将成为其第一个商业产品的核心。 GPT-3 旨在以自然语言回答问题,但它也可以在语言之间进行翻译并连贯地生成即兴文本。微软于 2020 9 22 日取得 GPT-3 独家授权。
2021 1 OpenAI 推出了 DALL-E 。 一年后,他们的最新系统 DALL·E 2 4 倍的分辨率生成更逼真、更准确的图像。
2022 11 30 OpenAI 发布了一个名为 ChatGPT 的自然语言生成式模型,它以对话方式进行交互。在研究预览期间,用户注册并登陆后可免费使用 ChatGPT 。但是该项目对一些包括中国大陆、香港在内的地区暂不可用。
2023 1 5 ,华尔街日报报道, ChatGPT 背后的研究实验室 OpenAI 正在谈判以收购要约的形式出售现有股份,交易对该公司的估值达到 290 亿美元左右,使其在没有什么收入的情况下成为账面上最值钱的美国初创公司之一。风投公司 Thrive Capital Founders Fund 正在商谈投资该笔交易。
2023 1 23 ,微软对 OpenAI 进行 100 亿 美元的投资; OpenAI 是爆红的 ChatGPT 聊天机器人的创造者。微软此前已经在 2019 年向 OpenAI 投资了 10 亿美元,目前正尝试在其必应 (Bing) 搜索引擎和微软设计应用中执行这款人工智能软件。

三、Lama系列

Llama2被称为大语言模型开源领域的安卓,是开源大语言模型的基石,给予Llama诞生了羊驼家族大语言模型。Llama大语言模型家族图谱如下所示:

四、国产系列

国际领域大语言模型之外,国内大语言模型也是蓬勃房展,目前已知的大语言模型就有一百二十多个,但是大部分都不成气候,通过实测,从直观体验来看,目前只有百度的文新一言,阿里的千问还算勉强可以。文新一言主要是矮子里面拔将军,阿里前问,主要是因为其开源到底。其他大语言模型,尤其是搞了三天就超越chatGPT的,基本上不需要浪费时间。

鬼知道他们的大语言模型哪里来的?石头缝里蹦出来个孙悟空,还能再蹦出个国产大语言模型来。这个概率不太高,不说国家的计划生育政策是否允许,但就经济压力而言,实力也不允许不是。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/94612.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

逆强化学习

1.逆强化学习的理论框架 1.teacher的行为被定义成best 2.学习的网络有两个,actor和reward 3.每次迭代中通过比较actor与teacher的行为来更新reward function,基于新的reward function来更新actor使得actor获得的reward最大。 loss的设计相当于一个排序问…

visual studio禁用qt-vsaddin插件更新

visual studio里qt-vsaddin插件默认是自动更新的,由于qt-vsaddin插件新版本的操作方式与老版本相差较大,且新版本不稳定,容易出Bug,所以需要禁用其自动更新,步骤如下:     点击VS2019菜单栏上的【扩展】–…

【Ansible自动化运维实战】使用Ansible部署WordPress应用

【Ansible自动化运维实战】使用Ansible部署WordPress应用 一、Ansible介绍1.1 Ansible简介1.2 Ansible特点二、wordpress介绍2.1 wordpress简介2.2 wordpress特点三、本次实践规划3.1 本次实践介绍3.2 本次实践规划四、部署ansible环境4.1 配置yum仓库4.2 安装ansible4.3 配置a…

基于Java的毕业设计选题管理系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作…

实现springboot的简单使用~

在之前学习SpringSpringMVCMybatis框架时,我们学习了多种配置spring程序的方式,例如:使用XML,注解,Java配置类,或者是将它们结合使用,但配置文件配置起来依然过于复杂,而我们接下来要…

虚拟机VMware的使用流程以及出现的问题附解决方法

虚拟机VMware的使用流程以及出现的问题附解决方法 下载安装 略。。。 创建虚拟机 虚拟机的设置如下:注意网络适配器为NAT 如果出现ip addr 命令:不显示IP地址的话: 解决方式如下: 首先设置网卡:先查看一下onboot是…

软件工程与计算总结(三)示例项目描述

本节介绍一个标准的项目描述,大家可以作为蓝本学习~ 目录 一.背景 二.目标 三.系统用户 四.用户访谈要点 1.收银员 2.客户经理 3.总经理 4.系统管理员 五.项目实践过程 一.背景 A是一家刚刚发展起来的小型连锁商店,其前身是一家独立的小百货门面…

贪心算法+练习

正值国庆之际,祝愿祖国繁荣昌盛,祝愿朋友一生平安!终身学习,奋斗不息! 目录 1.贪心算法简介 2.贪心算法的特点 3.如何学习贪心算法 题目练习(持续更新) 1.柠檬水找零(easy&…

ES6中数组的扩展

1. 扩展运算符 用三个点(...)表示,它如同rest参数的逆运算,将数组转为用逗号分隔的参数序列。扩展就是将一个集合分成一个个的。 console.log(...[1, 2, 3]); // 1, 2, 3可以用于函数调用 扩展运算符后还可以放置表达式 ...(x > 0 ? [a] : [])如…

YOLOv2解析 | 批归一化 锚 主干网

文章目录 1 改进1.1 Batch Normalization 批归一化1.2 High Resolution Classifier 更高分辨率的分类器1.3 **Convolutional With Anchor Boxes 带锚盒的卷积**1.4 Dimension Clusters 维度集群1.5 更深更宽的主干网络1.6 Fine-Grained Features** **细粒度特征 **1.,7 Multi-S…

Altium Designer 批量添加元器件后缀

Altium Designer 批量添加元器件后缀 方法一方法二可能出现的问题要注意 方法一 您可以使用 Altium Designer 中的“批量修改元器件名称”功能来批量添加元器件后缀。具体步骤如下: 1.为了方便显示 操作流程,我这里复制了几个原理图的文件,粘…

剑指offer——JZ22 链表中倒数最后k个结点 解题思路与具体代码【C++】

一、题目描述与要求 链表中倒数最后k个结点_牛客题霸_牛客网 (nowcoder.com) 题目描述 输入一个长度为 n 的链表,设链表中的元素的值为 ai ,返回该链表中倒数第k个节点。 如果该链表长度小于k,请返回一个长度为 0 的链表。 数据范围&…

好奇喵 | Surface Web ---> Deep Web ---> Dark Web

前言 我们可能听说过深网(deep Web)、暗网(dark Web)等名词,有些时候可能会认为它们是一个东西,其实不然,两者的区别还是比较大的。 什么是deep web? 深网是网络的一部分,与之相对应的是表层网络(surface …

jsbridge实战2:Swift和h5的jsbridge通信

[[toc]] demo1: 文本通信 h5 -> app 思路: h5 全局属性上挂一个变量app 接收这个变量的内容关键API: navigation代理 navigationAction.request.url?.absoluteString // 这个变量挂载在 request 的 url 上 ,在浏览器实际无法运行,因…

Spring事务

事务概念 逻辑上的一组操作,要么都成功、要么都失败 典型案例:银行转账 事务特性:ACID【原子、一致、隔离、持久】 搭建环境 银行转账操作 web: service:逻辑操作,调用dao dao:创建两个方法 …

强化学习环境 - robogym - 学习 - 2

强化学习环境 - robogym - 学习 - 2 文章目录 强化学习环境 - robogym - 学习 - 2项目地址为什么选择 robogymRearrange - 环境部分介绍Robot Control Interface - 机器人控制接口Environment - listEnvironment Randomization - 接口设置 项目地址 https://github.com/openai…

PAT(Basic Level) Practice(中文) 1015德才论

前言 ※ PTA是 程序设计类实验辅助教学平台 ,里边包含一些编程题目集以供练习。 这道题用java解,我试了三种解法,不断优化,但始终是三个测试点通过、三个测试点超时。我把我的代码放在这里,做个参考吧。 1015 德才…

获取上证50的所有股票代码

我们可以从网页(板块 - 上证50_ - 股票行情中心 - 搜狐证券)中获取, 然后打印出来: import requests from bs4 import BeautifulSoupurl "https://q.stock.sohu.com/cn/bk_4272.shtml" response requests.get(url) …

junit @ExcludePackages排除多个包

在JUnit中,可以使用ExcludePackages注解来排除多个包。该注解可以用在测试类或测试方法上。 如果要排除多个包,可以在ExcludePackages注解的value属性中使用数组来指定要排除的包名。例如,要排除包com.example.package1和com.example.packag…

秋招问题记录贴

最近面试有点多,没来的及写面经,就单独开个帖子记录一下碰到的一些不懂的技术问题: AQS中两个队列如何工作,这个结合os中阻塞和就绪两种情况讲分布式的理解,这个问的频率很高nacos怎么进行服务注册和发现的mysql什么情…