2023 年热门的大型语言模型 (LLMs)汇总【更新至9月26】

一、全景地图

整理了一张大语言模型的血缘图谱,如下图所示:

图中的大语言模型,都是自己做过评测的,主观了点,但是原汁原味,有好的可以推荐给我。

二、ChatGPT系列

ChaTGP是商业版本大语言模型的正统,但是因为各种各样的关系,衍生出来了三个不同的方向,从而形成了ChatGPT系,这里面包括ChatGPT,Claude和Bing Chat。这三者的血缘关系如下图所示:

目前为止,以上三者是大语言模型的天花板,从战力水平和能力层次来讲:ChatGPT = Bing Chat > Claude。Claude是ChatGPT项目前成员出走搞出来的东西,水平仅次于ChatGPT。微软是OpenAI最大的股东,所以Bing Chat是否构建在ChatGPT基础之上,所以二者战力水平相当。

附件:openAI 发展大事记

2020 6 OpenAI 发布了 GPT-3 ,这是一种基于互联网上数万亿个单词训练的语言模型。 它还宣布,一个相关的 API ,简称为“ API” ,将成为其第一个商业产品的核心。 GPT-3 旨在以自然语言回答问题,但它也可以在语言之间进行翻译并连贯地生成即兴文本。微软于 2020 9 22 日取得 GPT-3 独家授权。
2021 1 OpenAI 推出了 DALL-E 。 一年后,他们的最新系统 DALL·E 2 4 倍的分辨率生成更逼真、更准确的图像。
2022 11 30 OpenAI 发布了一个名为 ChatGPT 的自然语言生成式模型,它以对话方式进行交互。在研究预览期间,用户注册并登陆后可免费使用 ChatGPT 。但是该项目对一些包括中国大陆、香港在内的地区暂不可用。
2023 1 5 ,华尔街日报报道, ChatGPT 背后的研究实验室 OpenAI 正在谈判以收购要约的形式出售现有股份,交易对该公司的估值达到 290 亿美元左右,使其在没有什么收入的情况下成为账面上最值钱的美国初创公司之一。风投公司 Thrive Capital Founders Fund 正在商谈投资该笔交易。
2023 1 23 ,微软对 OpenAI 进行 100 亿 美元的投资; OpenAI 是爆红的 ChatGPT 聊天机器人的创造者。微软此前已经在 2019 年向 OpenAI 投资了 10 亿美元,目前正尝试在其必应 (Bing) 搜索引擎和微软设计应用中执行这款人工智能软件。

三、Lama系列

Llama2被称为大语言模型开源领域的安卓,是开源大语言模型的基石,给予Llama诞生了羊驼家族大语言模型。Llama大语言模型家族图谱如下所示:

四、国产系列

国际领域大语言模型之外,国内大语言模型也是蓬勃房展,目前已知的大语言模型就有一百二十多个,但是大部分都不成气候,通过实测,从直观体验来看,目前只有百度的文新一言,阿里的千问还算勉强可以。文新一言主要是矮子里面拔将军,阿里前问,主要是因为其开源到底。其他大语言模型,尤其是搞了三天就超越chatGPT的,基本上不需要浪费时间。

鬼知道他们的大语言模型哪里来的?石头缝里蹦出来个孙悟空,还能再蹦出个国产大语言模型来。这个概率不太高,不说国家的计划生育政策是否允许,但就经济压力而言,实力也不允许不是。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/94612.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

逆强化学习

1.逆强化学习的理论框架 1.teacher的行为被定义成best 2.学习的网络有两个,actor和reward 3.每次迭代中通过比较actor与teacher的行为来更新reward function,基于新的reward function来更新actor使得actor获得的reward最大。 loss的设计相当于一个排序问…

visual studio禁用qt-vsaddin插件更新

visual studio里qt-vsaddin插件默认是自动更新的,由于qt-vsaddin插件新版本的操作方式与老版本相差较大,且新版本不稳定,容易出Bug,所以需要禁用其自动更新,步骤如下:     点击VS2019菜单栏上的【扩展】–…

基于Java的毕业设计选题管理系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作…

实现springboot的简单使用~

在之前学习SpringSpringMVCMybatis框架时,我们学习了多种配置spring程序的方式,例如:使用XML,注解,Java配置类,或者是将它们结合使用,但配置文件配置起来依然过于复杂,而我们接下来要…

虚拟机VMware的使用流程以及出现的问题附解决方法

虚拟机VMware的使用流程以及出现的问题附解决方法 下载安装 略。。。 创建虚拟机 虚拟机的设置如下:注意网络适配器为NAT 如果出现ip addr 命令:不显示IP地址的话: 解决方式如下: 首先设置网卡:先查看一下onboot是…

软件工程与计算总结(三)示例项目描述

本节介绍一个标准的项目描述,大家可以作为蓝本学习~ 目录 一.背景 二.目标 三.系统用户 四.用户访谈要点 1.收银员 2.客户经理 3.总经理 4.系统管理员 五.项目实践过程 一.背景 A是一家刚刚发展起来的小型连锁商店,其前身是一家独立的小百货门面…

贪心算法+练习

正值国庆之际,祝愿祖国繁荣昌盛,祝愿朋友一生平安!终身学习,奋斗不息! 目录 1.贪心算法简介 2.贪心算法的特点 3.如何学习贪心算法 题目练习(持续更新) 1.柠檬水找零(easy&…

Altium Designer 批量添加元器件后缀

Altium Designer 批量添加元器件后缀 方法一方法二可能出现的问题要注意 方法一 您可以使用 Altium Designer 中的“批量修改元器件名称”功能来批量添加元器件后缀。具体步骤如下: 1.为了方便显示 操作流程,我这里复制了几个原理图的文件,粘…

剑指offer——JZ22 链表中倒数最后k个结点 解题思路与具体代码【C++】

一、题目描述与要求 链表中倒数最后k个结点_牛客题霸_牛客网 (nowcoder.com) 题目描述 输入一个长度为 n 的链表,设链表中的元素的值为 ai ,返回该链表中倒数第k个节点。 如果该链表长度小于k,请返回一个长度为 0 的链表。 数据范围&…

好奇喵 | Surface Web ---> Deep Web ---> Dark Web

前言 我们可能听说过深网(deep Web)、暗网(dark Web)等名词,有些时候可能会认为它们是一个东西,其实不然,两者的区别还是比较大的。 什么是deep web? 深网是网络的一部分,与之相对应的是表层网络(surface …

jsbridge实战2:Swift和h5的jsbridge通信

[[toc]] demo1: 文本通信 h5 -> app 思路: h5 全局属性上挂一个变量app 接收这个变量的内容关键API: navigation代理 navigationAction.request.url?.absoluteString // 这个变量挂载在 request 的 url 上 ,在浏览器实际无法运行,因…

获取上证50的所有股票代码

我们可以从网页(板块 - 上证50_ - 股票行情中心 - 搜狐证券)中获取, 然后打印出来: import requests from bs4 import BeautifulSoupurl "https://q.stock.sohu.com/cn/bk_4272.shtml" response requests.get(url) …

mysql面试题13:MySQL中什么是异步复制?底层实现?

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:讲一讲mysql中什么是异步复制?底层实现? MySQL中的异步复制(Asynchronous Replication)是一种复制模式,主服务器将数据写入二进制日志后,无…

mysql面试题14:讲一讲MySQL中什么是全同步复制?底层实现?

该文章专注于面试,面试只要回答关键点即可,不需要对框架有非常深入的回答,如果你想应付面试,是足够了,抓住关键点 面试官:讲一讲mysql中什么是全同步复制?底层实现? MySQL中的全同步复制(Synchronous Replication)是一种复制模式,主服务器在写操作完成后,必须等待…

AI配套的技术: 矢量数据库的概念

一、说明 随着人工智能的快速采用和围绕大型语言模型发生的创新,我们需要在所有这些的中心,能够获取大量数据,将其上下文化,处理它,并使其能够有意义地搜索。 为原生整合生成式 AI 功能而构建的生成式 AI 流程和应用程…

JUC第十四讲:JUC锁: ReentrantReadWriteLock详解

JUC第十四讲:JUC锁: ReentrantReadWriteLock详解 本文是JUC第十四讲:JUC锁 - ReentrantReadWriteLock详解。ReentrantReadWriteLock表示可重入读写锁,ReentrantReadWriteLock中包含了两种锁,读锁ReadLock和写锁WriteLock&#xff…

Day-05 CentOS7.5 安装docker

参考 : Install Docker Engine on CentOS | Docker DocsLearn how to install Docker Engine on CentOS. These instructions cover the different installation methods, how to uninstall, and next steps.https://docs.docker.com/engine/install/centos/ Doc…

实战型开发--3/3,clean code

编程的纯粹 hmmm,一开始在这个环节想聊一些具体的点,其实也就是《clean code》这本书中的点,但这个就还是更流于表面; 因为编码的过程,就更接近于运动员打球,艺术家绘画,棋手下棋的过程&#x…

GPT系列论文解读:GPT-1

GPT系列 GPT(Generative Pre-trained Transformer)是一系列基于Transformer架构的预训练语言模型,由OpenAI开发。以下是GPT系列的主要模型: GPT:GPT-1是于2018年发布的第一个版本,它使用了12个Transformer…

软件设计师_计算机网络_学习笔记

文章目录 4.1 网路技术标准与协议4.1.1 协议4.1.2 DHCP4.1.3 DNS的两种查询方式 4.2 计算机网络的分类4.2.1 拓扑结构 4.3 网络规划与设计4.3.1 遵循的原则4.3.2 逻辑网络设计4.3.3 物理网络设计4.3.4 分层设计 4.4 IP地址与子网划分4.4.1 子网划分4.4.2 特殊IP 4.5 HTML4.6 无…