【大模型】二 、大语言模型的基础知识

文章目录

  • 大型语言模型
    • 国内外大语言模型
    • 大模型列表
    • 国外大模型

大型语言模型

大型语言模型是近年来机器学习和自然语言处理领域的一个重要发展趋势。以GPT模型为例,阐述其发展

GPT系列基于Transformer架构,进行构建,旨在理解和生成人类语言。它们通常通过在大量文本数据上进行预训练,学习到语言的各种模式和结构,然后可以进行微调,以适应各种具体的任务,如文本分类、情感分析、问答系统等。这些模型在理解复杂的语义关系、处理长距离依赖等方面表现出了显著的能力,推动了自然语言处理技术的发展。

GPT-1:发布于2018年,GPT-1是OpenAI的第一个使用Transformer架构的语言模型,有1.17亿的参数。它被训练用于生成流畅且连贯的语言,并在各种语言处理任务中表现出色,但在处理超出其训练数据范围的提示或长篇文本时,可能会产生重复的文本。

GPT-2:发布于2019年,GPT-2有15亿的参数,比GPT-1大得多。它在一些自然语言处理任务上有了明显的改进,能够生成更连贯、真实的文本序列,但在处理需要更复杂推理和理解上下文的任务上还有所挑战。

GPT-3:发布于2020年,GPT-3有1750亿的参数,比GPT-1大了100多倍,比GPT-2大了10倍以上。GPT-3在一系列的自然语言处理任务上生成了复杂的响应,甚至无需提供任何先前的示例数据。然而,GPT-3仍然存在一些问题,例如返回有偏见、不准确或不适当的回答,或者生成与提示完全无关的文本,表明该模型在理解上下文和背景知识方面仍然存在困难。

GPT-4:发布于2023年3月14日,GPT-4在GPT-3的基础上有了显著的提升。尽管模型的训练数据和架构的具体细节尚未公布,但可以肯定的是,GPT-4在GPT-3的优点上进行了建设,并克服了其中的一些限制。

国内外大语言模型

大模型列表

序号公司大模型省市类别官网说明
1百度文心一言,灵医Bot北京通用试用需账号,有APP
2阿里云通义千问,Qwen-7B浙江杭州通用试用需账号,开源通义千问7B模型Qwen-7B,Qwen-7B-Chat
3科大讯飞星火安徽合肥通用试用需账号,有APP
4达观数据曹植上海金融、工业试用需账号
5复旦大学MOSS上海科研试用需账号
6清华大学ChatGLM,NowcastNet北京科研开源6B,ChatGLM2-6B, 智谱AI,气象,临近预报大模型
7华为盘古,盘古气象,盘古-Σ广东深圳工业华为+鹏城,华为云盘古
8智源人工智能研究院悟道·天鹰,悟道·EMU北京通用悟道3.0,视界视觉,AQUILA天鹰座,Aquila-7B,AquilaChat-7B,AquilaCode-7B-NV,AquilaCode-7B-TS,HuggingFace,EMU基于LLaMA
9浙江大学启真,PromptProtein,TableGPT浙江杭州垂直医学大模型提供基于LLaMA-7B、CaMA-13B和ChatGLM-6B 三个版本,用于PromptProtein的模型
10百川智能百川,baichuan-7B,Baichuan-13B北京通用模型下载:Baichuan-13B-Base,Baichuan-13B-Chat,Baichuan-7B,开源可商用
11上海人工智能实验室书生·浦语, OpenMEDLab浦医上海通用&垂直技术报告,开源的InternLM-7B,HuggingFace下载模型权重
12贝壳BELLE北京垂直基于BLOOMZ或LLaMA的多个模型
13哈尔滨工业大学本草,活字黑龙江哈尔滨医学医学,本草基于LLaMA;另有基于 ChatGLM 的Med-ChatGLM,活字基于BLOOM-7B
14云知声山海北京医学
15OpenBMBCPM,CPM-Bee北京通用面壁智能,CPM-Bee-10B
16港中文深圳华佗,凤凰广东深圳医学香港中文大学(深圳)和深圳市大数据研究院,医学,Demo,华佗和凤凰都基于BLOOMZ
17元象科技XVERSE-13B广东深圳通用模型下载
18虎博科技TigerBot上海金融基于BLOOM
19东北大学TechGPT,PICA辽宁沈阳科研TechGPT->BELLE->LLaMA,图谱构建和阅读理解问答;PICA->ChatGLM2-6B情感大模型
20上海交通大学K2,白玉兰上海K2:地球科学,白玉兰:科学Demo,GeoLLaMA,基于LLaMA,HuggingFace
21IDEA研究院封神榜MindBot广东深圳通用姜子牙系列模型
22度小满轩辕北京金融基于BLOOM
23360智脑,一见北京通用
24艾写科技Anima浙江杭州营销基于Guanaco->基于LLaMA,使用QLoRA
25北京大学信息工程学院ChatLaw北京法律ChatLaw-13B基于Ziya-LLaMA-13B-v1->LLaMA,ChatLaw-33B基于Anima33B->Guanaco->LLaMA
26中国科学院自动化研究所紫东·太初北京通用紫东太初2.0号称100B参数,全模态
27中国科学院计算技术研究所百聆北京科研基于 LLaMA,权重Diff下载7B和13B,demo
28中国科学院成都计算机应用研究所聚宝盆四川成都金融基于LLaMA的金融大模型
29晓多科技+国家超算成都中心晓模型XPT四川成都客服试用申请
30网易有道子曰北京教育推荐有道速读,读论文的利器
31北京语言大学桃李北京教育基于LLaMA,北语+清华+东北、北京交大
32华南理工大学扁鹊,灵心SoulChat广东广州医学
33商汤科技日日新上海通用
34国家超级计算天津中心天河天元天津通用
35北京交通大学致远北京交通TransGPT・致远,基于LLaMA-7B
36恒生电子LightGPT浙江杭州金融
37稀宇科技MiniMax上海通用GLOW虚拟社交
38左手医生左医GPT北京医学医疗,试用需Key
39上海科技大学DoctorGLM上海医学医学大模型,论文
40华东师范大学EmoGPT,EduChat上海教育EmoGPT是上海市心理健康与危机干预重点实验室与镜象科技公司合作完成, 教学教育大模型EduChat基于BELLE(BELLE基于LLaMA)
41星环科技无涯、求索上海金融无涯——金融;求索——大数据分析
42澳门理工大学XrayGLM,IvyGPT澳门医疗IvyGPT基于ChatGLM2,XrayGLM基于VisualGLM-6B
43数慧时空长城北京地球科学自然资源,遥感
44中工互联智工北京工业与复旦NLP实验室联合,工业领域
45创业黑马天启北京创投创业黑马与360合作,科创服务行业
46追一科技博文Bowen广东深圳客服
47智慧眼砭石湖南长沙医学医疗领域
48香港科技大学罗宾Robin香港科研基于LLaMA,港科大开源LMFlow
49昆仑万维天工北京客服与奇点智源联合研发
50智媒开源研究院智媒广东深圳媒体基于LLaMA,面向自媒体
51医疗算网Uni-talk上海医学上海联通+华山医院+上海超算中心+华为
52蚂蚁集团贞仪浙江杭州金融据传语言和多模态两个
53硅基智能炎帝江苏南京文旅
54西湖心辰西湖浙江杭州科研
55拓尔思拓天北京媒体TRSGPT
56好未来MathGPT北京教育学而思
57清博智能先问北京农业基于结构化数据
58智子引擎元乘象江苏南京客服
59拓世科技拓世江西南昌金融
60循环智能盘古北京客服循环智能,清华大学,华为
61慧言科技+天津大学海河·谛听天津科研
62第四范式式说北京客服
63字节跳动Grace北京通用内部代号
64出门问问序列猴子北京营销
65数说故事SocialGPT广东广州社交
66云从科技从容广东广州政务
67浪潮信息山东济南通用
68中国农业银行小数ChatABC北京金融
69麒麟合盛天燕AiLMe北京运维
70台智云福尔摩斯FFM台湾工业华硕子公司
71医联科技medGPT四川成都医学
72电信智科星河北京通信通用视觉,中国电信
73深思考人工智能Dongni北京媒体
74文因互联文因安徽合肥金融金融大模型
75印象笔记大象GPT北京媒体
76中科闻歌雅意北京媒体
77澜舟科技孟子北京金融
78京东言犀北京商业
79智臻智能华藏上海客服小i机器人
80新华三H3C百业灵犀浙江杭州工业
81鹏城实验室鹏城·脑海广东深圳科研Peng Cheng Mind
82宇视科技梧桐浙江杭州运维AIoT行业
83理想科技大道Dao北京运维运维大模型
84美亚柏科天擎福建厦门安全公共安全
85赛灵力科技达尔文广东广州医学赛灵力,清华珠三角研究院,赛业生物,大湾区科技创新服务中心
86实在智能塔斯浙江杭州客服TARS
87佳都科技佳都知行广东广州交通交通领域
88知乎知海图北京媒体知乎和面壁科技合作
89网易伏羲玉言广东广州通用
90清睿智能ArynGPT江苏苏州教育
91微盟WAI上海商业
92西北工业大学+华为秦岭·翱翔陕西西安工业流体力学大模型,湍流+流场
93奇点智源天工智力北京通用瑶光和天枢
94联汇科技欧姆浙江杭州通用OmModel欧姆多模态(视觉语言)大模型
95中国联通鸿湖北京通信
96思必驰DFM-2江苏苏州工业
97中科创达魔方Rubik北京工业
98电科太极小可北京政务党政企行业应用
99中国移动九天北京通信
100中国电信TeleChat北京通信
101容联云赤兔北京客服客服,营销
102云天励飞天书广东深圳政务
103乐言科技乐言上海客服
104沪渝人工智能研究院兆言重庆科研也称:上海交通大学重庆人工智能研究院
105中央广播电视总台央视听北京媒体央视听媒体大模型CMG Media GPT
106超对称技术公司乾元北京金融
107蜜度文修上海媒体智能校对
108中国电子云星智湖北武汉政务政务大模型
109理想汽车MindGPT北京工业
110阅文集团妙笔上海文旅网文大模型
111携程问道上海文旅旅游行业大模型
112腾讯混元广东深圳通用
113瑞泊VIDYA北京工业
114有连云麒麟上海金融
115维智科技CityGPT上海公共服务城市大模型
116用友YonGPT北京企业服务
117天云数据Elpis北京金融证券法律法规
118孩子王KidsGPT江苏南京教育
119企查查知彼阿尔法江苏苏州商业
120今立方12333福建厦门政务人社领域
121阳光保险集团正言广东深圳金融
122电科数字智弈上海水利
123聆心智能CharacterGLM北京游戏
124大经中医岐黄问道江苏南京医疗
125蒙牛MENGNIU.GPT内蒙古呼和浩特食品
126快商通汉朝福建厦门营销
127众合科技UniChat浙江杭州交通
128金蝶苍穹广东深圳企业服务
129云问科技云中问道江苏南京营销与西安未来AI计算中心联合发布
130天壤智能小白上海通用
131小米MiLM-6B北京商业
132长虹长虹超脑四川绵阳媒体

国外大模型

公司大模型说明
OpenAIChatGPT
微软Bing Chat
GooglePaLM2,Bard,GeminiBard支持图片
AnthropicClaudeClaude 2,支持读入pdf、txt、csv等文件进行分析、总结和问答等
MetaLLaMA,LLaMA-2
Stability AIStableLM
AmazonTitan
BloombergBloombergGPT
MosaicMLMPT
IntelAurora genAI
UC Berkeley, Microsoft ResearchGorilla
inflection.aiInflection-1
xAI从OpenAI 到xAI
cohereCohere
Scale AIScale
character aiCharacter
Colossal-AIColossalChat

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/53142.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

es的索引管理

概念 (1)集群(Cluster): ES可以作为一个独立的单个搜索服务器。不过,为了处理大型数据集,实现容错和高可用性,ES可以运行在许多互相合作的服务器上。这些服务器的集合称为集群。 &…

【电能质量扰动】基于ML和DWT的电能质量扰动分类方法研究(Matlab实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

c语言调用mciSendString播放音乐

如下所示&#xff0c;这是一个使用c语言调用系统方法mciSendString()&#xff0c;让系统播放音乐的示例&#xff1a; baihuaxiang 代码&#xff1a; #include <graphics.h> #include <Windows.h> #include <mmsystem.h>#pragma comment(lib,"WINMM.LIB…

virtuoso61x中集成calibre

以virtuoso618为例&#xff0c;在搭建完电路、完成前仿工作之后绘制版图&#xff0c;版图绘制完成之后需要进行drc和lvs【仅对于学校内部通常的模拟后端流程而言】&#xff0c;一般采用mentor的calibre来完成drc和lvs。 服务器上安装有virtuoso和calibre&#xff0c;但是打开la…

Mybatis与Spring集成配置

目录 具体操作 1.1.添加依赖 1.2创建spring的配置文件 1.3. 注解式开发 Aop整合pagehelper插件 1. 创建一个AOP切面 2. Around("execution(* *..*xxx.*xxx(..))") 表达式解析 前言&#xff1a; 上篇我们讲解了关于Mybatis的分页&#xff0c;今天我们讲Mybatis与…

Android Studio开发之路 (五)导入OpenCV以及报错解决

一、步骤 官网下载opencv包&#xff08;我下的是4.7.0&#xff09;并解压&#xff0c;openvc官网 先创建一个空项目&#xff0c;简单跑一下能正常输出helloworld 点击file->new->Import Module选择解压之后的opencv-android-sdk文件夹中的SDk文件夹&#xff0c; modu…

政府网站定期巡检:构建高效、安全与透明的数字政务

在数字时代&#xff0c;政府网站已不仅仅是一个信息发布窗口&#xff0c;更是政府与公众互动的桥梁、政务服务的主要渠道以及数字化治理的重要平台。因此&#xff0c;确保政府网站的高效运行、信息安全与透明公开就显得尤为重要。在此背景下&#xff0c;定期的网站巡检与巡查成…

中文乱码处理

&#x1f600;前言 中文乱码处理 &#x1f3e0;个人主页&#xff1a;尘觉主页 &#x1f9d1;个人简介&#xff1a;大家好&#xff0c;我是尘觉&#xff0c;希望我的文章可以帮助到大家&#xff0c;您的满意是我的动力&#x1f609;&#x1f609; 在csdn获奖荣誉: &#x1f3c…

银行业务知识汇编全稿

目 录 第一部分 零售业务... 4 1.1 储蓄业务... 4 1.1.1 普通活期储蓄&#xff08;本外币&#xff09;... 4 1.1.2 定期储蓄&#xff08;本外币&#xff09;... 5 1.1.3 活期一本通... 9 1.1.4 定期一本通... 10 1.1.5 电话银行... 11 1.…

nmon的安装与使用

一、Linux服务器配置信息 操作系统&#xff1a;CentOS 7.6 64位&#xff08;可用命令&#xff1a;cat /etc/redhat-release和uname -a查看&#xff09; CPU&#xff1a;1核&#xff08;可用命令top查看&#xff09; 内存&#xff1a;2GB&#xff08;可用命令free查看&#xff…

抓包 - 简要总结 - Windows和Android抓包

抓包 - 简要总结 - Windows和Android抓包 前言 小巧且强大的抓包工具“Fiddler”安装可参考我的另一篇博客&#xff1a;抓包 - 经典抓包工具Fiddler的安装与初使用 本文主要介绍如何使用Fiddler抓包Windows和安卓。 Windows 抓包Windows很简单&#xff0c;安装证书&#x…

picGo+gitee+typora设置图床

picGogiteetypora设置图床 picGogitee设置图床下载picGo软件安装picGo软件gitee操作在gitee中创建仓库在gitee中配置私人令牌 配置picGo在插件设置中搜索gitee插件并进行下载 TyporapicGo设置Typora 下载Typora进行图像设置 picGogitee设置图床 当我了解picGogitee可以设置图床…

python 把 易语言转成python

python 把 易语言转成python Python作为一种高效的编程语言&#xff0c;已经越来越受到开发者的欢迎。易语言是一种极为流行的编程语言&#xff0c;也有非常多的用户。然而&#xff0c;由于易语言语法比较简单&#xff0c;对于一些高级编程需求可能无法满足&#xff0c;对于需…

开源与云计算:新的合作模式

&#x1f337;&#x1f341; 博主猫头虎 带您 Go to New World.✨&#x1f341; &#x1f984; 博客首页——猫头虎的博客&#x1f390; &#x1f433;《面试题大全专栏》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33a; &a…

【附安装包】EViews 13.0安装教程|计量经济学|数据处理|建模分析

软件下载 软件&#xff1a;EViews版本&#xff1a;13.0语言&#xff1a;英文大小&#xff1a;369.46M安装环境&#xff1a;Win11/Win10/Win8/Win7硬件要求&#xff1a;CPU2.0GHz 内存4G(或更高&#xff09;下载通道①百度网盘丨64位下载链接&#xff1a;https://pan.baidu.com…

excel下载后文件名称不对

正确写法 String headerValue String.format("attachment; filename\"%s\";", fileName "_" dateStr ".xlsx");// 这样就可以了response.setHeader("content-disposition", headerValue);// 或者这样response.setHeader(…

Kafka 简介 + 学习笔记

消息队列 先说明消息队列是什么&#xff1a; 亚马逊&#xff1a; 消息队列是一种异步的服务间通信方式&#xff0c;适用于微服务架构。消息在被处理和删除之前一直存储在队列上。每条消息仅可被一位用户处理一次。消息队列可被用于分离重量级处理、缓冲或批处理工作以及缓解高…

vue权限管理——按钮控制

1.按钮根据后端返回数据决定展示与否 根据right中的数据对应增删改查按钮 const menuList [{id: 1, path:/uploadSpec,authName: "上传spec", icon: User, children:[], rights:[view,add,edit,delete]},{id: 2, path:/showSpec, authName: "Spec预览",…

edge浏览器进行qq截图过保爆决过程

edge浏览器进行qq截图过保解决过程 参考&#xff1a;电脑截屏曝光特别高怎么解决&#xff1f; - 知乎 问题展示 饱和度过高&#xff0c;刺眼 1. 在chrome地址栏输入chrome://flags/ 2. 在页面的搜索栏搜索force color profile 3. 在选项中选择所对应的颜色管理。&#xff08…

简单着色器编写(中下)

这篇我们来介绍另一部分函数。 static unsigned int CreateShader(const std::string& vertexShader, const std::string& fragmentShader) {unsigned int program glCreateProgram();unsigned int vs CompileShader(GL_VERTEX_SHADER,vertexShader);unsigned int f…