GPT-4:论文阅读笔记

  • GPT-4的输入和输出:输入的内容是文本或图片,输出的内容是文本。因此,GPT-4是一种输入端多模态的模型。
  • GPT-4的效果:在真实世界中还是比不上人类,但是在很多专业性的任务上已经达到了人类的水平,甚至超过人类。例如GPT-4能够在所有考生中以前10%的成绩通过律师资格证考试(GPT-3.5只能排在末尾的10%)。
  • GPT-4的图片输入功能:GPT-4目公布的内容还不支持图片上传,这个属于内测功能。目前,OpenAI只选择了一家合作公司测试图片输入功能。
  • GPT-4的align过程:GPT-4用了六个月的时间进行Align。这里的Align一方面使得模型能够执行人类的指令,同时使得模型能够生成与人类三观一致并且安全有用的输出。Align的方法包括使用根据用户体验中不好的例子进行学习。OpenAI认为GPT-4是它们目前最好的模型,在安全性可控性等方面都有了很大的进步。
  • GPT-4的深度学习栈:OpenAI重建了深度学习栈(与微软云Azure一起),并且为了训练GPT-4重新设计了一个超级计算集群。一年前该集群也被用于训练GPT-3.5。在这次的训练中,他们修复了一些BUG,并发现训练过程非常稳定。
  • GPT-4的训练任务:GPT-4也是使用传统的语言模型任务进行训练的。
  • RLHF的作用:为了使得模型的回答能够与人类的意图保持一致,以及保持模型的安全可控。(或者说,RLHF就是为了对模型做控制,让模型更能够知道提问者的意图,并按照用户喜欢的方式进行作答)
  • 预训练中的发现:OpenAI发现模型的能力好像就是从预训练的过程中获得的,RLHF并不能提高各种考试的成绩,有时还会使得成绩下降。
  • 可预测的训练损失:OpenAI在GPT-4开始训练时,就知道最终的损失结果。这个损失结果是通过另一个小一万倍的数据集(但是方法相同)上训练的损失函数外推出来的。因为大模型的训练稳定性是非常重要的,所以这样的方法非常实用。
  • GPT-4更加理性:之前的大模型有一种情况,就是模型越大,其本身就越来越不理性。但是GPT-4克服了这个缺点。
  • GPT-4和GPT-3.5的能力对比:对于日常对话,GPT-4和GPT-3.5的差别不大。但是任务难度增加后,这个区别就体现出来了,GPT-4更加可靠且更加有创造力。
  • GPT-4的数学和文学不好:GPT-4的数学仍然不好。另外,GPT-4在语言学和文学的本身考试上能力也不够强,但是其生成的东西大多数是空话。
  • GPT-4与其他NLP大模型的对比:GPT-4在多个Benchmark数据集上的表现都明显高于之前的其他语言模型,而且是大幅度碾压。
  • GPT-4与其他CV大模型的对比:GPT-4的图像输入表现也不错,但是比不上GPT-4在NLP的效果。
  • GPT-4的多语言性能:GPT-4在英语上的性能最好,中文也有不错的结果。另外,GPT-4在不同语言的性能与使用语言的人数没有直接关系。
  • GPT-4的System Message功能:让GPT-4扮演一个指定的角色,由此确定与用户对话时的语气语调。
  • GPT-4的安全性:GPT-4的安全性已经显著提高了,相较于GPT-3.5提高了40%。另外,GPT-4通过自己提升安全性:在RLHF的过程中设置了一个奖励信号,根据预训练好的模型创建一个分类器,判断一个回答是否是敏感的、有危险的和不应该回答的,从而提升自身的回答安全性。
  • GPT-4的限制:GPT-4的训练数据截至时间到2021年的9月份(尽管在后续的过程中可能会使用新的数据更新模型)。另外,GPT-4容易受到用户的欺骗。
  • GPT-4的置信度:在经过RLHF之前,GPT-4对回答内容的置信度和答案本身的正确可能性基本上是对齐的。但是,经过RLHF之后,模型的校准明显下降了很多。
  • GPT-4的文本长度:GPT-4的文本长度是8192个Token,这个相较于之前的模型已经是非常长的了。另外,GPT-4还有一个32768个Token长度的版本。
  • GPT-4的一种图像生成方法:先让GPT-4根据指定的描述生成代码,然后运行代码得到图片。GPT-4通过这种方式可以生成图像,但是都是比较初级的图像。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/155149.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

mongdb 删除重复的数据,并保留其中一条

脚本如下,将下面集合与字段替换成自己的集合名和重复字段名即可。 var removeInstanceIdArr = []; var data = db.getCollection("table_test").aggregate( [ { "$group" : { "key": {"Id"…

「全域BI-运营」——助力双11店铺数据可视化

大部分商家主要靠销售商品赚取利润,因此要及时掌握:店铺流量是否异常波动?商品/新品是否有良好竞争力?如何更好营销吸引用户提高客单和回购?掌握这些情况以后,才能进一步决策。 特别是双11期间&#xff0c…

基于51单片机交通灯仿真_紧急开关+黄灯倒计时+可调时间(proteus+代码+报告+讲解视频)

基于51单片机交通灯_紧急开关黄灯倒计时可调时间 ☑️开题报告☑️仿真图(提供源文件):☑️系统硬件设计☑️主控制器选择☑️系统硬件结构图☑️时钟及复位电路☑️指示灯及倒计时模块 ☑️倒计时模块:☑️程序☑️软件主流程框架…

Python实现自动登录+获取数据

前言 大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 Dy这个东西想必大家都用过,而且还经常刷,今天就来用代码,获取它的视频数据 如果有什么疑惑/资料需要的可以点击文章末尾名片领取源码 环境使用 Python 3.8 Pycharm 模块使用 request…

c++ 获取时间 微秒

参考:https://juejin.cn/s/c%2B%2B%20%E8%8E%B7%E5%8F%96%E6%97%B6%E9%97%B4%20%E5%BE%AE%E7%A7%92 在 C 中获取当前时间的微秒数可以使用 头文件中的 std::chrono::high_resolution_clock 类。该类提供了高精度的计时功能,可以精确到纳秒级别。 以下是一个示例代…

js进阶笔记之构造函数

目录 一、构造函数 1、 创建对象 2、new执行过程 3、带参数构造函数 4、实例成员与静态成员 二、内置构造函数 1、Object静态方法 2、包装类型 3、Array 1、map方法 2、find方法 3、findIndex( ) 4、some与every 5、reverse() 6、reduce方法 7、forEach() …

wget 对整站内容进行爬取

如果你想对站点内容进行爬虫,还有一条最简洁的系统原生命令可以搞定: wget --random-wait -r -p -e robotsoff -U mozilla https://example.com/ 加上 -nv 或 --no-verbose 参数后,输出的内容会变得更加简洁; 加上 --accept-re…

DrugMAP: molecular atlas and pharma-information of all drugs学习

DrugMAP:所有药物的分子图谱和制药信息 - PMC (nih.gov) DrugMAP: the molecular atlas and pharma-information of drugs (idrblab.net) 构建了一个描述药物分子图谱和药物信息的新数据库(DrugMAP)。它提供了>30 000种药物/候选药物的相…

bash: ./configure: /bin/sh^M: bad interpreter: No such file or directory

问题背景: 在linux上编译Qt时,遇到这个问题 “bash: ./configure: /bin/sh^M: bad interpreter: No such file or directory” 问题原因: Qt的configure文件是在windows上写的,现在是在ubuntu上进行编译。而linux和windows在换…

数字化转型导师坚鹏:数字化时代银行网点厅堂营销5大难点分析

数字化时代银行网点厅堂营销存在以下5大难点: 1、识别难。识别有效的客户比较难,传统的厅堂识别主要依据客户的衣着气质等主管感受,判断客户是否为潜在中高端客户,提供相关服务。大堂经理主管识别与智能化系统识别相结合&#xf…

C++单调向量算法:132 模式解法三枚举1

本题不同解法 包括题目及代码C二分查找算法:132 模式解法一枚举3C二分查找算法:132 模式解法二枚举2代码最简洁C二分查找算法:132 模式解法三枚举1性能最佳C单调向量算法:132 模式解法三枚举1 分析 时间复杂度 2轮循环时间复杂…

如何选择适合的开源框架来构建微服务架构?

随着科技的飞速发展,云计算和大规模应用的需求日益显著,这促使微服务架构在软件开发领域中占据了主流地位。微服务架构的广泛应用为开发人员提供了灵活性、可伸缩性和高可用性,从而推动了快速的应用程序开发。然而,在构建微服务架…

NextJS开发:nextjs中使用CkEditor5

NextJS项目中需要使用CkEditor5作为富文本编辑器,按照官网React CkEditor5手册使用出现如下错误: node_modules/ckeditor/ckeditor5-react/dist/index.js (5:242) eval⨯ ReferenceError: self is not defined还是因为nextjs的服务器端渲染造成的错误&…

快速幂(c++,超级详细)

快速幂 如果我们打算求a^b, 我们可能会写一个for循环,乘以b次a,时间复杂度为O(b) 当b比较小的时候还可以运用,但是当b很大,比如b1000000,此时时间复杂度就显然很高了,我们需要对其进行优化 ———快速幂 开始之前&a…

JDBC快速入门

JDBC快速入门 PS:上传图片有点问题,我整理成了PDF格式,方便看图文。 今日目标 掌握JDBC的的CRUD理解JDBC中各个对象的作用掌握Druid的使用 1,JDBC概述 在开发中我们使用的是java语言,那么势必要通过java语言操作数据库…

【ARM AMBA AXI 入门 14 -- AXI 窄位传输 | 非对齐传输| 大小端传输】

请阅读【ARM AMBA AXI 总线 文章专栏导读】 文章目录 窄位传输 (Narrow Transfer)非对齐传输 (Unaligned Transfer)大小端传输 (Endianness Transfer)ARM AMBA AXI (Advanced eXtensible Interface) 是一个高性能、高带宽的总线接口,常用于连接高速微处理器核心与其它部件。在…

模拟电路总结

一、半导体器件 1.1 半导体的特性 导电性能介于导体和绝缘体之间。如:硅(Si)、锗(Ge) 1.1.1 本征半导体 纯净的、不含杂质的半导体 温度敏感:T0K时,绝缘;温度升高时,载流…

Thinkphp-商城项目之oss文件上传及web端直传

4.3头像上传 一般商城网站都会把文件上传到第三方云,例如阿里云(oss),腾讯云(cos),当然如果公司有足够的实力,可以自己部署一台文件服务器,用于文件的保存。 头像上传一般是用户在用户中心上传的,后台管理…

软件需求的三大层次,逐层细化的注意事项

需求逐层分解和转化是一个持续优化的过程,在这个过程中,我们需要明确软件需求的三大层次,从而帮助项目团队理解组织或客户的高层目标和期望,满足用户的期望和需求,有助于产品的系统设计和开发。 一、软件需求三大层次 …

【力扣的101夜】轮转数组

public void rotate(int[] nums, int k) { } 用 Syst.arraycopy 五个参数是 System.arraycopy(nums, length - step, temp, 0, step); nums:源数组,即要从中复制元素的数组。length - step:源数组的起始位置,即从哪个索引开始复…