自去年 3 月份以来,人们对 GPT-4 API 的兴趣激增,“有数百万开发人员请求访问”。OpenAI 在一篇博客文章中,分享了使用 GPT-4 正在进行的一系列令人兴奋的创新,并阐明了未来的愿景:未来基于聊天的大模型可以用在任意的用例上。
GPT-4 开放API、推出的 Code Interpreter 跟所有在一线工作的程序员有什么关系?能给我们带来什么落到实处的价值吗?今天我想跟各位聊一聊。
GPT4 API 和 ChatGPT Plus 有什么不同?
首先我们需要了解这个所谓的 API ,相比于其历史上的其他产品有什么价值。 ChatGPT Plus 需要用户自己在网站上或者 APP 上进行升级使用,但是 GPT4 目前只能够每3小时提问25次。这应该是 OpenAI 算力吃紧,担心有大量的用户进行访问。
要升级 Plus 网上有很多教程,此处不展开。
GPT4 API 的调用是可以通过代码调用的,当然需要保证你的 OpenAI 账号有钱。而且访问的时候没有时间限制。
CPT4 API 可以干什么?
先来看看第一波吃螃蟹(内测)的人怎么说。
宾夕法尼亚大学沃顿商学院教授 Ethan Mollick 在一次演示中将2019年和2020年烟花爆竹伤害的非结构化数据集起来给到 ChatGPT。没一会 Code Interpreter 将数据格式化为一个有组织的数据库,并得出结论:在此期间,烟花爆竹造成的伤害“显著增加”。
一家人工智能项目孵化器的创始人亚历克斯-科尔在推特上说,他向 Code Interpreter 提供了一个特斯拉股票数据,并要求它绘制价格图表。在短短五分钟内,ChatGPT 就绘制出了多条线图,显示了特斯拉五年来的收盘价。
科尔还让插件生成了线图和柱状图,显示了每日股票价格的波动情况。Code Interpreter 对于探索性数据分析和可视化的效果非常突出。科尔还在推特上写道:“这是你的个人数据科学家和分析师”。
除了以上的例子,GPT4 API 还能做到这些:
▶︎ 利用 GPT4 API 广阔的叙事能力,能够撰写复杂的小说或者情节,而这些正在切蒂改变文学创作领域。
▶︎ 它可以模拟真实的人类对话,反映了人类交互的真实性和精确性。
▶︎ 可以进行即时语言翻译,有效地弥合了各种语言和文化之间的沟通差距。
▶︎ 它配备先进的数据分析功能,有助于准确预测股市趋势,为市场参与者提供宝贵的见解。
▶︎ 能够打造与现实世界动态相呼应的高度逼真的虚拟环境,增强了游戏和虚拟现实等领域的沉浸感。
▶︎ 为程序员提供有效的代码能力。
▶︎ 可以解读消费者数据和生成定制营销内容的能力,从而有效地与目标受众产生共鸣。
▶︎ 具有通过分析大量科学数据以发现化学、物理和生物学等不同领域的新见解来推动科学创新的潜力。
GPT4 对比 GPT3 有什么区别?
大幅度能力提升
GPT-3.5 和 GPT-4 对比来看,有以下几个区别:
-
在处理复杂任务上,GPT-4 更可靠、更有创意,并且能够处理更细微的指令。
-
各种奥林匹克竞赛、GRE 考试、代码考试、统一律师考试等测试上,GPT-4 都基本完虐 GPT-3.5。
在机器学习的一些基准测试集上,也表现更加突出,达到了 SOTA 的水准,比大部分的语言模型效果要好:
可操纵性能力提升
GPT-4 在不同风格和角色上,完成度相当高。
给定了一个角色给它,它能够有效地执行下去。比如在官方放出的例子上,它扮演一个“苏格拉底式导师”,在一开始设定好系统所扮演的角色之后,用户不断逼问它公式的答案,但是它仍然能够不卑不亢地引导用户进行学习。这样的角色定位,相当于一名小学教师了:
CPT4 每个 Token 需要多少钱?
首先要知道,对比于 GPT3.5 来说,本身 GPT4 参数量更大,所需要的计算资源也就更多,因此调用的时候花费更多。
从官网列出的表格可以知道,GPT4 中每 1K token 最低输入输出的费用为$0.09,大概是 GPT3.5 的25倍左右。
所以说要用 GPT4,没点经济实力还是不行的。
接下来我们聊聊 Code Interpreter 。
Code Interpreter 可以做什么?
从官方网站上介绍,它有许多有趣的用法:
将 Gif 图转换为视频
创建可视化地图
从图像中提前颜色
分析具体的数据
创建热图
目前 Code Interpreter 对所有 Plus 用户开放。可以在设置在打开 Code Interpreter 选项进行体验,下面我分享几个用法,亲测有效。
Gif 图转换为视频
首先要求 ChatGPT 把 Gif 转视频:
然后上传对应的 Gif 图片,它就会按照你的要求进行转换了。
创建可视化地图
上传美国每个灯塔位置的位置数据,并要求 ChatGPT 制作每个灯塔闪烁的地图的 Gif。
从图像中提前颜色
上传图片,并要求 ChatGPT 提取颜色并创建一个调色板:
分析具体的数据
上传数据并将数据解释为可视化图表:
创建热图
能够生成一个功能齐全的 HTML 热图。
此外,该插件还能够根据你所提供的数据,制定对应的业务策略。或者根据你的需求制定对应的 GIF 图。
Code Interpreter 不仅局限于上述功能,还扩展到视频处理(格式转换、截取)、图片处理(格式转换、OCR 识别)、PDF 处理(总结内容、转为图片)和数据分析(内容分析、数据可视化、转换为网站),同时具备写代码和执行代码的强大能力。
无论是技术爱好者、数据分析师还是多媒体创作者,Code Interpreter 都能满足多领域的技术应用需求。
总结
整体而言,随着 GPT-4 API 和 Code Interpreter 插件的开放,普通大众终于可以体验到人工智能最先进的技术,它能够开箱即用,在与人交互上达到了目前 AI 的最高水平。
希望更多的人针对 GPT4 和对应的插件进行开发,同时围绕 GPT4 的不同垂直领域进行深耕,才能真正的提升我们生活的方方面面。