刚开始的时候我还在纠结,一个月20 刀的ChatGPT4 ,到底值不值这个价钱?使用过后发现,诶嘛真香。因为 GPT4 比 GPT3.5 多了太多功能,特别是识图能力,用好的话效率翻倍。
1. 看图写代码
ChatGPT4 相比 ChatGPT3.5 增加了GPT Store、上传文件等功能,不仅仅是普通的语言大模型,还可以处理图像、文档等等。给他一个页面,他就能生成前端代码,不再需要费心费力地去解释页面布局了。像下面这样,给 ChatGPT 输入左边的图片,GPT 会生成中间的 html 代码,显示出来后,得到右边的页面,是不是有模有样?这还是第一轮交互,多轮修改后很快就能得到完全一样的页面。这不比工作中沟通效率高得多,关键 GPT 还是一个永远都不会下班、不会生气的研发,简直不要太好用。
2. 看图说话,强大的场景理解能力
再比如下面这张图,GPT4 的细节感知能力震惊到了我,他甚至能发现仪表盘上的车速。不过对整体场景的理解能力还有欠缺,没有发现车辆在右转下匝道。但我相信,在 scaling law 的加持下,随着模型规模和数据规模的不断升级,GPT 将在自动驾驶领域大显身手,届时 GPT 不再是大语言模式,而是通用人工智能。
大家还发现了 ChatGPT 的哪些玩法?快来一起交流一下吧!