大家好,我是极智视界,欢迎关注我的公众号,获取我的更多前沿科技分享
昨天早上看到了相关的报道,谷歌昨天发布了 "号称最强的大模型" Gemini,还是熟悉的字眼、还是熟悉的配方。之前谷歌一直在 AIGC 的竞争相对于微软的 OpenAI 全方位处于下风,即使前段时间推出了对标 ChatGPT 的 Bard、对标 GPT-4 的 PaLM2,当然,实际情况是没有 "标过"。这次,外界期待已久的谷歌大语言模型 Gemini 来袭,从定位来看应该是之前谷歌大模型 PaLM2 的替换者或者说升级版,目标就是打落长期 "霸占" 神坛的 GPT-4。
现在各大平台都在鼓吹 "性能最强大模型 Gemini 来袭",这确实有些许 "鼓吹之意",可能用 "谷歌最强大模型" 会更加合适。虽然 Gemini 的测试报告显得特别强,但是你真的是否足够强大,永远不是只停留在 benchmark 测试上就行,而是需要体现在用户的实际使用体验上,特别是对于现在的大模型,尤为如此。好用,你才强。
记得谷歌在今年的 Google I/O 上发布 PaLM2 的时候,"社会舆论" 也是差不多现在这个基调,当时也是号称 "最强语言模型 PaLM2 来袭、Bard 能力跃升" 之类的词眼。但是几个月过去了,GPT-4、ChatGPT 依旧风光不减,而反观谷歌的 PaLM2、Bard,真有点 "风声大雨点小" 的意思了。
而这次的 Gemini 和 GPT-4 不太一样,GPT-4 总的来说是走的语言大模型 LLM 路线,然后 "按需" 加入多模态,而谷歌的 Gemini 是原生多模态打造。因为 "原生多模态",所以 Gemini 多模态能力应为更强、融合度更高,而这也体现在了 Gemini 的评测报告中,涉及自然图像、音频和视频理解、数学推理任务等,可以说是挑了些 GPT-4 "不太硬" 的地方猛攻,主打差异化。Gemini 要是在这几个方面 "起不来",那就真完了,PaLM2 就是前车之鉴。
这次发布的 Gemini 为 1.0 版本,分为 Ultra、Pro、Nano 三个版本,基本可以对应到 云、边(云边)、端 三层算力结构,可谓全场景覆盖了。特别是 Nano 版本,它侧重于端侧的处理能力,而这对于大模型的广泛落地至关重要。之于 Gemini 的推出,全新的 Bard 也会搭载 Gemini 大模型,以再次对标 ChatGPT。而又考虑到 Gemini 的 Ultra 和 Pro,大概率以 Ultra 版本驱动的 Bard Advanced (对标 ChatGPT-4) 会是收费版本,而以 Pro 版本驱动的 Bard 会是免费版本 (对标 ChatGPT-3.5),Nano 估计会开放用于推广。但是这种模式,我觉得对于现在的谷歌处境来说不太靠谱,现在的谷歌处于弱势,"挤牙膏" 的方式并不适合,需要全面碾压才行,所以最好的做法就是对于全部免费使用,这样对于每月化 20 刀的尊贵的 ChatGPT-4 用户估计会有大部分会倒戈 Bard Advanced。当然,"免费" 的意思是 Bard-A 免费,但 API 可以收费,先保证 to-C 的普及。
目前的 Bard 其实是搭载的 Gemini Pro,还没上 Gemini Ultra 版本,而据谷歌消息,将会在明年推出由 Gemini Ultra 驱动的 Bard Advanced 预览版,而这才会是搭载谷歌 LLM 或者更应该说是 MLLM 最强大、功能最全面的 Bard 版本 (其实明年已经不远啦)。大家现在可以做的比如一些 Bard 和 ChatGPT-4 的对标测试,使用的还不是最完整形态的 Bard,所以这种对比只能看出个一二,不能看出个所以然。来个 "阴谋论",从某种角度来说,我甚至觉得这可能是谷歌使用的 "一些小伎俩",就是不把最强的放出来,就是要让大家去猜去讨论,先攒几个月热度,提高对自身 Bard、对自身 Gemini 的关注度,待到明年热度减褪,再放出 Gemini Ultra,浇油点火。
以上还不是最关键的,最关键的在于即使你能跟 ChatGPT-4 打个平手,甚至是超越 ChatGPT-4,那又怎么样呢。OpenAI 的最强大模型可不至 GPT-4,GPT-4 是于 2023 年 3 月 14 日发布的,到目前已经快过去九个月了,按照 OpenAI 的迭代速度,手里肯定还握着下个更强版本的大模型已经在做各种安全测试,包括但不至于之前透露的 Q* 模型。这个意思就很像在 AI 芯片领域,咱们的国产 AI 芯片努力地、拼命地造芯去追赶英伟达,好不容易赶上 T4 的性能了,但回过头来发现已经落后了好几代,而且差距是越来越大。而反观谷歌 Gemini,如果 OpenAI 在谷歌放出 Gemini Ultra 之前升级了 GPT-4,那谷歌就很尴尬了,只能说一切皆为商业。
所以,在大模型领域、在 AIGC 领域,我还是会更看好 OpenAI,更看好 ChatGPT。
【极智视界】
《深度解读 | 搭载谷歌最强大模型Gemini的Bard能否赶上ChatGPT》