深度解读 | 搭载谷歌最强大模型Gemini的Bard能否赶上ChatGPT

大家好，我是极智视界，欢迎关注我的公众号，获取我的更多前沿科技分享

昨天早上看到了相关的报道，谷歌昨天发布了 "号称最强的大模型" Gemini，还是熟悉的字眼、还是熟悉的配方。之前谷歌一直在 AIGC 的竞争相对于微软的 OpenAI 全方位处于下风，即使前段时间推出了对标 ChatGPT 的 Bard、对标 GPT-4 的 PaLM2，当然，实际情况是没有 "标过"。这次，外界期待已久的谷歌大语言模型 Gemini 来袭，从定位来看应该是之前谷歌大模型 PaLM2 的替换者或者说升级版，目标就是打落长期 "霸占" 神坛的 GPT-4。

现在各大平台都在鼓吹 "性能最强大模型 Gemini 来袭"，这确实有些许 "鼓吹之意"，可能用 "谷歌最强大模型" 会更加合适。虽然 Gemini 的测试报告显得特别强，但是你真的是否足够强大，永远不是只停留在 benchmark 测试上就行，而是需要体现在用户的实际使用体验上，特别是对于现在的大模型，尤为如此。好用，你才强。

记得谷歌在今年的 Google I/O 上发布 PaLM2 的时候，"社会舆论" 也是差不多现在这个基调，当时也是号称 "最强语言模型 PaLM2 来袭、Bard 能力跃升" 之类的词眼。但是几个月过去了，GPT-4、ChatGPT 依旧风光不减，而反观谷歌的 PaLM2、Bard，真有点 "风声大雨点小" 的意思了。

而这次的 Gemini 和 GPT-4 不太一样，GPT-4 总的来说是走的语言大模型 LLM 路线，然后 "按需" 加入多模态，而谷歌的 Gemini 是原生多模态打造。因为 "原生多模态"，所以 Gemini 多模态能力应为更强、融合度更高，而这也体现在了 Gemini 的评测报告中，涉及自然图像、音频和视频理解、数学推理任务等，可以说是挑了些 GPT-4 "不太硬" 的地方猛攻，主打差异化。Gemini 要是在这几个方面 "起不来"，那就真完了，PaLM2 就是前车之鉴。

这次发布的 Gemini 为 1.0 版本，分为 Ultra、Pro、Nano 三个版本，基本可以对应到云、边(云边)、端三层算力结构，可谓全场景覆盖了。特别是 Nano 版本，它侧重于端侧的处理能力，而这对于大模型的广泛落地至关重要。之于 Gemini 的推出，全新的 Bard 也会搭载 Gemini 大模型，以再次对标 ChatGPT。而又考虑到 Gemini 的 Ultra 和 Pro，大概率以 Ultra 版本驱动的 Bard Advanced (对标 ChatGPT-4) 会是收费版本，而以 Pro 版本驱动的 Bard 会是免费版本 (对标 ChatGPT-3.5)，Nano 估计会开放用于推广。但是这种模式，我觉得对于现在的谷歌处境来说不太靠谱，现在的谷歌处于弱势，"挤牙膏" 的方式并不适合，需要全面碾压才行，所以最好的做法就是对于全部免费使用，这样对于每月化 20 刀的尊贵的 ChatGPT-4 用户估计会有大部分会倒戈 Bard Advanced。当然，"免费" 的意思是 Bard-A 免费，但 API 可以收费，先保证 to-C 的普及。

目前的 Bard 其实是搭载的 Gemini Pro，还没上 Gemini Ultra 版本，而据谷歌消息，将会在明年推出由 Gemini Ultra 驱动的 Bard Advanced 预览版，而这才会是搭载谷歌 LLM 或者更应该说是 MLLM 最强大、功能最全面的 Bard 版本 (其实明年已经不远啦)。大家现在可以做的比如一些 Bard 和 ChatGPT-4 的对标测试，使用的还不是最完整形态的 Bard，所以这种对比只能看出个一二，不能看出个所以然。来个 "阴谋论"，从某种角度来说，我甚至觉得这可能是谷歌使用的 "一些小伎俩"，就是不把最强的放出来，就是要让大家去猜去讨论，先攒几个月热度，提高对自身 Bard、对自身 Gemini 的关注度，待到明年热度减褪，再放出 Gemini Ultra，浇油点火。

以上还不是最关键的，最关键的在于即使你能跟 ChatGPT-4 打个平手，甚至是超越 ChatGPT-4，那又怎么样呢。OpenAI 的最强大模型可不至 GPT-4，GPT-4 是于 2023 年 3 月 14 日发布的，到目前已经快过去九个月了，按照 OpenAI 的迭代速度，手里肯定还握着下个更强版本的大模型已经在做各种安全测试，包括但不至于之前透露的 Q* 模型。这个意思就很像在 AI 芯片领域，咱们的国产 AI 芯片努力地、拼命地造芯去追赶英伟达，好不容易赶上 T4 的性能了，但回过头来发现已经落后了好几代，而且差距是越来越大。而反观谷歌 Gemini，如果 OpenAI 在谷歌放出 Gemini Ultra 之前升级了 GPT-4，那谷歌就很尴尬了，只能说一切皆为商业。