AI日报：谷歌Gemini Pro即将面向企业和开发者

文章目录

总览
Gemini
- 介绍
模型能力
产品API
其他产品
- Imagen2和其他新闻
- Duet AI

总览

现在，您可以免费访问Gemini Pro的API，这是谷歌最新大型语言模型的第一个版本。

Gemini

介绍

谷歌通过其API让企业和开发者第一次看到了其最强大的大型语言模型Gemini。该型号有三种尺寸可供选择：Ultra、Pro和Nano。

在这里插入图片描述

从今天开始，Gemini Pro API可通过谷歌的免费网络开发工具AI Studio（前身为Makersuite）向开发人员提供。Gemini Pro也可通过谷歌云的Vertex AI平台提供给企业。从今天开始，公司可以使用它来构建应用程序。

谷歌表示，计划在未来几周内根据用户反馈对该模型进行进一步微调。该公司在一篇博客文章中表示：“我们迫不及待地想看看开发商和企业如何与Gemini合作。”。

模型能力

Gemini Pro已经为谷歌对ChatGPT的回应Bard提供了动力。初始版本的文本上下文窗口只有32000个，这意味着它可以处理大约5333个单词（32000个标记）。相比之下，OpenAI的最新型号GPT-4 Turbo可以处理128000个代币。然而，谷歌表示，Gemini Pro的后续版本将大大扩展长度。

Gemini Pro的其他功能包括支持38种语言、函数调用、嵌入、语义检索和自定义知识基础。

目前，它只接受文本作为输入，并生成文本作为输出。然而，有一个专门的Gemini Pro Vision多模式端点，可以接受文本和图像——图像和视频作为输入，同时生成文本作为输出。从今天起提供。

产品API

Gemini Pro的API目前是免费使用的，但每分钟最多有60个查询。然而，很快就会有一个现收现付的版本，它的限制性较小，谷歌表示，它将以“有竞争力的价格”与OpenAI竞争。

在这里插入图片描述

谷歌已经发布了Gemini Pro的价格：每千个字符0.00025美元，或每张图片0.0025美元。每千个字符的输出成本为0.0005美元。

谷歌承认，免费版API的输入和输出将被谷歌用来改进其产品，但付费版不会。

其他产品

Imagen2和其他新闻

除了Gemini Pro，谷歌还有其他型号可添加到Vertex中，包括该公司最新的人工智能图像生成模型Imagen 2。Imagen 2使用谷歌DeepMind迄今为止建立的最强大的文本到图像扩散模型，可以生成高质量的图像，甚至可以用于为企业创建逼真的徽标。该模型还可以用多种语言渲染文本。

在这里插入图片描述

Vertex AI还增加了MedLM，这是一个为医疗保健行业微调的基础模型家族。MedLM建立在Med PaLM 2基础模型的基础上，旨在为医疗保健用例提供动力，包括医疗笔记和医疗问答。目前，MedLM仅适用于美国的Vertex用户，并计划在未来几周内将其扩展到Model Garden。谷歌还计划“很快”将基于Gemini的模型添加到MedLM套件中