文章目录
- 总览
- Gemini
- 介绍
- 模型能力
- 产品API
- 其他产品
- Imagen2和其他新闻
- Duet AI
总览
现在,您可以免费访问Gemini Pro的API,这是谷歌最新大型语言模型的第一个版本。
Gemini
介绍
谷歌通过其API让企业和开发者第一次看到了其最强大的大型语言模型Gemini。该型号有三种尺寸可供选择:Ultra、Pro和Nano。
从今天开始,Gemini Pro API可通过谷歌的免费网络开发工具AI Studio(前身为Makersuite)向开发人员提供。Gemini Pro也可通过谷歌云的Vertex AI平台提供给企业。从今天开始,公司可以使用它来构建应用程序。
谷歌表示,计划在未来几周内根据用户反馈对该模型进行进一步微调。该公司在一篇博客文章中表示:“我们迫不及待地想看看开发商和企业如何与Gemini合作。”。
模型能力
Gemini Pro已经为谷歌对ChatGPT的回应Bard提供了动力。初始版本的文本上下文窗口只有32000个,这意味着它可以处理大约5333个单词(32000个标记)。相比之下,OpenAI的最新型号GPT-4 Turbo可以处理128000个代币。然而,谷歌表示,Gemini Pro的后续版本将大大扩展长度。
Gemini Pro的其他功能包括支持38种语言、函数调用、嵌入、语义检索和自定义知识基础。
目前,它只接受文本作为输入,并生成文本作为输出。然而,有一个专门的Gemini Pro Vision多模式端点,可以接受文本和图像——图像和视频作为输入,同时生成文本作为输出。从今天起提供。
产品API
Gemini Pro的API目前是免费使用的,但每分钟最多有60个查询。然而,很快就会有一个现收现付的版本,它的限制性较小,谷歌表示,它将以“有竞争力的价格”与OpenAI竞争。
谷歌已经发布了Gemini Pro的价格:每千个字符0.00025美元,或每张图片0.0025美元。每千个字符的输出成本为0.0005美元。
谷歌承认,免费版API的输入和输出将被谷歌用来改进其产品,但付费版不会。
其他产品
Imagen2和其他新闻
除了Gemini Pro,谷歌还有其他型号可添加到Vertex中,包括该公司最新的人工智能图像生成模型Imagen 2。Imagen 2使用谷歌DeepMind迄今为止建立的最强大的文本到图像扩散模型,可以生成高质量的图像,甚至可以用于为企业创建逼真的徽标。该模型还可以用多种语言渲染文本。
Vertex AI还增加了MedLM,这是一个为医疗保健行业微调的基础模型家族。MedLM建立在Med PaLM 2基础模型的基础上,旨在为医疗保健用例提供动力,包括医疗笔记和医疗问答。目前,MedLM仅适用于美国的Vertex用户,并计划在未来几周内将其扩展到Model Garden。谷歌还计划“很快”将基于Gemini的模型添加到MedLM套件中
Duet AI
最后,面向开发者的Duet AI现在已经普遍可用。Duet AI旨在帮助开发者构建应用程序,是一种协作工具,可以嵌入谷歌云界面,帮助生成代码和聊天。双子座将在接下来的几周内参加Duet AI。
Duet AI也正在扩展到安全操作,collab工具正在统一的SecOps平台中向防御者开放。