Amazon Bedrock基础指南:参考资料、模型特点、价格、使用方法及运行时API执行示例

这次我整理了2023年9月28日正式发布的Amazon Bedrock的基本信息和Runtime API的执行示例。此外,还在文中插入了最基本的术语解释,以帮助理解令牌和参数的概念。

※本文及其他由本文作者发表的文章中所包含的源代码均为自主研究活动的一部分。如需使用,请自行承担责任。另外,代码可能会在没有预告的情况下进行修改,敬请谅解。

Amazon Bedrock的基本情報

Amazon Bedrock 的参考资料与学习资源

有助于理解 Amazon Bedrock 的主要参考资料和学习资源如下:
本文内容基于这些参考资料和学习资源中的信息。

  • What's New: Amazon Bedrock is now generally available
  • AWS Blog: Amazon Bedrock Is Now Generally Available – Build and Scale Generative AI Applications with Foundation Models
  • 模型定价: Amazon Bedrock Pricing
  • Workshop: GitHub - aws-samples/amazon-bedrock-workshop: This is a workshop designed for Amazon Bedrock a foundational model service.
  • AWS Documentation(User Guide): What is Amazon Bedrock? - Amazon Bedrock
  • AWS Documentation(API Reference): Bedrock API Reference - Amazon Bedrock
  • AWS SDK for Python(Boto3) Documentation(Bedrock): Bedrock - Boto3 documentation
  • AWS SDK for Python(Boto3) Documentation(BedrockRuntime): BedrockRuntime - Boto3 documentation
  • AWS CLI Command Reference(bedrock): bedrock — AWS CLI Command Reference
  • AWS CLI Command Reference(bedrock-runtime): bedrock-runtime — AWS CLI Command Reference
  • AWS Management Console(Amazon Bedrock Model Providers): Amazon Bedrock Model Providers - AWS Management Console

Amazon Bedrock是什么?

Amazon Bedrock 是一项服务,提供通过 API 访问基础模型(Foundation Models, FMs)和使用独有数据对这些模型进行私有化定制的功能。它支持多种基础模型,包括 AI21 Labs 的 Jurassic-2、Amazon 的 Titan、Anthropic 的 Claude、Cohere 的 Command、Meta 的 Llama 2 和 Stability AI 的 Stable Diffusion。用户可以根据不同的使用场景,如文本生成、聊天机器人、搜索、文本摘要、图像生成和个性化推荐等,选择适合的基础模型来构建和扩展生成式 AI 应用。

在处理文本的生成型AI中,“令牌(tokens)”是什么?

在查看 Amazon Bedrock 的模型列表和价格表之前,我们先简要说明一下作为限制和计费单位的“令牌(tokens)”。

请注意,为了便于理解,这里提供的定义可能与严格的定义有所不同。

在处理文本的生成型AI中,“令牌(tokens)”是指将文本分割成有意义部分的单位。令牌可以是单词,但不一定完全等同于单词,也可能是字符、子词等。

例如,将字符串Amazon Bedrock is amazing!按单词进行令牌化,结果如下:

["Amazon", "Bedrock", "is", "amazing", "!"]

然而,如果使用不是基于单词的其他令牌化方法(Tokenization),可能会将空格也包括在内进行分割,结果如下:

["Amazon", " ", "Bedrock", " ", "is", " ", "amazing", "!"]

令牌化方法除了基于单词外,还有如 Unigram Tokenization、WordPiece、SentencePiece、Byte Pair Encoding(BPE)等高级方法。不同的模型采用不同的令牌化手法,因此在使用时需要注意这一点。

特别是在进行基于令牌的费用计算时,最好根据目标模型的令牌化手法,在接近实际使用条件的场景中计算令牌数。然而,个人来说,在考虑 Generative AI 服务的月度预算时,如果不想花费过多时间和精力在详细的令牌数预测上,我会使用 Generative AI 本身进行计算,或者为了方便计算,将 1 个字符估算为 1 个令牌,略高估费用。

准备好的模型列表

本文是根据产品页面的 Amazon Bedrock – AWS 或 AWS Management Console 中的 Amazon Bedrock Model Providers 在撰写本文时的数据进行总结的。

※支持嵌入(Embed)的模型能够将文本输入(如单词、短语或较大的文本单位)转换为包含文本意义的数值表示(嵌入)。

Model ProviderModelModel IDMax tokensModality
(Data Type)
LanguagesSupported use cases
AI21 LabsJurassic-2 Ultra
(v1)
ai21.j2-ultra-v18191TextEnglish
Spanish
French
German
Portuguese
Italian
Dutch
Open book question answering
summarization
draft generation
information extraction
ideation
AI21 LabsJurassic-2 Mid
(v1)
ai21.j2-mid-v18191TextEnglish
Spanish
French
German
Portuguese
Italian
Dutch
Open book question answering
summarization
draft generation
information extraction
ideation
AmazonTitan Embeddings G1 - Text
(v1.2)
amazon.titan-embed-text-v18kEmbeddingEnglish, Arabic, Chinese (Sim.), French, German, Hindi, Japanese, Spanish, Czech, Filipino, Hebrew, Italian, Korean, Portuguese, Russian, Swedish, Turkish, Chinese (trad), Dutch, Kannada, Malayalam, Marathi, Polish, Tamil, Telugu and others.Translate text inputs (words, phrases or possibly large units of text) into numerical representations (known as embeddings) that contain the semantic meaning of the text.
AmazonTitan Text G1 - Liteamazon.titan-text-lite-v14kTextEnglishSummarization and copywriting.
AmazonTitan Text G1 - Expressamazon.titan-text-express-v18kTextEnglish (GA), Multilingual in 100+ languages (Preview)Open ended text generation
brainstorming
summarization
code generation
table creation
data formatting
paraphrasing
chain of though
rewrite
extraction
Q&A
chat
AmazonTitan Image Generator G1amazon.titan-image-generator-v177ImageEnglishText to image generation
image editing
image variations
AmazonTitan Multimodal Embeddings G1amazon.titan-embed-image-v1128EmbeddingEnglishSearch
recommendation
personalization
AnthropicClaude 3.5 Sonnetanthropic.claude-3-5-sonnet-20240620-v1:0200kTextEnglish and multiple other languagesComplex tasks like customer support
Coding
Data Analysis
and Visual Processing.
Streamlining of Workflows
Generation of Insights
and Production of High-Quality
Natural-Sounding Content.
AnthropicClaude 3 Opusanthropic.claude-3-opus-20240229-v1:0200kTextEnglish and multiple other languagesTask automation: plan and execute complex actions across APIs and databases, interactive coding
R&D: research review, brainstorming and hypothesis generation, drug discovery
Strategy: advanced analysis of charts & graphs, financials and market trends, forecasting
AnthropicClaude 3 Sonnetanthropic.claude-3-sonnet-20240229-v1:0200kTextEnglish and multiple other languagesData processing: RAG or search & retrieval over vast amounts of knowledge
Sales: product recommendations, forecasting, targeted marketing
Time-saving tasks: code generation, quality control, parse text from images
AnthropicClaude 3 Haikuanthropic.claude-3-haiku-20240307-v1:0200kTextEnglish and multiple other languagesCustomer interactions: quick and accurate support in live interactions, translations
Content moderation: catch risky behavior or customer requests
Cost-saving tasks: optimized logistics, inventory management, extract knowledge from unstructured data
AnthropicClaude v2.1anthropic.claude-v2:1200kTextEnglish and multiple other languagesQuestion answering
information extraction
removing PII
content generation
multiple choice classification
Roleplay
comparing text
summarization
document Q&A with citation
AnthropicClaude v2anthropic.claude-v2100kTextEnglish and multiple other languagesQuestion answering
information extraction
removing PII
content generation
multiple choice classification
Roleplay
comparing text
summarization
document Q&A with citation
Anthropic[Legacy version]
Claude v1.3
anthropic.claude-v1100kTextEnglish and multiple other languagesQuestion answering
information extraction
removing PII
content generation
multiple choice classification
Roleplay
comparing text
summarization
document Q&A with citation
AnthropicClaude Instant v1.2anthropic.claude-instant-v1100kTextEnglish and multiple other languagesQuestion answering
information extraction
removing PII
content generation
multiple choice classification
Roleplay
comparing text
summarization
document Q&A with citation
CohereCommand R+
(v1)
cohere.command-r-plus-v1:0128kTextEnglish, French, Spanish, Italian, German, Portuguese, Japanese, Korean, Arabic, and ChineseComplex RAG on large amounts of data
Q&A
Multi-step tool use
chat
text generation
text summarization
CohereCommand R
(v1)
cohere.command-r-v1:0128kTextEnglish, French, Spanish, Italian, German, Portuguese, Japanese, Korean, Arabic, and ChineseChat
text generation
text summarization
RAG on large amounts of data
Q&A
function calling
CohereCommand
(v14.7)
cohere.command-text-v144000TextEnglishSummarization
copywriting
dialogue
extraction
question answering
CohereCommand Light
(v14.7)
cohere.command-light-text-v144000TextEnglishSummarization
copywriting
dialogue
extraction
question answering
CohereEmbed English
(v3)
cohere.embed-english-v3512EmbeddingEnglishSemantic search
retrieval-augmented generation (RAG)
classification
clustering
CohereEmbed Multilingual
(v3)
cohere.embed-multilingual-v3512Embedding108 LanguagesSemantic search
retrieval-augmented generation (RAG)
classification
clustering
MetaLlama 3 70B Instructmeta.llama3-70b-instruct-v1:08kTextEnglishLanguage modeling
Dialog systems
Code generation
Following instructions
Sentiment analysis with nuances in reasoning
Text classification with improved accuracy and nuance
Text summarization with accuracy and nuance
MetaLlama 3 8B Instructmeta.llama3-8b-instruct-v1:08kTextEnglishText summarization
Text classification
Sentiment analysis
MetaLlama 2 Chat 13Bmeta.llama2-13b-chat-v14096TextEnglishText generation
Conversation
Chat based applications
MetaLlama 2 Chat 70Bmeta.llama2-70b-chat-v14096TextEnglishText generation
Conversation
Chat based applications
Mistral AIMistral 7B Instructmistral.mistral-7b-instruct-v0:232KTextEnglishClassification
Text generation
Code generation
Mistral AIMixtral 8x7B Instructmistral.mixtral-8x7b-instruct-v0:132KTextEnglish, French, Italian, German and SpanishComplex reasoning & analysis
Text generation
Code generation
Mistral AIMistral Largemistral.mistral-large-2402-v1:032KTextEnglish, French, Italian, German and SpanishComplex reasoning & analysis
Text generation
Code generation
RAG
Agents
Mistral AIMistral Smallmistral.mistral-small-2402-v1:032KTextEnglish, French, Italian, German and SpanishText generation
Code generation
Classification
RAG
Conversation
Stability AI[Legacy version]
Stable Diffusion XL
(v0.8)
stability.stable-diffusion-xl-v077ImageEnglishimage generation
image editing
Stability AIStable Diffusion XL
(v1.0)
stability.stable-diffusion-xl-v177ImageEnglishimage generation
image editing

准备好的模型价格

本文参考了 Amazon Bedrock Pricing 页面中的数据进行总结。

未标注价格的模型表示尚未提供该价格选项,或者该模型不支持定制功能。

处理文本的模型价格

处理文本的模型价格如下所示:

按需定价
按需定价是根据每1,000个输入令牌和每1,000个输出令牌的数量进行计算的(不是基于时间的支付)。

预置吞吐量
预置吞吐量通过承诺在指定期间内按时间支付来提供充足的吞吐量,以满足大规模使用的需求。承诺的时间有无期限、1个月和6个月,承诺时间越长,折扣越大。

模型定制(微调)
如果使用微调来创建定制模型,则会产生每1,000个令牌的训练费用以及每个定制模型的月度存储费用。

Model ProviderModelOn-Demand
(per 1000 input tokens)
On-Demand
(per 1000 output tokens)
Provisioned Throughput
(per hour per model)
Model customization through Fine-tuning
AI21 LabsJurassic-2 Ultra0.0188 USD0.0188 USD--
AI21 LabsJurassic-2 Mid0.0125 USD0.0125 USD--
AmazonTitan Text Lite(Titan Text G1 - Lite)0.0003 USD0.0004 USDno commitment: 7.10 USD

1-month commitment: 6.40 USD

6-month commitment: 5.10 USD
Train(per 1000 tokens): 0.0004 USD

Store each custom model(per month): 1.95 USD
AmazonTitan Text Express(Titan Text G1 - Express)0.0008 USD0.0016 USDno commitment: 20.50 USD

1-month commitment: 18.40 USD

6-month commitment: 14.80 USD
Train(per 1000 tokens): 0.008 USD

Store each custom model(per month): 1.95 USD
AmazonTitan Embeddings(Titan Embeddings G1 - Text)0.0001 USDN/Ano commitment: N/A

1-month commitment: 6.40 USD

6-month commitment: 5.10 USD
-
AnthropicClaude 3.5 Sonnet0.00300 USD0.01500 USDno commitment: N/A

1-month commitment: N/A

6-month commitment: N/A
-
AnthropicClaude 3 Opus0.01500 USD0.07500 USDno commitment: N/A

1-month commitment: N/A

6-month commitment: N/A
-
AnthropicClaude 3 Sonnet0.00300 USD0.01500 USDno commitment: N/A

1-month commitment: N/A

6-month commitment: N/A
-
AnthropicClaude 3 Haiku0.00025 USD0.00125 USDno commitment: N/A

1-month commitment: N/A

6-month commitment: N/A
-
AnthropicClaude(v2.0, v2.1)0.00800 USD0.02400 USDno commitment: N/A

1-month commitment: 63.00 USD

6-month commitment: 35.00 USD
-
AnthropicClaude Instant(v1.2)0.00080 USD0.00240 USDno commitment: N/A

1-month commitment: 39.60 USD

6-month commitment: 22.00 USD
-
CohereCommand R+0.0030 USD0.0150 USD--
CohereCommand R0.0005 USD0.0015 USD--
CohereCommand0.0015 USD0.0020 USDno commitment: 49.50 USD

1-month commitment: 39.60 USD

6-month commitment: 23.77 USD
Train(per 1000 tokens): 0.004 USD

Store each custom model(per month): 1.95 USD
CohereCommand-Light0.0003 USD0.0006 USDno commitment: 8.56 USD

1-month commitment: 6.85 USD

6-month commitment: 4.11 USD
Train(per 1000 tokens): 0.001 USD

Store each custom model(per month): 1.95 USD
CohereEmbed – English0.0001 USDN/Ano commitment: 7.12 USD

1-month commitment: 6.76 USD

6-month commitment: 6.41 USD
-
CohereEmbed – Multilingual0.0001 USDN/Ano commitment: 7.12 USD

1-month commitment: 6.76 USD

6-month commitment: 6.41 USD
-
MetaLlama 3 Instruct 8B0.0003 USD0.0006 USD--
MetaLlama 3 Instruct 70B0.00265 USD0.0035 USD--
MetaLlama 2 Chat 13B0.00075 USD0.00100 USDno commitment: N/A

1-month commitment: 21.18 USD

6-month commitment: 13.08 USD
Train(per 1000 tokens): 0.00149 USD

Store each custom model(per month): 1.95 USD
MetaLlama 2 Chat 70B0.00195 USD0.00256 USDno commitment: N/A

1-month commitment: 21.18 USD

6-month commitment: 13.08 USD
Train(per 1000 tokens): 0.00799 USD

Store each custom model(per month): 1.95 USD
Mistral AIMistral 7B Instruct0.00015 USD0.0002 USD--
Mistral AIMixtral 8x7B Instruct0.00045 USD0.0007 USD--
Mistral AIMistral Small0.001 USD0.003 USD--
Mistral AIMistral Large0.004 USD0.012 USD--

多模态模型的价格

处理图像和其他媒体的多模态模型的定价基于图像数量、分辨率等多个标准,针对每个模型进行了总结。

Model ProviderModelStandard quality(<51 steps)
(per image)
Premium quality(>51 steps)
(per image)
Provisioned Throughput
(per hour per model)
Model customization through Fine-tuning
Stability AIStable Diffusion XL
(v0.8)
512x512 or smaller: 0.018 USD

Larger than 512x512: 0.036 USD
512x512 or smaller: 0.036 USD

Larger than 512x512: 0.072 USD
--
Stability AIStable Diffusion XL
(v1.0)
Up to 1024 x 1024: 0.04 USDUp to 1024 x 1024: 0.08 USDno commitment: N/A

1-month commitment: 49.86 USD

6-month commitment: 46.18 USD
-
Model ProviderModelStandard quality
(per image)
Premium quality
(per image)
Provisioned Throughput
(per hour per model)
Model customization through Fine-tuning
AmazonTitan Image Generator512x512: 0.008 USD

1024X1024: 0.01 USD
512x512: 0.01 USD

1024X1024: 0.012 USD
no commitment: N/A

1-month commitment: 16.20 USD

6-month commitment: 13.00 USD
Train(per image seen): 0.005 USD

Store each custom model(per month): 1.95 USD
AmazonTitan Image Generator(custom models)512x512: 0.018 USD

1024X1024: 0.02 USD
512x512: 0.02 USD

1024X1024: 0.022 USD
no commitment: 23.40 USD

1-month commitment: 21.00 USD

6-month commitment: 16.85 USD
-
Model ProviderModelOn-Demand
(per 1000 input tokens)
On-Demand
(per 1000 input image)
Provisioned Throughput
(per hour per model)
Model customization through Fine-tuning
AmazonTitan Multimodal Embeddings0.0008 USD0.00006 USDno commitment: 9.38 USD

1-month commitment: 8.45 USD

6-month commitment: 6.75 USD
Train(per image seen): 0.0002 USD

Store each custom model(per month): 1.95 USD

Amazon Bedrock的基本使用方法

Amazon Bedrock的入门和准备

要开始使用Amazon Bedrock,请在AWS Management Console中导航到Amazon Bedrock的Model access页面,点击Edit,选择要使用的模型,然后点击Save changes请求访问该模型。
Amazon Bedrock > Model access - AWS Management Console
※使用Anthropic的模型时,需填写公司信息和使用目的等内容并提交请求。

请求被批准后,模型的访问权限将被激活,并可开始使用。

Amazon Bedrock Runtime API的InvokeModel和InvokeModelWithResponseStream方法及其参数

介绍实际使用Amazon Bedrock的API。
与Amazon Bedrock相关的API主要分为Bedrock API和Bedrock Runtime API。

Bedrock API用于通过微调创建自定义模型以及购买模型的预置吞吐量等操作AWS资源。

另一方面,Bedrock Runtime API用于指定基础模型或自定义模型,发送输入数据(Prompt)的请求,并从响应中获取输出数据(Completions),用于实际的执行。

在Amazon Bedrock Runtime API中,有InvokeModel和InvokeModelWithResponseStream用于实际调用和使用模型。

Amazon Bedrock Runtime API的InvokeModel是一种API,可以一次性获取请求的响应内容。

而Amazon Bedrock Runtime API的InvokeModelWithResponseStream是一种API,可以逐步地以流的形式获取响应内容的一部分字符。如果您已经使用过类似于聊天形式的生成式AI服务,可能见过Prompt的结果逐字显示的界面,InvokeModelWithResponseStream就可以用于这种显示方式。

Amazon Bedrock Runtime API的InvokeModel和InvokeModelWithResponseStream的请求中指定的参数是通用的,具体如下。

accept: 响应推理内容的MIME类型。(默认值: application/json)
contentType: 请求输入数据的MIME类型。(默认值: application/json)
modelId: [必填] 模型的标识符。(例如: ai21.j2-ultra-v1)
body: [必填] 以contentType指定的格式提供的输入数据。根据每个模型支持的推理参数指定body字段的格式。

一般推理参数的含义

接下来将介绍Amazon Bedrock Runtime API的实际使用例子,但在此之前,我们先简单说明一下在模型请求的Body中经常使用的一般推理参数。不过,为了便于理解,这里提供的定义可能与严格的定义有所不同。

temperature
这是一个用于调整模型输出概率分布的随机性和多样性的参数。值越大,生成的回答倾向于更随机和多样化;值越小,生成的回答倾向于更高概率的预估答案。temperature的通常范围是0到1之间,但有些模型可以设置超过1的值。例如,temperature=1.0时会生成更随机和多样化的回答,而temperature=0.1时则更可能生成高概率的预估答案。

topK
这是一个通过限制模型考虑的前K个令牌来调整随机性和多样性的参数。topK的最佳范围因使用的模型而异。设置此值后,输出令牌将从这些前K个令牌中选择。例如,topK=10表示模型在生成回答时只考虑概率最高的前10个令牌。简而言之,topK通过限制可选令牌的数量来调整多样性。

topP
这是一个通过从累积概率未超过指定P的令牌集合中采样来调整随机性和多样性的参数。通常的topP范围是0到1之间。例如,topP=0.9表示模型在生成回答时只考虑从概率最高的令牌到累积概率未超过0.9的令牌。简而言之,topP通过限制可选令牌的累积概率来调整多样性。

maxTokens
这是一个限制生成的令牌最大数量的参数,用于控制生成文本的长度。例如,maxTokens=800表示模型生成的文本不会超过800个令牌。

在API请求中,可以组合使用temperature、topK、topP参数来平衡信心度和多样性,并使用maxTokens限制输出的令牌数量。

关于Amazon Bedrock中各个模型的详细推理参数,请参考《Inference parameters for foundation models - Amazon Bedrock》。

使用AWS SDK for Python (Boto3) 调用Amazon Bedrock Runtime的invoke_model示例

这里介绍了使用AWS SDK for Python (Boto3)在AWS Lambda函数中调用Amazon Bedrock Runtime的invoke_model的示例。
在撰写本文时,AWS Lambda函数的默认AWS SDK for Python (Boto3)尚不支持调用bedrock和bedrock-runtime的Client。
因此,以下是添加了最新的AWS SDK for Python (Boto3)到Lambda Layer中,并使用bedrock-runtime的Client的示例。

  • 示例代码(AWS Lambda函数)
import boto3
import json
import os
region = os.environ.get('AWS_REGION')
bedrock_runtime_client = boto3.client('bedrock-runtime', region_name=region)
def lambda_handler(event, context):modelId = 'ai21.j2-ultra-v1'contentType = 'application/json'accept = 'application/json'body = json.dumps({"prompt": "Please tell us all the states in the U.S.","maxTokens": 800,"temperature": 0.7,"topP": 0.95})response = bedrock_runtime_client.invoke_model(modelId=modelId,contentType=contentType,accept=accept, body=body)response_body = json.loads(response.get('body').read())return response_body
  • 执行结果示例(上述AWS Lambda函数的返回值)
{"id": 1234,"prompt": {"text": "Please tell us all the states in the U.S.","tokens": [〜省略〜]},"completions": [{"data": {"text": "\nUnited States of America is a federal republic consisting of 50 states, a federal district (Washington, D.C., the capital city of the United States), five major territories, and various minor islands. The 50 states are Alabama, Alaska, Arizona, Arkansas, California, Colorado, Connecticut, Delaware, Florida, Georgia, Hawaii, Idaho, Illinois, Indiana, Iowa, Kansas, Kentucky, Louisiana, Maine, Maryland, Massachusetts, Michigan, Minnesota, Mississippi, Missouri, Montana, Nebraska, Nevada, New Hampshire, New Jersey, New Mexico, New York, North Carolina, North Dakota, Ohio, Oklahoma, Oregon, Pennsylvania, Rhode Island, South Carolina, South Dakota, Tennessee, Texas, Utah, Vermont, Virginia, Washington, West Virginia, Wisconsin, and Wyoming.","tokens": [〜省略〜]},"finishReason": {"reason": "endoftext"}}]
}

※本文撰写时,最新的AWS SDK for Python (Boto3) 提供了Amazon Bedrock Runtime的invoke_model_with_response_stream命令。不过,由于计划在另一篇文章中详细说明,因此这篇文章中将不详细讨论。

使用AWS CLI调用Amazon Bedrock Runtime的invoke-model示例

这里介绍了使用AWS CLI调用Amazon Bedrock Runtime的invoke-model示例。
在撰写本文时,Amazon Bedrock Runtime API尚未支持AWS CLI的版本2。
因此,以下示例是使用支持Amazon Bedrock Runtime API的AWS CLI版本1单独安装并执行的。

  • 格式
aws bedrock-runtime invoke-model \--region [Region] \--model-id "[modelId]" \--content-type "[contentType]" \--accept "[accept]" \--body "[body]" [Output FileName]
  • 执行示例
aws bedrock-runtime invoke-model \--region us-east-1 \--model-id "ai21.j2-ultra-v1" \--content-type "application/json" \--accept "application/json" \--body "{\"prompt\": \"Please tell us all the states in the U.S.\", \"maxTokens\": 800,\"temperature\": 0.7,\"topP\": 0.95}" invoke-model-output.txt
  • 响应示例
* 屏幕显示  
{"contentType": "application/json"}
* 文件内容(invoke-model-output.txt)  
{"id": 1234,"prompt": {"text": "Please tell us all the states in the U.S.","tokens": [〜省略〜]},"completions": [{"data": {"text": "\nUnited States of America is a federal republic consisting of 50 states, a federal district (Washington, D.C., the capital city of the United States), five major territories, and various minor islands. The 50 states are Alabama, Alaska, Arizona, Arkansas, California, Colorado, Connecticut, Delaware, Florida, Georgia, Hawaii, Idaho, Illinois, Indiana, Iowa, Kansas, Kentucky, Louisiana, Maine, Maryland, Massachusetts, Michigan, Minnesota, Mississippi, Missouri, Montana, Nebraska, Nevada, New Hampshire, New Jersey, New Mexico, New York, North Carolina, North Dakota, Ohio, Oklahoma, Oregon, Pennsylvania, Rhode Island, South Carolina, South Dakota, Tennessee, Texas, Utah, Vermont, Virginia, Washington, West Virginia, Wisconsin, and Wyoming.","tokens": [〜省略〜]},"finishReason": {"reason": "endoftext"}}]}

※撰写本文时,AWS CLI中尚未提供用于Amazon Bedrock Runtime的invoke-model-with-response-stream命令。

参考:
Amazon Bedrock is now generally available
Amazon Bedrock Is Now Generally Available – Build and Scale Generative AI Applications with Foundation Models
Amazon Bedrock Pricing
GitHub - aws-samples/amazon-bedrock-workshop: This is a workshop designed for Amazon Bedrock a foundational model service.
What is Amazon Bedrock? - Amazon Bedrock
Bedrock API Reference - Amazon Bedrock
Bedrock - Boto3 documentation
BedrockRuntime - Boto3 documentation
bedrock — AWS CLI Command Reference
bedrock-runtime — AWS CLI Command Reference
Amazon Bedrock Model Providers - AWS Management Console
 

总结

本次介绍了Amazon Bedrock的参考资料、模型列表、价格、使用方法、令牌和参数的术语解释,以及Runtime API的执行示例。通过整理这些信息,我们了解到Amazon Bedrock提供了多种模型,用户可以根据具体的使用场景进行选择,并且可以通过高度兼容的AWS SDK和AWS CLI接口调用。此外,Amazon Bedrock还与其他AWS服务具有很高的兼容性。今后,我们将继续关注Amazon Bedrock的更新、实现方法以及与其他服务的组合使用等方面。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/48766.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

关卡1-3:Git

关卡1-3&#xff1a;Git Git基础fork并拉取本次课程的源创建一个gitee自己的仓库 这个是internLM的3期训练营的通关笔记。 任务&#xff1a; 熟悉git熟悉使用git托管平台&#xff0c;常见有github、giteefork官方的训练营的教程项目&#xff0c;提交文件到自己的项目&#xf…

项目部署到服务器

(相关资源都给出来了) 1 下载MobaXterm,然后打开 正常连接输入你的服务器IP&#xff0c;用户名可以起名为root 2 将JDK,Tomcat,mysql安装包 布置到服务器中&#xff08;JDK官网地址&#xff1a;https://www.oracle.com/java/technologies/downloads/#java8 mysql官网地址: …

openGauss触发器详解

openGauss 是一款开源关系型数据库管理系统&#xff0c;广泛应用于企业级应用中。随着数据量的增长和业务逻辑的复杂化&#xff0c;数据库管理和操作的自动化需求越来越高。触发器&#xff08;Triggers&#xff09;作为数据库中重要的编程工具&#xff0c;能够极大地简化复杂操…

【python】OpenCV—Point Polygon Test

文章目录 1、完整代码2、涉及到的库cv2.pointPolygonTestcv2.minMaxLoc 1、完整代码 from __future__ import print_function from __future__ import division import cv2 as cv import numpy as np # Create an image r 100 src np.zeros((4*r, 4*r), dtypenp.uint8) # 创…

3 Go语言的变量声明

本专栏将从基础开始&#xff0c;循序渐进&#xff0c;由浅入深讲解Go语言&#xff0c;希望大家都能够从中有所收获&#xff0c;也请大家多多支持。 查看相关资料与知识库 专栏地址:Go专栏 如果文章知识点有错误的地方&#xff0c;请指正&#xff01;大家一起学习&#xff0c;…

前端学习3——自学习梳理

1.学习一下盒子模型(盒子就是元素&#xff0c;标签) 盒子模型又分为4种&#xff1a;块级&#xff0c;内联级&#xff0c;内联块级&#xff0c;弹性盒子 (弹性盒子续在下一节) 2.元素的结构 1.盒子模型 <!DOCTYPE html> <html lang"en"> <head>&l…

【嵌入式开发 Linux 常用命令系列 7.7 -- find 和 sed 配合使用介绍】

请阅读【嵌入式及芯片开发学必备专栏】 文章目录 使用背景注意事项使用示例 使用背景 当时想在 linux 环境下 使用 find 命令找到 .c 和 .h 文件&#xff0c;并使用xargs 加 sed 命令将文件中所有"demo" 字符串替换为 “hello” 命令实现&#xff1a; 使用 find 命…

【C++杂货铺】智能指针

目录 &#x1f308; 前言&#x1f308; &#x1f4c1; 内存泄漏 &#x1f4c2; 概念 &#x1f4c2; 分类 &#x1f4c2; 如何避免 &#x1f4c1; RAII &#x1f4c1; C11智能指针 &#x1f4c2; auto_ptr &#x1f4c2; unique_ptr &#x1f4c2; shared_ptr &#x1…

电子电器架构 --- 智能汽车的大脑(域控制器)

我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 屏蔽力是信息过载时代一个人的特殊竞争力,任何消耗你的人和事,多看一眼都是你的不对。非必要不费力证明自己,无利益不试图说服别人,是精神上的节…

QT--进程

一、进程QProcess QProcess 用于启动和控制外部进程&#xff0c;管理其输入输出流。 使用方法 start()&#xff1a;启动一个新进程。setStandardInputFile()&#xff1a;将文件作为标准输入。将进程的标准输入&#xff08;stdin&#xff09;重定向到指定的文件。换句话说&am…

AV1技术学习:Constrained Directional Enhancement Filter

CDEF允许编解码器沿某些(可能是倾斜的)方向应用非线性消阶滤波器。它以88为单位进行。如下图所示&#xff0c;通过旋转和反射所示的三个模板来定义八个预设方向。 Templates of preset directions and their associated directions. The templates correspond to directions of…

筑牢数字防线:从微软蓝屏事件看网络安全与系统韧性建设

引言 近期&#xff0c;由微软视窗系统软件更新引发的全球性“微软蓝屏”事件&#xff0c;不仅给全球用户带来了前所未有的挑战&#xff0c;也深刻暴露了当前IT基础设施在面对潜在威胁时的脆弱性。此次事件&#xff0c;如同一面镜子&#xff0c;映照出我们在网络安全与系统稳定…

MATLAB: ode45 求解常微分方程

引入 ode45 是 MATLAB 中用于求解非刚性常微分方程&#xff08;ODE&#xff09;的数值方法。它基于 Runge-Kutta 方法&#xff0c;并具有自适应步长调整机制&#xff0c;能够在一定误差控制范围内高效地计算 ODE 的数值解。 下面我们通过这个包含详细注释的代码&#xff0c;一…

Windows 11 系统对磁盘进行分区保姆级教程

Windows 11磁盘分区 磁盘分区是将硬盘驱动器划分为多个逻辑部分的过程&#xff0c;每个逻辑部分都可以独立使用和管理。在Windows 11操作系统中进行磁盘分区主要有以下几个作用和意义&#xff1a; 组织和管理数据&#xff1a;分区可以帮助用户更好地组织他们的数据&#xff0c…

无人机之降落操作及紧急情况处理

一、无人机降落操作 1、选择降落地点 a.提前选择一个平坦且没有障碍物的降落点&#xff1b; b.确认降落点周围没有行人或障碍物&#xff0c;保证降落的安全性。 2、降低飞行高度 a.缓慢降低飞行高度&#xff0c;尽量保持匀速下降&#xff0c;防止因下降过快导致无人机受损…

学习vue第一天

文章目录 1.什么是 Vue?2.渐进式框架3.如何新建一个vue项目 1.什么是 Vue? Vue (发音为 /vjuː/&#xff0c;类似 view) 是一款用于构建用户界面的 JavaScript 框架。它基于标准 HTML、CSS 和 JavaScript 构建&#xff0c;并提供了一套声明式的、组件化的编程模型&#xff0…

Day20 | 39. 组合总和 40.组合总和II 131.分割回文串

语言 Java 39. 组合总和 组合总和 题目 给你一个 无重复元素 的整数数组 candidates 和一个目标整数 target &#xff0c;找出 candidates 中可以使数字和为目标数 target 的 所有 不同组合 &#xff0c;并以列表形式返回。你可以按 任意顺序 返回这些组合。 candidate…

最新可用度盘不限速后台系统源码_去授权开心版

某宝同款度盘不限速后台系统源码&#xff0c;验证已被我去除&#xff0c;两个后端系统&#xff0c;账号和卡密系统 第一步安装宝塔&#xff0c;部署卡密系统&#xff0c;需要环境php7.4 把源码丢进去&#xff0c;设置php7.4&#xff0c;和伪静态为thinkphp直接访问安装就行 …

探索WebKit的CSS表格布局:打造灵活的网页数据展示

探索WebKit的CSS表格布局&#xff1a;打造灵活的网页数据展示 CSS表格布局是一种在网页上展示数据的强大方式&#xff0c;它允许开发者使用CSS来创建类似于传统HTML表格的布局。WebKit作为许多流行浏览器的渲染引擎&#xff0c;提供了对CSS表格布局的全面支持。本文将深入探讨…

qt 如何制作动态库插件

首先 首先第一点要确定我们的接口是固定的&#xff0c;也就是要确定 #ifndef RTSPPLUGIN_H #define RTSPPLUGIN_H #include "rtspplugin_global.h" typedef void (*func_callback)(uint8_t* data,int len,uint32_t ssrc,uint32_t ts,const char* ipfrom,uint16_t f…