亚马逊 Bedrock 平台也能使用Llama 3.2 模型了

亚马逊 Bedrock 平台推出 Llama 3.2 模型:多模态视觉和轻量级模型

概述

由 Meta 提供的最新 Llama 3.2 模型现已在 Amazon Bedrock 平台上推出。这一新模型系列标志着 Meta 在大型语言模型(LLM)领域的最新进展,它在多种应用场景中提供了更强大的功能和更广泛的适用性。这些新模型注重负责任的创新和系统级安全,展现出在多个行业标准测试中的领先性能,并引入了一系列新功能,以助力构建新一代人工智能体验。

Llama 3.2 模型系列

Llama 3.2 系列模型涵盖了不同规模,从 1B 和 3B 参数的轻量级纯文本模型,适合边缘设备使用,到 11B 和 90B 参数的中小型模型,能够执行包括高分辨率图像多模态处理在内的复杂推理任务。Llama 3.2 的 11B 和 90B 模型是首批支持视觉任务的版本,它们通过新模型架构将图像编码器的表示集成到语言模型之中。这些模型旨在更有效地处理人工智能工作负载,降低延迟,并增强性能,使其适用于各种应用程序。

主要特点

  • 多模态视觉识别:新模型能够理解图像和文本,提供更丰富的交互体验。
  • 轻量级模型:适合在资源受限的设备上运行,如移动设备和物联网设备。
  • 强大的语言处理能力:支持长文本生成、多语言翻译、编程、数学问题解决以及高级推理任务。
  • 支持多种语言:增强了对八种语言的支持,包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语。

使用 Llama 3.2 模型

要开始使用 Llama 3.2 模型,您需要导航到 Amazon Bedrock 控制台,然后在导航窗格中选择“模型访问”。在那里,您可以请求访问新的 Llama 3.2 模型:Llama 3.2 1B、3B、11B Vision 和 90B Vision。

视觉功能测试

为了测试新的视觉功能,您可以从我们的示例网站下载一张 PNG 格式的图表,其内容涉及可再生能源发电份额。该图表的分辨率非常高,您可以将其大小调整为 1024 像素宽。

在 Amazon Bedrock 控制台中,选择“Playgrounds”下的“聊天”,选择“Meta”作为类别,然后选择“Llama 3.2 90B Vision”模型。

使用“选择文件”来选择已调整大小的图表图像,并使用此提示:
在这里插入图片描述

根据这张图表,欧洲哪些国家的份额最高?

选择“运行”,模型就会分析图像并返回结果。

编程方式访问模型

您还可以通过 AWS 命令行界面 (AWS CLI) 和 AWS SDK 以编程方式访问模型。与使用 Llama 3.1 模型相比,您只需要按照文档中的说明更新模型 ID。您还可以为美国和欧盟使用新的跨区域推理端点。

Llama 3.2 模型架构

Llama 3.2 在前辈产品成功的基础上,引入了先进的架构设计,致力于提供最优的性能和广泛的适用性:

  • 自回归语言模型:Llama 3.2 的核心采用了优化的转换器架构,它能够基于之前的上下文预测接下来的内容,从而生成文本。
  • 微调技术:Llama 3.2 的指令调整版本采用了两种关键技术:监督式微调 (SFT) 和基于人工反馈的强化学习 (RLHF)。
  • 多模态功能:对于 11B 和 90B Vision 模型,Llama 3.2 引入了一种新的图像理解方法。

注意事项

Meta 的 Llama 3.2 模型现已在以下 AWS 区域的 Amazon Bedrock 中全面推出:

  • Llama 3.2 1B 和 3B 模型可在美国西部(俄勒冈)和欧洲(法兰克福)使用,并通过跨区域推理在美国东部(俄亥俄州、弗吉尼亚北部)和欧洲(爱尔兰、巴黎)使用。
  • Llama 3.2 11B Vision 和 90B Vision 模型可在美国西部(俄勒冈)使用,并通过跨区域推理在美国东部(俄亥俄州、弗吉尼亚北部)使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/55199.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java Web 之 Session 详解

在 JavaWeb 开发中,Session 就像网站的专属记忆管家,为每个用户保管着重要的信息和状态,确保用户在网站的旅程顺畅无阻。 场景一: 想象你去一家大型超市购物,推着购物车挑选商品。这个购物车就如同 Session&#xff…

本地访问autodl的jupyter notebook

建立环境并安装jupyter conda create --name medkg python3.10 source activate medkg pip install jupyter 安装完成后,输入jupyter notebook --generate-config 输入ipython,进入python In [2]: from jupyter_server.auth import passwd In [3]: passwd(algori…

Spring Data(学习笔记)

JPQL语句???(Query括号中的就是JPQL语句) 怎么又会涉及到连表查询呢? 用注解来实现表间关系。 分页是什么?为什么什么都有分页呢 ? 继承,与重写方法的问题 Deque是什么 ?…

在Ubuntu 14.04上安装带SSL的Webmin的方法

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 简介 Webmin 是一个基于 Web 的类 Unix 系统管理工具。它提供了一个简单的替代方案来进行命令行系统管理,并可以通过提供的…

【JavaSE】反射、枚举、lambda表达式

目录 反射反射相关类获取类中属性相关方法常用获得类相关的方法示例常用获得类中属性相关的方法示例获得类中注解相关的方法 反射优缺点 枚举常用方法优缺点 枚举与反射lambda表达式语法函数式接口简化规则使用示例变量捕获集合中的应用优缺点 反射 Java的反射(refl…

通信协议感悟

本文结合个人所学,简要讲述SPI,I2C,UART通信的特点,限制。 1.同步通信 UART,SPI,I2C三种串行通讯方式,SPI功能引脚为CS,CLK,MOSI,MISO;I2C功能引…

若依从redis中获取用户列表

因为若依放入用户的时候&#xff0c;会在减值中添加随机串&#xff0c;所以用户的key会在redis中变成&#xff1a; login_tokens:6af07052-b76d-44dd-a296-1335af03b2a6 这样的样子。 如果用 Set<Object> items redisService.redisTemplate.keys("login_tokens&…

dcatadmin 自定义登录页面

一、问题&#xff1a; 在后台管理系统中&#xff0c;不同的项目想要不同的登录页面&#xff0c;但是框架自带的登录页面就只有一个。 解决&#xff1a; 由芒果系统改造的dcatadmin登录插件&#xff0c;实现一键安装改变登录页面。 项目介绍 基于Laravel和Vue的快速开发的后台管…

YOLO11改进 | 检测头 | 小目标遮挡物性能提升的检测头Detect_MultiSEAM【完整代码】

秋招面试专栏推荐 &#xff1a;深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 &#x1f4a1;&#x1f4a1;&#x1f4a1;本专栏所有程序均经过测试&#xff0c;可成功执行&#x1f4a1;&#x1f4a1;&#x1f4a1; 基于深度学习的人脸检测算法取得了巨大进…

方法与方法重载

方法参数传递 方法语法&#xff1a; 访问修饰符 返回值类型 方法名&#xff08;形参列表&#xff09;{方法体[return 返回值] } 对象名.方法名&#xff08;实参列表&#xff09;注意&#xff1a;形参和实参一一对应&#xff08;个数和类型&#xff09; package com.hz.test12…

javax.net.ssl.SSLHandshakeException: Chain validation failed

异常描述&#xff1a; D/OkHttp: <-- HTTP FAILED: javax.net.ssl.SSLHandshakeException: Chain validation failed com.bfmd.okhttpsample I/Main: error: Chain validation failed异常解决&#xff1a; 解决方法一&#xff1a; 解决方法很简单&#xff0c;检查一下设备…

PID控制原理:看下这三个故事,你就明白了

一、PID的故事 小明接到这样一个任务&#xff1a;有一个水缸点漏水(而且漏水的速度还不一定固定不变)&#xff0c;要求水面高度维持在某个位置&#xff0c;一旦发现水面高度低于要求位置&#xff0c;就要往水缸里加水。 小明接到任务后就一直守在水缸旁边&#xff0c;时间长就觉…

SEO友好的wordpress模板 应该具体哪些特征

在数字营销的时代&#xff0c;搜索引擎优化(SEO)对于任何网站来说都是至关重要的。WordPress作为全球最受欢迎的内容管理系统之一&#xff0c;提供了大量的模板(也称为主题)供用户选择。一个SEO友好的WordPress模板不仅可以帮助您的网站在搜索引擎中获得更好的排名&#xff0c;…

遇到慢SQL、SQL报错,应如何快速定位问题 | OceanBase优化实践

在数据库的使用中&#xff0c;大家时常会遇到慢SQL&#xff0c;或执行出错的SQL。对于某些SQL问题&#xff0c;其错误原因显而易见&#xff0c;但也有不少情况难以直观判断。面对这类问题&#xff0c;我们应当如何应对&#xff1f;如何准确识别SQL错误的根源&#xff1f;是否需…

嵌入向量生成与查询

嵌入向量生成与查询 文本嵌入模型 M3E 是 Moka Massive Mixed Embedding 的缩写 Moka&#xff0c;此模型由 MokaAI 训练&#xff0c;开源和评测&#xff0c;训练脚本使用 uniem&#xff0c;评测 BenchMark 使用 MTEB-zh Massive&#xff0c;此模型通过千万级 (2200w) 的中文句…

用于高频交易预测的最优输出LSTM

用于高频交易预测的最优输出LSTM J.P.Morgan的python教程 Content 本文提出了一种改进的长短期记忆&#xff08;LSTM&#xff09;单元&#xff0c;称为最优输出LSTM&#xff08;OPTM-LSTM&#xff09;&#xff0c;用于实时选择最佳门或状态作为最终输出。这种单元采用浅层拓…

MongoDB mongoose 的 save、insert 和 create 方法的比较

目录 save 方法 insert 方法 create 方法 使用会话和事务 总结 在本文中&#xff0c;我们将介绍 MongoDB 中使用 mongoose 操作 数据库时的三种常见方法&#xff1a;save、insert 和 create。这些方法可以用于将数据存储到 MongoDB 数据库中&#xff0c;并且在一定程度上具…

Study-Oracle-10-ORALCE19C-RAC集群搭建(一)

一、硬件信息及配套软件 1、硬件设置 RAC集群虚拟机:CPU:2C、内存:10G、操作系统:50G Openfile数据存储:200G (10G*2) 2、网络设置 主机名公有地址私有地址VIP共享存储(SAN)rac1192.168.49.13110.10.10.20192.168.49.141192.168.49.130rac2192.168.49.13210.10.10.3…

Python、PyTorch与cuda的版本对应表

常见的Python和PyTorch版本对应关系。 PyTorch版本对应的PythonPyTorch1.0Python 2.7&#xff0c;3.5&#xff0c;3.6&#xff0c;3.7PyTorch1.1Python 2.7&#xff0c;3.5&#xff0c;3.6&#xff0c;3.7PyTorch1.2Python 2.7&#xff0c;3.5&#xff0c;3.6&#xff0c;3.7P…

基于深度学习的不遗忘训练

基于深度学习的不遗忘训练&#xff08;也称为抗遗忘训练或持久性学习&#xff09;是针对模型在学习新任务时可能会忘记已学习内容的一种解决方案。该方法旨在使深度学习模型在不断接收新信息的同时&#xff0c;保持对旧知识的记忆。以下是这一领域的主要内容和方法&#xff1a;…