[AI 大模型] 阿里巴巴 通义千问

文章目录

    • [AI 大模型] 阿里巴巴 通义千问
      • 简介
      • 模型架构
      • 发展
      • 新技术和优势
      • 示例


[AI 大模型] 阿里巴巴 通义千问

在这里插入图片描述

简介

阿里巴巴的 通义千问 是由阿里云开发的一款大型语言模型,旨在为用户提供高效、智能的自然语言处理服务。

通义千问能够处理多种语言输入,支持文本生成、对话模拟、编程辅助等多种应用场景。

模型架构

通义千问的模型架构基于增强的 Transformer 结构,采用了旋转位置嵌入(RoPE)和无偏置的 RMSNorm 技术。

此外,通义千问还使用了**闪光注意力(Flash Attention)**来加速训练过程,并采用了 SwiGLU 激活函数以提高模型的性能。

这些技术使得通义千问在处理长文本和复杂任务时表现出色,尤其在技术专利、市场表现和全平台访问等方面表现出色。

在这里插入图片描述

发展

通义千问 的发展历程可以追溯到阿里达摩院的 M6 项目。

2020 年 6 月,阿里达摩院发布了 3 亿参数的基础模型。到 2021 年 10 月,M6 模型已经发展成为全球首个 10 万亿参数的多模态大模型,并应用于天猫虚拟主播等多个场景。

2023 年 4 月,阿里云正式推出通义千问,并在 2023 阿里云峰会上揭晓。

新技术和优势

  1. 多模态能力:通义千问能够处理文本、图像、音频等多种数据类型,提供高质量的多模态输出。
  2. 高效架构:采用增强的 Transformer 和闪光注意力技术,使得通义千问在训练和推理过程中更加高效。
  3. 长上下文理解:通义千问支持长达 30,000 个 token 的上下文窗口,显著提升了模型在长文本处理中的表现。
  4. 灵活性:通义千问提供了多种尺寸和配置,能够在从数据中心到边缘设备的各种环境中高效运行。
  5. 广泛应用:通义千问已经被多个行业的企业采用,用于构建自定义生成式 AI 模型,提升了企业的创新能力和竞争优势。

在这里插入图片描述

示例

以下是如何使用通义千问 API 进行开发的示例:

示例 1:文本生成

import dashscope# 初始化通义千问客户端
client = dashscope.Client(api_key='YOUR_API_KEY')# 创建文本生成请求
response = client.generate_text(model="qwen-turbo",prompt="写一篇关于人工智能未来发展的文章。",max_tokens=150
)# 输出生成的文本
print(response['text'])

示例 2:对话生成

import dashscope# 初始化通义千问客户端
client = dashscope.Client(api_key='YOUR_API_KEY')# 创建对话生成请求
messages = [{"role": "system", "content": "你是一个乐于助人的助手。"},{"role": "user", "content": "你好!"}
]
response = client.generate_conversation(model="qwen-turbo",messages=messages
)# 输出生成的对话
print(response['choices'][0]['message']['content'])

示例 3:情感分析

import dashscope# 初始化通义千问客户端
client = dashscope.Client(api_key='YOUR_API_KEY')# 创建情感分析请求
response = client.analyze_sentiment(model="qwen-turbo",text="我今天感觉非常开心!"
)# 输出情感分析结果
print(response['sentiment'])

阿里巴巴通义千问的推出标志着 AI 技术的又一次飞跃,为开发者和企业提供了强大的工具,推动了 AI 应用的广泛普及和创新。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/43526.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

免杀笔记 ---> Session0--DLL注入

刚更新完上一篇,于是我们就马不停蹄的去跟新下一篇!! Session0注入 :: 各位看官如果觉得还不错的可以给博主点个赞💕💕 这次,我把这个脚本直接传到Github上了 喜欢的师傅点个Star噢…

【C++报错已解决】Dangling Pointer

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 引言一、问题描述1.1 报错示例1.2 报错分析1.3 解决思路 二、解决方法2.1 方法一:使用智能指针2.2 方法二…

本地部署,GFPGAN: 实用的面部修复算法

目录 什么是 GFPGAN? 技术原理 主要功能 应用场景 本地安装 运行结果 结语 Tip: 在图像处理和计算机视觉领域,面部修复是一个重要且具有挑战性的研究方向。随着深度学习技术的不断进步,许多新的算法被提出,用于…

Python8:线程和进程

1.并发和并行 并发:在逻辑上具备同时处理多个任务的能力(其实每时刻只有一个任务) 并行:物理上在同一时刻执行多个并发任务 2.线程与进程 一个进程管多个线程,一个进程至少有一个线程 python多线程是假的&#xf…

【漏洞复现】docassemble——interview——任意文件读取

声明:本文档或演示材料仅供教育和教学目的使用,任何个人或组织使用本文档中的信息进行非法活动,均与本文档的作者或发布者无关。 文章目录 漏洞描述漏洞复现测试工具 漏洞描述 docassemble 是一款强大的开源工具,它让自动化生成和…

linux_进程概念——理解冯诺依曼体系结构

前言: 本篇内容是为了让友友们较好地理解进程的概念, 而在真正了解进行概念之前, 要先了解一下冯诺依曼体系结构。 所以博主会先对冯诺伊曼体系结构进行解释, 然后再讲解进程的概念。 ps: 本篇内容适合了解一些linux指…

openfoam生成的非均匀固体Solid数据分析、VTK数据格式分析、以及paraview官方用户指导文档和使用方法

一、openfoam生成的非均匀固体Solid数据分析 对于Solid/dealii-output文件,固体的数据文件, # vtk DataFile Version 3.0 #This file was generated by the deal.II library on 2024/7/10 at 9:46:15 ASCII DATASET UNSTRUCTURED_GRIDPOINTS 108000 do…

go1.21版本后,文件加载顺序

总结 显式引入: 同一个文件显式引入一个包,按照页面代码执行的函数的先后,来执行该函数的文件,不按照包内的文件首字母顺序 隐式引入: 同一个文件内隐式引入一个包,包内的多个文件会按照文件首字母顺序执行…

Qt(五)网络编程

文章目录 一、QTcpServer类(一)使用(二)示例1. 服务端2. 客户端: 二、 一、QTcpServer类 QTcpServer类用于监听客户端的连接,每当有一个客户端连接到服务端,都会生成一个新的QTcpSocket对象与客…

【每日一练】python面对对象的基本概念和用法(附实例)

面向对象编程(OOP)是一种程序设计方法,其基本概念包括对象、类、继承和封装。 对象:对象是系统中的基本单位,用于描述客观事物。每个对象包含一组属性和对这些属性进行操作的方法。对象是类的一个实例,具有…

Camera Raw:直方图

Camera Raw 的直方图 Histogram面板不仅提供了照片亮度和色彩分布信息,还具备多项实用功能,辅助评估和调整照片。 ◆ ◆ ◆ 直方图的构成 直方图是一个二维坐标系统,横坐标表示不同程度的像素亮度,从左到右通常对应的是 0 ~ 255…

Github 2024-07-11 Go开源项目日报 Top10

根据Github Trendings的统计,今日(2024-07-11统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Go项目10Solidity项目1Python项目1frp: 一个开源的快速反向代理 创建周期:2946 天开发语言:Go协议类型:Apache License 2.0Star数量:75872 …

SSRF漏洞深入利用与防御方案绕过技巧

文章目录 前言SSRF基础利用1.1 http://内网资源访问1.2 file:///读取内网文件1.3 dict://探测内网端口 SSRF进阶利用2.1 Gopher协议Post请求2.2 Gopher协议文件上传2.3 GopherRedis->RCE2.4 JavaWeb中的适用性? SSRF防御绕过3.1 Url黑名单检测的绕过3.2 Url白名单…

对controller层进行深入学习

目录 1. controller层是干什么的?1.1 controller原理图1.2 controller层为什么要存在?1.2.1 分离关注点1.2.2 响应HTTP请求1.2.3 数据处理与转换1.2.4 错误处理与状态管理1.2.5 流程控制1.2.6 依赖注入与测试 1.3 controller层的优点1.3.1 多端支持1.3.2…

C++ | Leetcode C++题解之第225题用队列实现栈

题目&#xff1a; 题解&#xff1a; class MyStack { public:queue<int> q;/** Initialize your data structure here. */MyStack() {}/** Push element x onto stack. */void push(int x) {int n q.size();q.push(x);for (int i 0; i < n; i) {q.push(q.front());…

C++ 【 Open3D 】 点云按高程进行赋色

一、 Open3D中根据点云的高程度信息为点云中的每个点附上颜色&#xff0c;并保存颜色渲染结果&#xff01; #include<iostream> #include<open3d/Open3D.h>using namespace std;int main() {//-------------------------------读取点云--------------------------…

nasa数据集——1 度网格单元的全球月度土壤湿度统计数据

AMSR-E/Aqua level 3 global monthly Surface Soil Moisture Averages V005 (AMSRE_AVRMO) at GES DISC GES DISC 的 AMSR-E/Aqua 第 3 级全球地表土壤水分月平均值 V005 (AMSRE_AVRMO) AMSR-E/Aqua level 3 global monthly Surface Soil Moisture Standard Deviation V005 (…

vue中el-table单元格复制功能

一、单页面中使用 1.在el-table上绑定单击事件 cell-click“copyText” 或双击事件 cell-dblclick“copyText” 注&#xff1a;cell-dblclick函数有四个参数&#xff0c;分别是row, column, cell, event&#xff1b; row&#xff1a;可看到被其操作单元格所在行的所有的数据&…

【IT领域新生必看】解锁 `final` 关键字的秘密:Java 编程中的终极武器

文章目录 引言什么是 final 关键字&#xff1f;一、 final 变量final 局部变量final 实例变量final 静态变量 二、 final 方法三、 final 类四、 final 关键字的实际应用1. 定义常量2. 防止方法被重写3. 创建不可变类4. 优化性能 五、 final 的一些常见误区1. final 变量不能在…

【JavaSE】程序逻辑控制

目录 1. 顺序结构 2. 分支结构 2.1 if语句 2.1.1 语法格式1 2.1.2 语法格式2 2.1.3 语法格式3 2.1.4 练习 2.1.5 注意事项 2.2 switch 语句 3. 循环结构 3.1 while循环 3.1.1 语法格式 3.1.2 代码示例 3.1.3 注意事项 3.2 break 3.3 continue 3.4 for循环 …