包含文心一言在内的首批国产大模型 全面开放

8月31起,国内 11 家通过《生成式人工智能服务管理暂行办法》备案的 AI 大模型产品将陆续上线,面向全社会开放。北京 5 家大模型产品分别是百度的 “文心一言”、抖音的 “云雀”、百川智能的 “百川大模型”、清华系 AI 公司智谱华章旗下的 “智谱清言” 以及中科院的 “紫东太初”。 上海 3 家大模型产品包括商汤的 “商量 SenseChat”、MiniMax 的 “ABAB 大模型”、上海人工智能实验室的 “书生通用大模型”。 让我们看下首批获批上线的 8 家大模型企业简介。

1、百度的 “文心一言”8 月 31 日向全社会全面开放。用户可以在应用商店下载 “文心一言 APP” 或登陆 “文心一言官网”(https://yiyan.baidu.com)体验。百度还将开放一批经过全新重构的 AI 原生应用,让用户体验生成式 AI 的理解、生成、逻辑、记忆四大核心能力。daad737425b5052f0685c7e2973d5271.jpeg文心一言在 3 月 16 日开启邀测。百度董事长兼首席执行官李彦宏表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。

 2、百川智能 8 月 31 日,前搜狗 CEO 王小川创立的百川智能宣布率先通过《生成式人工智能服务管理暂行办法》备案,今日起面向全社会开放服务。用户可以登录 www.baichuan-ai.com,感受百川大模型在知识问答、文本创作等领域带来的全新体验。成立仅四个月,百川智能便相继发布了三款通用大语言模型。百川智能称,截止今日,Baichuan-7B/13B 两款开源模型在 Huggingface 下载量已突破三百万。 

 3、商汤科技大模型应用 “商量 SenseChat” 商汤大模型应用 “商量 SenseChat” 也于 8 月 31 日宣布,即日起全面向广大用户开放服务。用户可以通过网址 https://chat.sensetime.com 进行体验。用户手机注册后即可以与 “商量 SenseChat” 进行对话。 4 月 10 日,商汤推出大模型 “日日新”,包括自然语言处理模型 “商量”、文生图模型 “秒画” 和数字人视频生成平台 “如影” 等。其中,商量 SenseChat1.0 也是国内最早推出基于千亿参数大语言模型的聊天机器人产品之一。 

4、清华系 AI 公司智谱华章的 “智谱清言”(基于 ChatGLM2) 8 月 31 日,智谱华章正式上线首款生成式 AI 助手 —— “智谱清言”,现已在各大应用商店上线,用户可通过苹果商店 App Store、安卓主流商店(包括华为、OPPO、vivo 及小米等)进行下载,或在微信小程序中搜索 “智谱清言” 体验其功能。 40d27cb9039e7a7db3a266bc963f3a5b.jpeg该助手基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,经过万亿字符的文本与代码预训练,并采用有监督微调技术,以通用对话的形式为用户提供智能化服务。“智谱清言” 作为用户的智能助手,可在工作、学习和日常生活中为用户解答各类问题,完成各种任务。 目前,“智谱清言” 已具备 “通用问答、多轮对话、创意写作、代码生成以及虚拟对话” 等丰富能力,未来还将开放多模态等生成能力。

 5、抖音的云雀大模型 8 月中旬,字节跳动旗下抖音的一款基于云雀大模型开发的 AI 机器人 “豆包” 开始小范围邀请测试。用户可通过手机号、抖音或者 Apple ID 登录。 “豆包” 提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息。 df3fce0dbbce2e34bb0f95f954138270.jpeg6、中科院旗下 “紫东太初” “紫东太初” 将于 9 月 1 日面向公众开放服务。“紫东太初” 定位为跨模态通用人工智能平台,于 2021 年正式发布,拥有视觉、文本、语音多种模态,基于全栈国产化基础软硬件平台建立。6 月,“紫东太初” 发布 2.0 版本,再加入了视频、传感信号、3D 点云等新的模态数据。目前,“紫东太初” 已在文本创作、医疗、物流、政务等多个行业实现应用落地。 

7、上海人工智能实验室的书生大模型 上海人工智能实验室成立于 2020 年,由上海人工智能创新中心发起设立。2021 年,上海人工智能实验室联合商汤、香港中文大学、上海交通大学发布通用视觉技术体系 “书生”(INTERN)。 如今,书生大模型体系参数已达千亿级别,包括 “书生・多模态”、“书生・浦语” 和 “书生・天际” 等三大基础模型,以及面向大模型研发与应用的开源体系。

 8、MiniMax 的 ABAB 大模型MiniMax 由前商汤科技副总裁、通用智能技术负责人闫俊杰于 2021 年 12 月创立,号称 All in AGI。ABAB 是一款先进的通用大语言模型,具有强大的语言处理能力,能够理解和生成自然语言文本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/62274.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python爬虫入门教程(非常详细):如何快速入门Python爬虫?

示例示例Python爬虫入门教程什么是爬虫爬虫(又称网络爬虫)是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。它可以自动地抓取网页内容,并从中提取有用的数据,存储到本地文件或数据库中。 Python爬虫入门教…

vue3 Table 分页保留选中状态

//指定id值,数据更新之后保留之前选中的数据 const getRowKeys (row) > {return row.siteId; }; // 这存的是选中的数据 const userSelectionChange (values) > {state.selectedData [...values]; }; // 两个数组对比,判断表格中的数据是否开启选中 cons…

linux EOF 用法

这篇文章主要讲解了“linux的eof怎么使用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“linux的eof怎么使用”吧! linux的eof是自定义终止符,其全称是“E…

chrono学习(一)

我想用chrono进行沙土的仿真,首先学习demo_GPU_ballCosim.cpp,这个例子仿真了一些沙土的沉降过程。 首先,运行编辑完成的文件demo_GPU_ballCosim: (base) eowyneowyn-MS-7D20:~/build_chrono/bin$ ./demo_GPU_ballCosim 运行完得…

编译链接的流程

编译链接的流程 编译链接是将源代码转换为可执行程序的过程,一般包括以下几个步骤: 预处理(Preprocessing):预处理器根据以字符 ‘#’ 开头的预处理指令,对源代码进行处理。这些指令可以包括宏定义、头文…

Spring源码分析(十)Bean实例化(下)

目录 1.1 循环依赖1.2 属性填充1.2.1 populateBean方法1.2.2 initializeBean方法执行Aware方法执行BeanPostProcessor后置处理器的前置处理方法执行初始化方法执行BeanPostProcessor后置处理器的后置处理方法:postProcessAfterInitialization(),允许对be…

MySQL数据库基本操作

目录 一、数据库中常用的数据类型 二、常用命令与操作 1.DDL数据库定义语言 1、登录用户的数据库 2、查看当前服务器中的数据库 3、切换/进入数据库 并 查看数据库中包含的表 4、查看数据库中表的结构 5、创建数据库 7、展示创建数据表时的结构 8、创建表&#xff0c…

clickhouse中replacingMergeTree

ReplacingMergeTree是在MergeTree上添加了去重的功能,但是这个功能不可控,合并是一个后台的操作,除非手动触发,不然无法控制,并且它会删除具有相同(区内)主键的重复项。 特点: 1,去重时机不定&a…

Linux 三剑客

grep grep主打的就是查找功能 ,它能够在一个或者多个文件中搜索某一特定的字符模式。 grep的语法 grep [选项] 模式 文件名 先说选项: 1.选项 要么是正则要么是字符串 -c 列出共出现多少次 -i 忽略大小写 -n 在前面列出行号 -v …

阿里云centos9stream安装宝塔+vscode(code-server)集成云端开发环境

一、 安装宝塔面板 官网 https://www.bt.cn/new/download.htm 题外话:虽然感觉现在宝塔没以前好用了,而且有centos7、8 mysql编译导致OOM服务器挂掉无法ssh登录的情况,但他还是远程管理服务器的好选择,提示宝塔只支持最新的centos…

常见矿石材质鉴定VR实训模拟操作平台提高学员的学习效果和实践能力

随着“元宇宙”概念的不断发展,在矿山领域中,长期存在传统培训内容不够丰富、教学方式单一、资源消耗大等缺点,无法适应当前矿山企业发展需求的长期难题。元宇宙企业借助VR虚拟现实、web3d开发和计算机技术构建的一个虚拟世界,为用…

SpringBoot虚拟路径映射

要求:访问:127.0.0.1/image/下的文件时,自动映射到真实路径:D:Files\。 virtualFileDepositPath: /image/** realityFileDepositPath: C:\Users\xin\Desktop\imgCreate\Files\ import org.springframework.beans.factory.annota…

编写c语言程序调用openssl编译出的动态链接库

文章目录 一、编译生成链接库二、示例一:调用RAND_bytes函数三、示例二:调用SHA256 一、编译生成链接库 下载安装openssl并编译生成链接库的过程在我的另一篇文章中已经详细说明了:Ubuntu中安装OpenSSL 此外,我们还需要提前了解…

【如何获取数据库表的字段并拼接】

获取数据库表的字段并拼接 需求场景操作步骤获取该数据库对应表中所有的字段对获取到的字段进行处理 需求场景 在写sql语句时,我要获取到该表的大部门字段来做处理,一个个粘贴复制太费事了,所以我决定执行sql语句把表中字段查询出来 操作步…

微服务之Nacos

1 版本说明 官网地址: https://github.com/alibaba/spring-cloud-alibaba/wiki/%E7%89%88%E6%9C%AC%E8%AF%B4%E6%98%8E 1.1 2021.x 分支 适配 SpringBoot 2.4, Spring Cloud 2021.x 版本及以上的Spring Cloud Alibaba 版本如下表(最新版本用*标记&am…

pytorch/tensorflow 直接给张量中的某个位置的值赋值,操作不可导。

问题:给一个tensor A中[i,j],赋值p。直接操作A[i,j]p可能会导致值覆盖,操作不可导。 解决方案:通过引入一个额外的mask实现。 mask[i,j] 0 mask tf.convert_to_tensor(mask, dtypetf.float32) A (A * mask) (p * (1-mask))p…

建造者与工厂方法的区别

建造者模式最主要的功能是基本方法的调用顺序安排,也就是这些基本方法已经实现了,通俗地说就是零件的装配,顺序不同产生的对象也不同;而工厂方法则重点是创建,创建零件是它的主要职责,组装顺序则不是它关心…

了解XSS攻击与CSRF攻击

什么是XSS攻击 XSS(Cross-Site Scripting,跨站脚本攻击)是一种常见的网络安全漏洞,它允许攻击者在受害者的浏览器上执行恶意脚本。这种攻击通常发生在 web 应用程序中,攻击者通过注入恶意脚本来利用用户对网站的信任&…

springboot Actuator未授权访问漏洞

management:endpoints:enabled-by-default: false #关闭所有默认端点关闭所有端点(开启时默认开放info和health)endpoint:# 开启你想开放的端点info:enabled:true #开启info端点 其他相关配置说明 Spring Boot 2.X 中&#xff0…