「ChatGPT」掀起新一轮AI热潮!超越GPT-4 Turbo,商汤日日新大升级!

图片

目录

拳打 GPT-4 Turbo ,脚踢 DALL·E 3

端侧大模型,唯快不破

AI 应用落地需要一个即插即用的大模型超市

并不存在 AI 这个行业,只有 AI+行业,强调 AI 需要与传统产业合作,这种关系是结合与赋能,而不是颠覆,其价值在于帮助传统产业提高生产效率,解放生产力。


福利:文末有福利哦,最新AI资料免费领

chat gpt 免费领,无魔法,无限制

在大模型的浪潮席卷而来的前几年,其实也掀起过一阵 AI 创业热潮。其中商汤科技、旷视科技、云从科技、依图科技是这个时期的代表,这四家公司也被称为「中国 AI 四小龙」。

到了 OpenAI 掀起的这股新浪潮中,四小龙中的商汤科技还留在舞台中央。去年 4 月商汤发布「日日新·大模型」 系列,是国内最早推出基于千亿参数大语言模型的公司之一。

苟日新,日日新,又日新。

商朝的开国君主汤在澡盆上刻了上述自我告诫的格言,恰似今天 AIGC 领域的变化速度,商汤大模型更新的节奏也可谓「日日新」。

图片

两个月前,商汤推出「日日新 SenseNova 4.0」大模型体系,甚至先 OpenAI 一步首发了全球首个支持不同模态工具调用的 Assistants API。

而今天下午,「又日新」的商汤继续推出了一系列基于「日日新」的生成式 AI 模型及应用,先给大家划重点:

日日新 5.0:常用客观评测上达到或超越了 GPT-4 Turbo

1.8B 的端侧模型:同等尺度性能最优,跨级尺度全面领先

企业级的应用一体机:涉及金融、医疗、政务、代码等领域

尚未上线的文生视频生成平台

拳打 GPT-4 Turbo ,脚踢 DALL·E 3

AI 2.0 时代,生成式 AI 被视为推动生产力进步的重要技术,如果能在知识、推理、执行三层能力上实现突破,将真正带来整个社会生产力的跨越式发展。

上个月,商汤 CEO 徐立在出席 2024 GDC 提出了如上观点,而在今天的发布会上,他再次强调,商汤在尺度定律的指导下,会持续探索大模型能力的 KRE 三层架构(知识-推理-执行),不断突破大模型能力边界。

那么全新升级的日日新 SenseNova 5.0(以下简称:日日新 5.0)又有哪些更新亮点呢?

采用 MoE 架构

基于 10TB tokens 训练,大量合成数据

推理上下文窗口支持 200K

知识、推理、数学、代码全面对标 GPT-4 Turbo

图片

日日新 5.0 本次更新主要增强了知识、数学、推理及代码能力,全面对标 GPT-4 Turbo。

在主流客观评测上,日日新 5.0 达到或超越了去年 OpenAI 在开发者大会上发布的 GPT-4 Turbo 版本,同时也几乎碾压了近期发布的 Llama 3-70B。

图片

光说不练假把式,在发布会现场,商汤全方位展示了日日新 5.0 在语言、数学推理等方面的实际能力。

同样输入一道 2022 年的高考作文题,对比 GPT-4 Turbo(仅为去年 11 月份的版本,下同)可以看到,日日新 5.0 生成的结果脱离了模版套路化的束缚,多了点人味,一看就是能走进高考阅卷老师心坎的文章。

图片

面对数学问题的拷问,GPT-4 Turbo 开始有些招架不住,不仅计算过程复杂,最终得出的结果也是错误的,而日日新 5.0 这边得出的答案则充满条理性,也完全正确。

图片

行业差异化是大模型竞争中脱颖而出的关键因素。

瞄准本土化应用场景的日日新 5.0,在理解中文特有的文化和语境上是要优于 GPT-4 Turbo 的。GPT-4 Turbo 既然不熟悉中文语境,自然也就无法准确把握「老鹰捉小鸡」这样的本土游戏规则。

图片

多模态能力被业界普遍视为实现 AGI 的关键路径。

从基准测试结果上看,日日新 5.0 也能与 GPT-4V 打得火热,并且互有胜负。在实际的案例演示中,日日新 5.0 支持的秒画生成老象的效果更自然一些,而同样的问题给到友商,甚至还会出现三条腿的谬误。

基于同一 Prompt 生成的人像图,商汤旗下秒画生成的皮肤纹理自然,既没有过度磨皮加滤镜,也顺利完成了「美丽」的指标 。考虑到国际上用于训练 AI 模型的亚洲人像数据库相对有限,这样的对比结果也相对正常。

图片

结合多模态和数据分析能力,AI 能够实现更为复杂和高级的任务。

日日新 5.0 上能「攻破」长图的总结描述,中能识别滴滴打车的具体信息,下还能计算中国特有早餐的热量,同样的问题给到 GPT-4 Turbo,也许就是两眼一抹黑。

图片

总说 AI 会重塑工作流,这一次,商汤也特别演示办公小浣熊在这方面的能力。

将 F1 赛车手周冠宇三年的参赛记录输入到系统中,并让它绘制出参与比赛数量的柱状图,这个任务看似简单,但实际上牵涉到复杂的识别难题。

在国际比赛中,周冠宇使用其英文名字参赛。传统的大模型在处理这类涉及非英文常规拼写或者特定人物的识别任务时,往往表现不佳。而日日新 5.0 升级的办公小浣熊虽然经历了一些波折,但最终还是顺利绘制出来。

端侧大模型,唯快不破

在武侠世界中,「天下武功,唯快不破」强调了速度在实战中的重要性,而在大模型的战役中,这一原则同样适用。

随着大模型技术的快速发展,不同应用场景的需求日益显现,智能手机、电脑、VR 眼镜等终端设备对大模型的使用频率,性能速度,安全稳定等提出了更高要求。

变得更务实的商汤在本次发布会也正式推出了 1.8B 的 SenseChat-Lite 版本端侧⼤模型。

在基准测试中,该端侧模型全面超越了 MiniCPM-2B、Phi-2 等同量级的大模型,并且还越级比肩一些 7B、13B 大模型,用徐立的话来说,那就是同等尺度性能最优,跨级尺度全面领先。

图片

研究表明,人眼最快的阅读速度大概就是 20 字/秒,而搭载 1.8B 商汤端侧模型在中端手机上能够实现 18.3 字/秒的速度,而在旗舰手机则最高支持 78.3 字/秒,成为业内最快推理速度。

商汤还推出端云协同解决方案,可以通过智能化判断协同发挥端云各自优势,需要联网搜索或处理复杂场景时分流至云端处理,部分场景端侧处理占比超过 80%,从而显著降低推理成本。

在与「商量」的寥寥几秒对谈中,无论是几秒生成请假报告,还是总结几千字的文档都能快速响应。

图片

端侧扩散模型还能实现业内最快推理速度,端侧 LDM-AI 扩图技术在某主流平台上,推理速度小于 1.5 秒,比友商云端 app 快10倍,支持输出 1200 万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

现场的演示中,工作人员更是可以做到随拍随扩,将端侧大模型「唯快不破」的能力展现得淋漓尽致。

并且,据徐立介绍,该端侧大模型主要适用于日常对话、常识问答、文案生成、相册管理、图片生成、图片扩展等六大领域,还支持多设备适配,使其能够灵活地应用于各种不同的场景和设备之中。

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的 AI 应用需求,商汤还正式推出了高性价比、开箱即用、数据安全、全国产化的企业级应用一体机,涉及金融、医疗、政务、代码等四大行业。

以政务智能咨询问答平台为例,它不仅能够理解用户提出的问题,还能提供答案的参考来源,极大地提升政务服务的智能化水平。

图片

徐立指出,自然语言仍然不能替代编程语言,当前的「AI 程序员」无法独立完成复杂的工业级代码项目,而 Copilot 才是更适合的形态。

因此,今天商汤还发布了小浣熊·代码大模型一体机轻量版,单台支持 100 人规模研发团队使用。支持数据不出域,安全有保障,免费部署即可开箱即用。每台售价 35 万元起,为中小企业用户提供了高性价比的选择。

今年以来,Sora 的出现让人们见识到了 AI 视频生成的无限创造潜力,徐立在最后环节也带来了「One more thing」——三段完全由大模型生成的视频。尚未上线的文生视频生成平台也在人物可控性、动作可控性以及场景可控性等方面都有着出色的表现。

AI 应用落地需要一个即插即用的大模型超市

在 GPT-4 发布一年后,大模型们依然在不断卷参数刷榜。但今年行业里大家真正关心的,其实是怎么将大模型通过 Agent,并接入到无数企业和个人的工作流中。

OpenAI 的 GPT Store 没有如愿成为 AI 行业的 GPT Store,但大量的需求和问题依然摆在那。大模型的强大的能力和落地不同行业场景之间缺乏畅通的桥梁,同时也意味着一个巨大的机遇。

商汤的日日新开放平台,实际上就是一个大模型超市。通过多模态的模型能力提升 API 的调用效率,降低企业和开发者调用和定制各种 AI 功能的门槛。

图片

比起模型的规模参数,商汤更侧重于模型的能力应用。从商汤针对金融、医疗、政务、代码的行业大模型,到目前行业推理速度最快的端侧模型,以及商量、 如影、大医、小浣熊家族等 AI 原生应用,都可能看出商汤想要提供接口更丰富,能执行不同行业复杂任务的 AI 工具箱。

知名调研机构 Frost & Sullivan 发布的《2023年中国AI开发平台市场报告》指出,SenseCore 商汤大装置已成为中国 AI 开发平台云计算基础设施供应商的领先者。在硬件基础设施兼容性、产业链合作情况、模型训练优化模块、智能标注技术能力、预训练模型技术水平5个评估项目中,商汤均获得最高分。

我们前段时间报道过金山办公的 WPS AI 企业版,其中合作的大模型就有商汤。金山表示商汤在数据分析上比较出色,因此 WPS AI 就调用它处需要理科思维的场景。

APPSO 把金山这种不生产大模型,而是坚定做大模型应用的公司,称为 AI 的应用主义者。而商汤在其中扮演的角色,与其说是大模型的提供商,不如说是帮助各行各业大规模应用落地 AI 应用的百货超市。

图片

什么是百货超市?有着广泛的产品线,能满足不同消费者大大小小的个性化需求。最重要的是,百货超市的出现让种类繁多的商品更容易被大众获取,让更多普通人便捷享受到全世界的优质产品和体验。

而这,正是方兴未艾的 AIGC 未来对我们最大的价值。而公司作为现代社会最伟大的发明之一,如果说大模型正在带来第四次工业革命,大概率是从对企业的影响开始。已故的商汤创始人汤晓鸥也曾表示:

并不存在 AI 这个行业,只有 AI+行业,强调 AI 需要与传统产业合作,这种关系是结合与赋能,而不是颠覆,其价值在于帮助传统产业提高生产效率,解放生产力。

汤晓鸥在一次演讲中提到,「企业融资不是用来烧的,而是做伟大的事。」而商汤科技未来十年要做的「伟大的事」,将是帮助千行百业将 AIGC 落地。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/2957.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java开发之路——用户管理中心_简单初始化

用户管理中心_简单初始化 (一) 初始化项目1. 使用 Ant Design Pro(现成的管理系统) 进行前端初始化2. 后端初始化三种初始化java项目 (二) 遇到的问题【问题1】Ant design pro页面打不开,一直在budiling控制台出现错误error-./src/components/index.ts【问题2】初始…

基于SSM的物业管理系统(含源码+sql+视频导入教程+文档+PPT)

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 基于SSM的物业管理系统2拥有三种角色 管理员:用户管理、物业管理、房产信息管理、小区概况管理、开发商管理、收费标准管理、物业公司管理等 物业:住户管理、收费…

如何通过cURL库实现远程控制插座

如何通过cURL库实现远程控制插座呢? 本文描述了使用cURL库调用HTTP接口,实现控制插座,即插即用,先插入插座,再接电器,实现远程控制。 可选用产品:可根据实际场景需求,选择对应的规格…

udp/tcp错误总结

udp tcp——多进程 tcp——多线程 tcp——线程池 tcp——守护进程 🎆udp  ✨pthread_create 错误总结  ✨LockGuard错误总结  ✨服务端需要写成多线程  ✨客户端也需要写成多线程  ✨多线程调试工具 🎆tcp  ✨tcp独有调试工具——telnet  ✨Threa…

基于瞬时频率的语言信号清/浊音判决和高音检测(MATLAB R2021)

语音是由气流激励声道从嘴唇或鼻孔辐射出来而产生的。根据声带是否振动,发音可分为浊音和清音。浊音和清音有明显的区别,浊音具有周期信号的特征,而清音则具有随机噪声的特征;浊音在频域上具有共振峰结构,其能量主要集…

⑤【Shiro】SpringBoot整合Shiro,实现登录认证

个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~ 个人主页:.29.的博客 学习社区:进去逛一逛~ ⑤【Shiro】SpringBoot整合Shiro,实…

AI助力科研创新与效率双提升:ChatGPT深度科研应用、数据分析及机器学习、AI绘图与高效论文撰写

2022年11月30日,可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT3.5,将人工智能的发展推向了一个新的高度。2023年4月,更强版本的ChatGPT4.0上线,文本、语音、图像等多模态交互方式使其在…

计算机网络4——网络层2

文章目录 一、地址解析协议ARP二、IP数据报格式1、IP 数据报首部的固定部分中的各字段2、IP 数据报首部的可变部分 三、IP 层转发分组的过程1、流程2、案例分析3、最长前缀匹配4、分组转发算法5、使用二叉线索查找转发表 一、地址解析协议ARP 在实际应用中,我们经常…

第一篇【传奇开心果系列】Python深度学习库技术点案例示例:深度解读深度学习在自动驾驶领域的应用

传奇开心果博文系列 系列博文目录Python深度学习库技术点案例示例系列 博文目录前言一、深度学习在自动驾驶方面的应用介绍二、目标检测和识别示例代码三、路况感知示例代码四、行为预测示例代码五、路径规划示例代码六、自动驾驶控制示例代码七、感知融合示例代码八、高精度地…

【数据结构】串(String)

文章目录 基本概念顺序存储结构比较当前串与串s的大小取子串插入删除其他构造函数拷贝构造函数扩大数组空间。重载重载重载重载[]重载>>重载<< 链式存储结构链式存储结构链块存储结构 模式匹配朴素的模式匹配算法(BF算法)KMP算法字符串的前缀、后缀和部分匹配值nex…

Android 10.0 Launcher3替换桌面app图标后大小和其他app图标不一样的问题解决方案

1.前言 在10.0的系统ROM产品定制化开发中,在关于launcher3的产品定制化开发中,在有些时候需要对一些第三方的app图标做 替换或者是做一些动态图标的替换,发现在替换以后图标大小和其他app的图标大小不一样,所以就需要看是具体哪里 对app的图标做了缩放功能,接下来就需要去…

【网页在线小游戏源码】

网页在线小游戏源码 效果图部分源码领取源码下期更新预报 效果图 部分源码 index.html <!DOCTYPE html> <html> <head> <meta http-equiv"Content-Type" content"text/html; charsetUTF-8"> <meta id"viewport" na…

WEB逆向—X-Bogus逆向分析(纯算+补环境)

声明 本文章中所有内容仅供学习交流&#xff0c;抓包内容、敏感网址、数据接口均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff0c;若有侵权&#xff0c;请联系我立即删除&#xff01; 前言 此平台 本人 仅限…

分类预测 | Matlab实现CNN-BiLSTM-SAM-Attention卷积双向长短期记忆神经网络融合空间注意力机制的数据分类预测

分类预测 | Matlab实现CNN-BiLSTM-SAM-Attention卷积双向长短期记忆神经网络融合空间注意力机制的数据分类预测 目录 分类预测 | Matlab实现CNN-BiLSTM-SAM-Attention卷积双向长短期记忆神经网络融合空间注意力机制的数据分类预测分类效果基本描述程序设计参考资料 分类效果 基…

深入探究音视频开源库WebRTC中NetEQ音频抗网络延时与抗丢包的实现机制

目录 1、引言 2、WebRTC简介 3、什么是NetEQ&#xff1f; 4、NetEQ技术详解 4.1、NetEQ概述 4.2、抖动消除技术 4.3、丢包补偿技术 4.4、NetEQ概要设计 4.5、NetEQ的命令机制 4.6、NetEQ的播放机制 4.7、MCU的控制机制 4.8、DSP的算法处理 4.9、DSP算法的模拟测试…

分布式与一致性协议之CAP(二)

CAP CAP不可能三角 CAP不可能三角是指对于一个分布式系统而言&#xff0c;一致性、可用性、分区容错性指标不可兼得&#xff0c;只能从中选择两个&#xff0c; 如图所示。CAP不可能三角最初是埃里克布鲁尔(Eric Brewer)基于自己的工程实践提出的一个猜想&#xff0c;后被塞斯吉…

论文辅助笔记:LLM-MOB代码解读

论文笔记 Where Would I Go Next? Large Language Models as Human Mobility Predictor-CSDN博客 1 主函数 1.1 导入库 import os import pickle import time import ast import logging from datetime import datetime import pandas as pd from openai import OpenAIclie…

【003_音频开发_基础篇_Linux进程通信(20种你了解几种?)】

003_音频开发_基础篇_Linux进程通信&#xff08;20种你了解几种&#xff1f;) 文章目录 003_音频开发_基础篇_Linux进程通信&#xff08;20种你了解几种&#xff1f;)创作背景Linux 进程通信类型fork() 函数fork() 输出 2 次fork() 输出 8 次fork() 返回值fork() 创建子进程 方…

Diffusion Model原理剖析

目录 前言1. DDPM演算法初览2. 图像生成模型共同目标3. VAE: Lower bound of l o g P ( x ) logP(x) logP(x)4. Diffusion Model背后的数学原理5. 为什么需要Sample?6. Diffusion Model的应用7. Diffusion Model成功的关键总结参考 前言 接着上篇文章 图像生成模型浅析&#…

Three.js入门学习笔记

学习资料&#xff1a; 【Three.js】Three.js快速上手教程_three.module.js-CSDN博客 2024年了&#xff0c;是该学学Three.js了_three.js 2024-CSDN博客 一、three.js简介 three.js是JavaScript编写的WebGL第三方库。 three.js&#xff0c;webGL&#xff0c;openGL三者的关…