AI大模型日报#0527:豆包大模型披露评测成绩、天工AI日活超100万、AI初创集体跳槽OpenAI

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE 4.0)、“零一万物”(Yi-Large)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:豆包大模型在评测中显示性能较上一代提升19%,尤其在中文能力上超越GPT-4。Snowflake通过收购AI观测平台TruEra,增强其AI数据云功能与可信度,助力企业确保AI应用准确高效。昆仑万维旗下天工AI凭借卓越技术,DAU超过100万,成为用户活跃的AI内容创作平台。中国电信发布支持30种方言的语音识别大模型,推动方言文化保护。博世团队提出参考神经算子,高效解决工业偏微分方程问题,显著降低学习复杂度。此外,CVPR 2024线上分享会公布日程,聚焦计算机视觉领域最新成果。陈丹琦团队推出SimPO方法,通过微调8B模型超越Claude3 Opus,为大型语言模型优化提供新思路。港大与字节跳动提出多模态大模型新范式Groma,模拟人类先感知后认知过程,提升交互性与指向性。马斯克则计划建造世界最大超算中心,投入10万块H100训练Grok以追赶GPT-4。同时,OpenAI在领导层股权争议和安全团队解散挑战后,迎来AI安全领域资深专家加盟,致力于加强AGI的安全准备工作。

标题: 豆包大模型披露评测成绩,较上一代“云雀”提升19%
 


摘要: 科技记者报道:豆包大模型在火山引擎原动力大会上发布,以低价策略进入市场,并在内部测试中显示出较上一代云雀模型提升19%的性能。在11个主流公开评测集上,豆包模型总分76.8分,优于其他国产模型,并在代码能力、专业知识和指令遵循方面有显著提升。尽管GPT-4在这些评测集上仍保持领先,豆包模型在中文能力上超越GPT-4。第三方评测结果预计将在未来一到两个月内公布。
网址: 豆包大模型披露评测成绩,较上一代"云雀"提升19% | 量子位
 
标题: 速递|Snowflake 宣布收购 AI 观测平台 TruEra!
摘要: Snowflake 宣布收购 AI 观测平台 TruEra,旨在增强其 AI 数据云的功能和可信度。TruEra 提供评估和监控 LLM 应用和 ML 模型的能力,帮助企业确保 AI 应用的准确性和高效性。此次收购将整合 TruEra 的技术团队,包括三位联合创始人,并进一步提升 Snowflake 在 AI 和 ML 数据治理方面的能力。Snowflake 表示,此次收购是其在生成式 AI 和机器学习能力上持续投资的一部分,以帮助客户最大化数据价值。
网址: 速递|Snowflake 宣布收购 AI 观测平台 TruEra!|Snowflake|ai|snowflake|truera|唱片|迷你专辑|音乐专辑_手机网易网
 
标题: 昆仑万维宣布天工AI每日活跃用户(DAU)超过100万
 


摘要: 昆仑万维旗下天工AI用户活跃度创新高,DAU超100万。受益于前瞻AI战略与领先产品能力,天工AI聚焦用户体验,优化产品,打造贴近用户场景的AI产品。据QuestMobile数据,3月月活跃用户近千万,成为国内AIGC APP月活跃用户第三。4月17日发布天工3.0与天工SkyMusic,模型技术强大,AI音乐领域领跑全球。4月访问量激增122.58%,增速榜单全国第二。天工AI以用户体验为中心,推出AI搜索研究/增强模式、AI PPT等功能,用户活跃度与留存数据屡创新高。智能体平台吸引用户创建UGC智能体,成为国内领先的AI智能体平台。自2023年4月17日推出以来,天工AI凭借卓越技术与领先产品性能,迅速获得用户青睐。下一步,昆仑万维将推动AI技术应用落地,优化模型技术与用户体验,打造用户首选的人工智能内容创作平台,赋能用户生成高质量AI UGC内容,为我国AI产业发展贡献力量。
网址: 昆仑万维宣布天工AI每日活跃用户(DAU)超过100万 | 机器之心
 
标题: 换了30多种方言,我们竟然没能考倒中国电信的语音大模型
 


摘要: 中国电信人工智能研究院(TeleAI)近日发布了业内首个支持30种方言自由混说的“星辰超多方言语音识别大模型”,该模型可同时识别理解粤语、上海话、四川话、温州话等各地方言,是国内支持最多方言的语音识别大模型。该模型通过构建超30种、超30万小时的高质量方言数据库,解决了方言数据稀疏的问题,并自主研发了星辰语音识别大模型。团队首创“蒸馏 + 膨胀”联合训练算法,实现了80层模型稳定训练,并通过超大规模语音预训练和多方言联合建模,使单一模型支持30种方言自由混说语音识别。该模型在国际权威赛事中斩获冠军,并在多项基准测试中表现出色,打破了单一模型只能识别特定单一方言的困境。星辰超多方言语音识别大模型已在多个场景中应用,包括智能客服系统,并有望在更广泛的社会生活场景中发挥价值,同时推动对方言文化的保护。
网址: 换了30多种方言,我们竟然没能考倒中国电信的语音大模型 | 机器之心
 
标题: 博世团队提出参考神经算子,学习偏微分方程解对几何变形的平滑依赖
 


摘要: 科技记者报道: 博世人工智能中心(BCAI)的研究人员开发了一种名为参考神经算子(RNO)的新型神经网络架构,旨在更高效地解决工业应用中常见的偏微分方程问题。传统的神经算子方法需要大量数据来训练模型,以确保解的准确性,这在仿真成本高昂的工程设计优化领域尤其困难。RNO 通过学习解对几何形状微小变化的依赖性,显著提高了数据利用效率。 RNO 方法的核心在于其能够预测参考解在几何形状微小扰动下的变化。这种方法不仅降低了学习复杂度,还在准确度上大幅领先基准模型,实现了高达80%的误差减少。RNO 的分层架构包括编码器、积分算子层和解码器,通过预测解的变化量而非直接预测解本身,降低了学习难度。 研究人员通过一系列实验验证了RNO的有效性,包括与多种基线模型的比较。RNO在所有测试问题上的表现均优于其他模型,尤其是在处理复杂几何形状变化的数据集时,展现了良好的泛化能力和处理自由形式变形的能力。这一创新方法为工程设计优化领域提供了高效、灵活的工具,特别是在单次仿真成本高昂的场景中。
网址: 博世团队提出参考神经算子,学习偏微分方程解对几何变形的平滑依赖 | 机器之心
 
标题: 大模型时代的计算机视觉!CVPR 2024线上分享会全日程公布
 


摘要: 自从 OpenAI 发布 ChatGPT 以来,科技界对大型语言模型和人工智能生成内容(AIGC)的关注度显著提升。在计算机视觉(CV)领域,研究热点也在不断变化。为了快速了解 AI 领域的最新科研成果与发展趋势,参加顶级会议论文分享会是一个有效途径。CVPR(计算机视觉与模式识别会议)作为 CV 领域的顶级会议,今年共收到 11532 份论文投稿,其中 2719 篇被接收,录用率为 23.6%。为了促进国内 CV 社区的学术交流,机器之心计划于 2024 年 6 月 1 日举办「CVPR 2024 线上论文分享会」,邀请 AI 社区成员参与。分享会将包括 Keynote 演讲和论文分享环节,并邀请顶级专家和论文作者就 CV 热门主题进行交流。
网址: 大模型时代的计算机视觉!CVPR 2024线上分享会全日程公布 | 机器之心
 
标题: 陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替
摘要: 科技记者报道:陈丹琦团队推出新方法SimPO,这是一种简化的RLHF(Reinforcement Learning with Human Feedback)替代方案,旨在提升大型语言模型的性能。SimPO通过微调8B模型,成功超越了Claude 3 Opus,并在多项测试中表现出色。与DPO(Direct Preference Optimization)相比,SimPO不仅性能更优,而且资源消耗更低,训练时间和GPU使用量大幅减少。 SimPO的核心在于简化训练流程,摆脱了对参考模型的依赖,并通过长度归一化的对数概率来构建奖励函数,鼓励模型生成简洁且高质量的回复。此外,SimPO还引入了奖励差异项来加强优化信号,使模型能够更清晰地区分正负样本。 在AlpacaEval 2和Arena-Hard等基准测试中,SimPO调整后的模型表现超越了其他优化方法,包括DPO。同时,SimPO的开销也大幅减少,训练时间和GPU消耗均有所降低。 尽管SimPO展现出巨大潜力,但作者也指出了一些不足,如未明确考虑安全性和诚实性,以及在某些需要密集推理的任务上表现下降。未来,团队计划通过集成正则化策略等方法来改进SimPO。 SimPO的成果已开源,并迅速被大模型微调平台Llama-Factory引进。这项技术的创新性应用为大型语言模型的优化提供了新的思路。
网址: 陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替 | 量子位
 
标题: 港大字节提出多模态大模型新范式,模拟人类先感知后认知
 


摘要: 香港大学和字节跳动商业化团队的研究人员提出了一种名为Groma的新范式,旨在提升多模态大模型的感知定位能力。Groma通过区域性图像编码来增强模型对图像中物体位置的识别,从而在视觉任务中实现更准确的定位。这种新方法允许模型将文本内容与图像区域直接关联起来,显著提升了对话的交互性和指向性。Groma的核心思路是将定位功能转移到多模态大模型的vision tokenizer中,利用vision tokenizer的空间理解能力来发现并定位潜在的物体,而无需外接专家模型。研究人员采用超过8M的数据来预训练Region Proposer,以提高定位的鲁棒性和准确性。实验结果显示,Groma在多个基准测试中表现优异,包括Grounding Benchmarks和VQA Benchmark。这种先感知后认知的模型设计不仅符合人类的视觉过程,还避免了重新训练大语言模型的计算开销。字节跳动正持续加大对顶尖人才和前沿技术的投入力度,参与行业顶尖的技术挑战和攻坚。
网址: 港大字节提出多模态大模型新范式,模拟人类先感知后认知 | 量子位
 
标题: 马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o
 


摘要: 科技巨头间的AI竞赛愈演愈烈,马斯克不甘落后,宣布将建造世界最大的超算中心。他的xAI公司发布了Grok 1.5,并计划推出Grok 2,但受限于算力不足。马斯克表示,训练Grok 2需要约2万个基于Hopper架构的英伟达H100 GPU,而Grok 3及更高版本将需要10万个H100芯片。特斯拉财报显示,公司受到算力限制,马斯克计划部署8.5万个H100 GPU。他希望在2025年秋季前让这台超级计算机运行起来,并与Oracle合作共建。这个「超级计算工厂」一旦完工,规模将至少是当前最大GPU集群的4倍。然而,Meta、微软和OpenAI也在积极扩建算力,竞争激烈。英伟达成为关键供应商,其H100和即将推出的B100 GPU将助力科技巨头升级算力。马斯克还指出,除了芯片短缺,电力供应将成为未来AI发展的主要限制因素。
网址: 马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o|英伟达|马斯克|电力_新浪新闻
 
标题: AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!
 


摘要: OpenAI面临领导层股权争议和AI安全团队解散的双重挑战。据报道,高级领导层对股权回收条款知情并签署,而安全团队的解散和未兑现的资源承诺引发了外界对OpenAI安全承诺的质疑。然而,随着Indent的CEO Fouad Matin及其团队加入OpenAI,致力于AGI安全准备,公司似乎正在重整旗鼓。Matin在AI安全和产品设计方面有着丰富的经验,他的加入可能会为OpenAI的安全工作带来新的活力。
网址: AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!|AI_新浪新闻
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/16890.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PyQt5-新手避坑指南(持续更新)

文章目录 一.前言二.开发环境三.坑1.程序没有详细报错就退出了2.qrc资源文件的使用3.QLabel文字自动换行4.图片自适应大小5.checkbox自定义样式后✓不见了6.多线程 四.记录 一.前言 本篇博客整理了一些初学者容易犯的…

技术贴 | Query 物理计划构建指南

在往期博客《执行器 - Query 执行详解》中,我们介绍到到一条 Query 的 SQL 语句需要经过:词法分析 —— 生成 AST 语法树 —— 生成物理计划。本期博客我们接续上篇讲解一条 Query 语句物理计划的具体结构,以及如何构建物理计划。 物理计划是…

Jmeter环境安装(超级简单)

Jmeter的安装是非常简单的,只需要将下载的安装包解压后,就可以运行了!! 一、首先要下载Jmeter 1.1、官网下载: 下载最新版:https://jmeter.apache.org/download_jmeter.cgi https://jmeter.apache.org/…

论文阅读》学习了解自己:一个粗略到精细的个性化对话生成的人物感知训练框架 AAAI 2023

《论文阅读》学习了解自己:一个粗略到精细的个性化对话生成的人物感知训练框架 AAAI 2023 前言 简介研究现状任务定义模型架构Learning to know myselfLearning to avoid Misidentification损失函数实验结果消融实验 前言 亲身阅读感受分享,细节画图解释…

代码随想录算法训练营第四十一天 | 理论基础、509. 斐波那契数、70. 爬楼梯、746. 使用最小花费爬楼梯

理论基础 代码随想录 视频:从此再也不怕动态规划了,动态规划解题方法论大曝光 !| 理论基础 |力扣刷题总结| 动态规划入门_哔哩哔哩_bilibili 动归五部曲 1.dp数组以及下标的含义 2.递推公式 3.dp数组如何初始化 4.遍历顺序(例如先背包再…

java_方法重写(覆盖)

介绍 现在我们来试一下 代码 父类 package b;public class father_ {//father class//4attributepublic void cry() {System.out.println("小动物叫唤");} } package b; 子类 public class graduate extends father_ {public void cry() {//子类方法//非私有的属性和…

有哪些和excel类似或基于excel扩展的软件?

Workfine数字化管理平台是一款易上手、便捷、高效的数字化管理工具,是类excel设计,更容易上手进行企业业务系统的搭建,在信息记录和表格管理方面,比excel更简单易用,在这里,给大家挑几个点展示下~ 首先表格…

一键恢复,U盘被删除文件方法分享

U盘是一种轻巧便携的移动储存工具,在日常的工作以及学习过程中,我们经常性会使用它来传输、备份、存储一些重要文件。然而,随着后期使用频率的增多,会在不同的设备上来回插拔,也就给里面存储文件带来了很大的隐患。比方…

I.MX6ULL的蜂鸣器实验-GPIO输出实验

系列文章目录 I.MX6ULL的蜂鸣器实验 I.MX6ULL的蜂鸣器实验 系列文章目录一、前言二、有源蜂鸣器简介三、硬件原理分析四、程序编写4.1程序编写前提工作4.2程序编写 五、编译下载验证5.1编写 Makefile 和链接脚本5.2编译下载 一、前言 在 I.MX6U-ALPHA 开发板上有一个有源蜂鸣器…

九宫格转圈圈抽奖活动,有加速,减速效果

在线访问demo和代码在底部 代码&#xff0c;复制就可以跑 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><tit…

Thingsboard规则链:GPS Geofencing Filter节点详解

​​​​​​​ 引言 GPS Geofencing Filter节点具体作用 使用教程 源码浅析 应用场景与案例 物流与运输 农业智能化 城市安全管理 结语 引言 在物联网技术迅速发展的今天&#xff0c;精准的位置服务已成为诸多应用不可或缺的一环。作为物联网平台的佼佼者&…

【机器学习】随机梯度下降算法以及优化

一、概述&#xff1a; 什么是梯度下降&#xff1f; 梯度下降法的基本思想可以类比为一个下山的过程。 假设这样一个场景:一个人被困在山上&#xff0c;需要从山上下来(i.e.找到山的最低点&#xff0c;也就是山谷)。但此时山上 的浓雾很大&#xff0c;导致可视度很低。因此&am…

【Postman接口测试】第一节.接口测试基础认识

文章目录 前言一、接口的基础 1.1 什么是接口 1.2 软件为什么需要接口 1.3 为什么要做接口测试二、接口测试的基础 2.1 接口测试介绍 2.2 接口测试的实现方式三、接口返回数据和JSON详解四、接口测试协议详解总结 前言 一、接口的基础知识 1.1 什么是…

出生率下降 幼儿园如何面对困境创新转型

从2023年开始&#xff0c;全国幼儿园生存发展问题成为教育界焦点&#xff0c;民办幼儿园更为焦虑满满。当今年轻人对待婚姻和生育的观念&#xff0c;的确让上一辈人始料未及。那么&#xff0c;是否幼儿园再也不可能回到巅峰时期了&#xff1f;是否很多幼儿教育者将无用武之地呢…

1+x(Java)中级题库易混淆理论题(二)

冷备份实质就是数据库相关文件的复制 System.in是字节流 Map集合中的key是无序的 protected不能用于修饰类 接口中所有抽象方法默认使用public修饰 DML操作有&#xff1a;INSERT UPDATE DELETE SQL 语句中进行 group by 分组时&#xff0c;可以不写 where 子句 使…

【权威出版】2024年土木工程、抗震构造与材料技术国际会议(CSCMT 2024)

2024年土木工程、抗震构造与材料技术国际会议 2024 International Conference on Civil Engineering, Seismic Construction, and Material Technology 【1】会议简介 2024年土木工程、抗震构造与材料技术国际会议即将召开&#xff0c;这是一次集结全球土木工程、抗震构造与材料…

网络其他重要协议(DNS、ICMP、NAT)

1.DNS DNS是一整套从域名映射到IP的系统 1.1 DNS背景 TCP/IP中使用IP地址和端口号来确定网络上的一台主机的一个程序&#xff0c;但是IP地址不方便记忆&#xff0c;例如我们想访问百度就会在浏览器中输入baidu.com而不是百度的IP地址。于是人们发明了一种叫主机名的东西, 是…

瞄准金融行业的远控木马:SpyNote

Android 间谍软件是最常见的恶意软件之一&#xff0c;攻击者通过 Android 间谍软件来跟踪用户位置、检查 Web 浏览记录&#xff0c;甚至窃取敏感信息&#xff08;密码和信用卡号等&#xff09;&#xff0c;其对银行机构与客户构成的威胁与 Android 银行木马相媲美。间谍软件还可…

消息回复及时,客户不流失!这个微信自动回复设置快快码住!

你是不是也遇到过由于回复不及时&#xff0c;导致客户流失的情况发生&#xff1f;或是好友申请太多&#xff0c;来不及通过&#xff1f; 别担心&#xff0c;试试个微管理系统&#xff0c;让你实现自动回复&#xff0c;提高回复效率&#xff01; 1、自动通过好友 当有新的好友…

Suricata-入门实验-快速理解suricata

实验环境&#xff1a; 主机win10 ip地址&#xff1a;192.168.121.1 虚拟机使用vm ubuntu20.04 ip地址&#xff1a;192.168.121.128 实验目标&#xff1a; 从主机 给虚拟机 发送ping 命令 虚拟机中Suricata接收到ping后发出告警信息。 正文 在前面 编译好Suricata后&#x…