AI潮汐日报1128期:Sora泄露引发争议、百度早期研究对AI领域Scaling Law的贡献、Meta发布系列AI开源项目

AI 潮汐日报,旨在提供最新潮、最核心、最有意思的AI速递。四大专栏:今日热点、应用速递、研究进展、思维碰撞。

今日热点

OpenAI文本转视频模型Sora泄露引发争议

OpenAI的文本转视频AI模型Sora在Hugging Face上遭遇泄露,泄露者为参与测试的个人“PR-Puppets”,公开了试用接口。新模型相比2月版本,视频分辨率更高,物体运动更流畅。此次泄露暴露了创新、劳动与企业责任间的冲突,泄露者发布公开信批评OpenAI利用艺术家无偿劳动完善模型。事件引发对AI道德、版权和知识产权的讨论,凸显了AI发展中创造性劳动被低估和道德困境的问题。

百度早期研究对AI领域Scaling Law的贡献

百度在2017年就对深度学习模型的Scaling Law进行了研究,通过实证研究验证了模型泛化误差和模型大小随训练集规模增长的幂律关系。这项研究当时使用的是LSTM而非Transformer,并未命名为“Scaling Law”。Anthropic的CEO Dario Amodei在百度工作期间,受到这一研究启发,后来在OpenAI领导开发了GPT-2和GPT-3。百度的研究为理解模型性能随参数量、数据量、计算资源增加而指数提升的规律提供了早期证据,但其贡献在当时并未得到广泛认可。

Meta发布系列AI开源项目

Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,覆盖图像分割、语音、文本、表征、材料发现、密码安全性等多个领域。这些项目旨在提升AI在图像处理和语音识别领域的能力,并推动AI研究的进展。SAM 2.1增强了遮挡处理能力,Spirit LM实现了跨模态生成,Layer Skip加速了LLM生成时间,Salsa攻击和破解了NIST标准中的Krystals Kyber,Meta Lingua提供了轻量级语言模型训练平台,Open Materials 2024促进无机材料发现,Mexma改进了句子表征,Self-Taught Evaluator用于生成合成偏好数据训练奖励模型。这些开源项目将进一步推动AI技术的创新和应用。

应用速递

Luma AI推出Dream Machine AI创意平台

硅谷AI公司Luma AI推出了Dream Machine AI创意平台及其首款图像生成模型Luma Photon,旨在提供易于上手的AI视觉工具。该平台通过自然语言对话实现图片创作和编辑,提供创意点子,并根据用户输入生成风格一致的图片或视频。Luma AI通过技术优化和产品创新,在视频生成领域迅速崭露头角,其视频模型Dream Machine AI上线4天用户量破百万,且未进行任何付费营销。

谷歌DeepMind推出GenChess定制国际象棋工具

谷歌DeepMind团队发布了GenChess,一款AI工具,允许用户自由定制国际象棋棋子。用户可以选择“classic”或“creative”模式,无需编程基础即可设计每个棋子。例如,输入“cat”后,系统会生成猫科动物主题的棋子,国王为雄狮,皇后为豹子。GenChess还能自动生成对手的棋子,如狗主题,以匹配用户的棋子风格。用户在定制完成后,可以直接在平台上对弈,并可调整游戏难度。

研究进展

清华团队解析RNN在长上下文建模中的挑战

清华大学的研究团队深入分析了RNN模型在处理长上下文时表现不佳的原因,发现问题并非源于RNN本身。研究指出,RNN模型如Mamba在长上下文中面临的主要问题是循环状态过拟合和内存容量上限,导致无法有效处理超出训练长度的输入。通过对这些问题的对症下药,研究人员显著提升了Mamba-2模型在长上下文长度上的性能。Mamba作者Albert Gu对研究成果表示认可,并强调通过在更长序列上训练,可以提高模型的泛化能力。

清华EvoAI技术实现蛋白序列空间极端压缩

清华大学研究团队开发了EvoAI技术,通过EvoScan方法全面分割和扫描高适应度序列空间,仅用82个锚点实现蛋白序列空间的极端压缩,压缩率高达10的48次方。该技术结合高通量实验进化和计算方法,无需同源性或结构信息即可预测新的、高度拟合的序列。EvoAI的优势在于平衡适应度优化和序列空间采样,快速探索高维度,生成多样化功能性变体,并提供序列功能关系的丰富信息。

复旦NLP团队提出双模型协作架构提升AI推理能力

复旦大学NLP研究团队提出了一种双模型协作架构(Two-Player Paradigm),通过引入评判模型(Critique Model)为行为模型(Actor Model)提供步骤级反馈,实现模型自我改进。该架构不依赖模型蒸馏,而是通过多模型协作互动获得高质量反馈信号,提升性能。研究团队构建了AutoMathCritique框架自动生成步骤级反馈数据集MathCritique-76k,并基于此训练评判模型。实验表明,该架构能有效提升模型在数学推理任务上的表现,缓解长尾分布问题,并为实现Test-time和Training-time Scaling提供了新方法。

思维碰撞

谷歌前CEO警告AI恋人对青少年的潜在风险

谷歌前CEO埃里克·施密特在播客节目中对AI恋人的流行趋势提出警告,强调这些“完美”的AI伴侣可能对心智未成熟的青少年产生显著风险,使他们更加孤独,甚至可能导致极端主义或厌女现象。施密特指出,家长对孩子接触在线内容的控制能力有限,青少年可能无法消化他们接触到的善恶内容。他提到,依赖AI恋人可能会加剧社会问题,尤其是对于12岁或13岁的孩子,他们可能接触到世界上的善恶,但还没有能力处理这些信息。

谷歌Jeff Dean回应AlphaChip质疑

谷歌首席科学家Jeff Dean针对EDA界对其AI芯片设计系统AlphaChip的质疑发表回应,指出质疑者未遵循预训练等关键步骤,导致结果无效。他强调,AlphaChip已在谷歌内部多个项目中得到应用,且Nature杂志的调查也支持了其研究成果。Jeff Dean批评反对者基于未经验证的指控和缺乏证据的分析,认为这些质疑毫无根据,很大程度上是由一篇存在严重缺陷的未经同行评审的论文引起的。谷歌的回应显示了对AlphaChip方法的信心,并强调了其在实际芯片设计中的应用和效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/62877.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

PH热榜 | 2024-12-02

1. Muku.ai 标语:AI网红广告代理公司 介绍:木库AI是家AI网红营销机构,利用AI虚拟形象创作用户原创视频广告。只需提供产品链接,就能生成吸引人的内容,从而提升各大平台的销售额。 产品网站: 立即访问 P…

Flink学习连载文章9--状态(State)

State state 可以理解为-- 历史计算结果 有状态计算和无状态计算 无状态计算: 不需要考虑历史数据, 相同的输入,得到相同的输出!如:map, 将每个单词记为1, 进来一个hello, 得到(hello,1),再进来一个hello,得到的还是(hello,1) 有状态计算: 需要考虑历史数据, 相同的输入,可…

go和python的遍历对比

Go 和 Python 都有强大的循环控制结构,但它们在实现和行为上有所不同,特别是关于索引变量的管理、迭代器的使用以及如何在循环中修改循环变量。以下是 Go 和 Python 循环的详细差异分析: 1. 循环类型: Go: Go 使用 …

嵌入式硬件面试题【经验】总结----会不断添加更新

目录 引言 一、电阻 1、电阻选型时一般从那几个方面考虑 2、上拉电阻的作用 3、PTC热敏电阻作为电源电路保险丝的工作原理 4、如果阻抗不匹配,有哪些后果 二、电容 1、电容选型一般从哪些方面进行考虑? 2、1uf的电容通常来滤除什么频率的信号 三、三极管…

Linux——基础命令(2) 文件内容操作

目录 ​编辑 文件内容操作 1.Vim (1)移动光标 (2)复制 (3)剪切 (4)删除 (5)粘贴 (6)替换,撤销,查找 (7&#xff…

Stable Diffusion 3详解

🌺系列文章推荐🌺 扩散模型系列文章正在持续的更新,更新节奏如下,先更新SD模型讲解,再更新相关的微调方法文章,敬请期待!!!(本文及其之前的文章均已更新&…

微信小程序——文档下载功能分享(含代码)

✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏…

高校心理教育辅导系统

私信我获取源码和万字论文,制作不易,感谢点赞支持。 摘 要 随着Internet技术的发展,心理教育辅导系统应运而生,心理教育辅导系统为用户提供了一个更为便利的心理测试咨询平台。所以,为了充分满足高校学生心理教育辅导…

mvc命令

命令 mvc MVC(Model-View-Controller)是一种软件架构模式,用于组织和管理应用程序的代码mvc重要的三部分 (1)‌模型(Model)‌:负责存储系统的中心数据,提供访问数据的函数,封装了应用程序的功能内核。 (2)视图&…

开源的跨平台SQL 编辑器Beekeeper Studio

一款开源的跨平台 SQL 编辑器,提供 SQL 语法高亮、自动补全、数据表内容筛选与过滤、连接 Web 数据库、存储历史查询记录等功能。该编辑器支持 SQLite、MySQL、MariaDB、Postgres 等主流数据库,并兼容 Windows、macOS、Linux 等桌面操作系统。 项目地址…

Shader的涉及的数学知识总结

着色器(Shader)编程广泛应用于计算机图形学中,用于实现各种视觉效果。编写高效的着色器需要扎实的数学基础,以下是着色器编程中常见的数学知识及其应用: 1. 向量代数 向量:表示具有大小和方向的量&#x…

数据结构——排序第三幕(深究快排(非递归实现)、快排的优化、内省排序,排序总结)超详细!!!!

文章目录 前言一、非递归实现快排二、快排的优化版本三、内省排序四、排序算法复杂度以及稳定性的分析总结 前言 继上一篇博客基于递归的方式学习了快速排序和归并排序 今天我们来深究快速排序,使用栈的数据结构非递归实现快排,优化快排(三路…

Spring Web开发注解和请求(1)

大家好我是小帅,今天我们来学习Spring Web MVC框架(入门级) 文章目录 1. 什么是 Spring Web MVC?1.1 MVC 定义1.2 什么是Spring MVC ? 2. 学习Spring MVC2.1 建⽴连接第一个spring MVC程序 3. web开发注解的解释3.1RestControlle…

爬虫—Scrapy 整合 ChromeDriver 实现动态网页拉取

在进行爬虫开发时,使用 Scrapy 配合 ChromeDriver 来模拟真实浏览器加载 JavaScript 渲染内容是一种常见且高效的方法。Scrapy 本身是一个非常强大的爬虫框架,然而它默认使用的是 requests 库来抓取静态网页内容。对于需要通过 JavaScript 渲染的动态网页…

剖析kubernetes service的IP能否在宿主机中ping通

文章目录 前言一、serviceIP是怎么产生的二、宿主机中ping serviceIP地址1.ping示例2.为什么ping不通剖析2.1.封装及解封装过程2.2.ICMP报文以太网数据帧格式2.3.原因 三、ping不通svcIP是否跟iptables规则有关?四、为什么ipvs的的clusterIP类型的service能够ping通…

vue项目部署到github pages后页面显示不出来??

问题: 当我们在命令行执行 npm run build 后,项目的目录下会生成一个 dist 文件夹,它里面又包含一个 static 文件夹和一个 index.html 文件,这是 webpack 最终打包好的文件 项目上传到仓库后发现页面为空,找不到文件路…

ChatGPT科研应用、论文写作、课题申报、数据分析与AI绘图

随着人工智能技术的飞速发展,ChatGPT等先进语言模型正深刻改变着科研工作的面貌。从科研灵感的激发、论文的高效撰写,到课题的成功申报,乃至复杂数据的深度分析与可视化呈现,AI技术均展现出前所未有的潜力。其实众多科研前沿工作者…

现代应用程序中基于 Cell 架构的安全防护之道

在飞速发展的软件开发领域,基于 Cell 的架构日益流行起来。其概念源自船舶舱壁的设计准则,即单独的水密舱室能允许故障孤立存在。通过将这个概念应用于软件,我们创建了一个架构,将应用程序划分为离散的、可管理的组件,…

ROS基本框架2——在ROS开发中创建并使用自定义消息(C++版本)

ROS基本框架2——在ROS开发中创建并使用自定义消息(C++版本) code review! 参考笔记 1.ROS基本框架1——编写简单的发布者和订阅者(C++和Python版本) 2.ROS基本框架2——在ROS开发中创建并使用自定义消息(C++版本) 文章目录 ROS基本框架2——在ROS开发中创建并使用自定义…

vscode远程连接ssh

一. 使用vscode里的ssh查件连不上远程的解决方法 删除Windows上的known_host文件,该文件会在连接之后自动生成,用于验证远程服务器的身份。 konwn_host和id_rsa,id_rsa.pub的关系 (1)konwn_host用于客户端验证远程服务…