[每日AI·0501]GitHub 版 Devin,Transformer的强力挑战者 Mamba,Sora 制作细节与踩坑,OpenAI 记忆功能

AI 资讯

  • 国资委:加快人工智能等新技术与制造全过程、全要素深度融合
  • GitHub版 Devin 上线,会打字就能开发应用,微软 CEO:重新定义 IDE
  • 在12个视频理解任务中,Mamba 先打败了 Transformer
  • Sora 会颠覆电影制作吗?3 人团队使用 Sora 制作短片完整技术细节&踩坑分享
  • 小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具
  • OpenAI:记忆功能现已对所有ChatGPT Plus用户开放
  • Phi-3 notebook发布,Phi的调优速度提高了2倍,且VRAM使用减少了50%
  • 使用张量并行技术进行自动驾驶感知模型训练
  • Meta 宣布在旧金山举办首届 Llama 3 黑客马拉松,与 Cerebral Valley 和 SHACK15sf 合作,提供超过1 0K 美元的现金奖励和合作伙伴积分以启动 AI 项目。这一事件强调了 Meta 在促进 AI 社区创新方面的承诺。
  • Google 推出了 Transformer 2 模型,该模型将注意力、递归、检索和前馈网络(FFN)集成到单一模块中,与原始 Transformer 的性能相当,但计算效率提高了 20 倍,并能有效处理高达 100M 上下文长度。

国资委:加快人工智能等新技术与制造全过程、全要素深度融合

报道地址
在这里插入图片描述

GitHub版 Devin 上线,会打字就能开发应用,微软CEO:重新定义 IDE

博客地址

微软的“GitHub 版 Devin” - Copilot WorkSpace,终于上线了!WorkSpace是一种“Copilot 原生”的全新开发环境,目的是让所有开发者都可以用自然语言,把脑海里的创意转化成应用。也就是说,只要有想法,而且会打字,就可以搞软件开发了。

在12个视频理解任务中,Mamba 先打败了 Transformer

论文链接 GitHub地址

探索视频理解的新境界,Mamba 模型引领计算机视觉研究新潮流!传统架构的局限已被打破,状态空间模型 Mamba 以其在长序列处理上的独特优势,为视频理解领域带来了革命性的变革。

来自南京大学、上海人工智能实验室、复旦大学、浙江大学的研究团队发布了一项开创性工作。他们全面审视了 Mamba 在视频建模中的多重角色,提出了针对 14 种模型/模块的 Video Mamba Suite,在 12 项视频理解任务中对其进行了深入评估。

结果令人振奋:Mamba 在视频专用和视频 - 语言任务中均展现出强劲的潜力,实现了效率与性能的理想平衡。这不仅是技术上的飞跃,更是对未来视频理解研究的有力推动。

Sora 会颠覆电影制作吗?3人团队使用 Sora 制作短片完整技术细节&踩坑分享

原文地址

今年2月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。

最近,被誉为「朋克摇滚皮克斯」的加拿大多媒体制作公司 Shy Kids 发布了一段借助 Sora 制作的视频短片《Air Head》,在社交媒体上迅速引起广泛关注。本周,知名视觉特效总监 Mike Seymour 采访了 Patrick Cederberg,就《Air Head》制作过程、技术难点等信息展开了提问,并在 fxguide 上发布一篇文章介绍了 Sora 在视频实际制作过程中发挥的作用和存在的问题。

小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具

原文地址

语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场。语言如何塑造我们的社会行为?我们的社会结构又是如何在不断的言语交流中演变的?近期,来自复旦大学和小红书的研究者们通过引入一种名为AgentGroupChat的模拟平台,对这些问题进行了深入探讨。

OpenAI:记忆功能现已对所有 ChatGPT Plus 用户开放

推特地址

记忆功能现已对所有 ChatGPT Plus 用户开放。使用记忆功能很简单:只需开始新的聊天并告诉 ChatGPT 您希望它记住的任何内容。

记忆功能可以在设置中开启或关闭,并且目前在欧洲或韩国不可用。团队、企业版和未来的 GPT 产品将陆续推出。

Phi-3 notebook 发布,Phi 的调优速度提高了 2 倍,且VRAM使用减少了50%

推特地址 模型地址

Phi-3 notebook 发布了!使用 @UnslothAI,相比于 HF+FA2,Phi 的调优速度提高了 2 倍,且 VRAM 使用减少了 50%!

由于采用了滑动窗口注意力机制,不得不对其进行 Mistral 化,并修复了 2048/2047 的 SWA(滑动窗口注意力)错误。还解除了注意力机制与 MLP(多层感知机)的融合,因此 QLoRA 损失有所不同,但 16 位的表现相同。

NVIDIA 与蔚来联合研究:使用张量并行技术进行自动驾驶感知模型训练

原文地址

文章探讨了 NVIDIA 与蔚来合作,利用张量并行技术优化自动驾驶感知模型的 GPU 内存使用。通过分片处理卷积神经网络(CNN)的输入和中间激活值,将它们均匀分配到多个 GPU 上,显著降低了对单个 GPU 的内存占用。

此外,文章详述了在 PyTorch 2.0 中使用 DTensor 实现张量并行的细节,包括模型参数和优化器状态的处理方式,以及卷积操作中必要的数据交换和通信。这种方法不仅提高了 GPU 的利用率,还允许使用更深的模型和更高的分辨率输入,从而提升自动驾驶感知模型的精度和训练效率。

产品投资

「星元AI」获数千万天使轮投资

近日,星元先创网络有限责任公司旗下产品「星元AI」完成了数千万的天使轮融资,此次成功融资为星元先创的发展注入新的活力,本轮资金将重点投向星元先创旗下系统升级和市场推广,为广大服务商提供更多机会。

对于星元先创而言,意味着有望将领先的数字化营销系统和人工智能领域的成就在现有基础上再上新台阶,增强核心竞争力,迅速扩大新兴市场的市场份额;合作也标志着星元先创进一步强化“人工智能+营销系统”的战略,星元先创将加速产品升级和业务全国布局。

微软宣布在印尼的云计算和 AI 领域投资 17 亿美元

官方报道

微软计划在接下来的四年内在印尼投资17亿美元,用于新的云计算和人工智能(AI)基础设施,以及为84万人提供AI技能培训,并支持该国日益增长的开发者社区。这是微软在印尼29年历史中的最大单笔投资。此举旨在帮助实现印尼政府的“2045年黄金印尼愿景”,该愿景旨在将印尼转变为全球经济强国。


我的本博客原地址:https://ntopic.cn/p/ai20240501


微信公众号:Python禅师

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/6373.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Oracle 23c? No Oracle 23ai

昨天 Oracle 发布了最新的Oracle版本。出乎意料的是这个版本从Oracle 23c 更名为 Oracle 23ai ,似乎预示着Oracle的掌舵人Larry也要全面拥抱AI技术浪潮了。 23ai版本主要功能介绍: Oracle Database 23ai 是 Oracle 数据库的下一个长期支持版本。它包括 300 多项新功…

【LeetCode刷题】410. 分割数组的最大值

1. 题目链接2. 题目描述3. 解题方法4. 代码 1. 题目链接 410. 分割数组的最大值 2. 题目描述 3. 解题方法 题目中提到的是某个和的最大值是最小的,这种题目是可以用二分来解决的。 确定区间,根据题目的数据范围,可以确定区间就是[0, 1e9]…

LEETCODE LCR 041. 数据流中的移动平均值

class MovingAverage:def __init__(self, size: int):"""Initialize your data structure here."""self.sizesize1self.front0self.rear0self.queue[None for _ in range(size1)]self.sum0def next(self, val: int) -> float:# 满了if (self.…

postman中百度preview无法加载的解决方案

问题 在使用postman关联时,百度接口与天气接口已使用glb_city关联,但在百度接口发送请求时,发现preview无法加载 解决方案 1、进入百度 百度全球领先的中文搜索引擎、致力于让网民更便捷地获取信息,找到所求。百度超过千亿的中…

LeetCode面试298,二叉树最长连续序列(Python)

开始想着dfs,两种情况 1.以root为根 2.不以root为根 但是这样需要两个dfs分别进行,那么时间复杂度就上去了。 class Solution:def longestConsecutive(self, root: Optional[TreeNode]) -> int:def dfs(root):# 以root为根节点,可以延…

leetCode68. 文本左右对齐

基本思路&#xff1a; leetCode68. 文本左右对齐 代码 class Solution { public:vector<string> fullJustify(vector<string>& words, int maxWidth) {vector<string> res;for(int i 0; i < words.size(); i){ // 枚举有多少个单词int j i 1; //…

MATLAB中自定义栅格数据地理坐标R,利用geotifwrite写入tif

场景描述&#xff1a; 有时候将nc格式的数据转成tiff&#xff0c;或者是将一个矩阵输出成带有地理坐标信息tiff数据时&#xff0c;常常涉及到空间参考的定义和geotiffwrite()函数。 问题描述&#xff1a; 以全球数据为例&#xff0c;今天发现在matlab中对矩阵进行显示后&…

苹果可能将OpenAI技术集成至iOS/iPadOS 18

&#x1f989; AI新闻 &#x1f680; 苹果可能将OpenAI技术集成至iOS/iPadOS 18 摘要&#xff1a;苹果正在与OpenAI就将GPT技术部署在iOS/iPadOS 18中进行谈判。这项技术被视为可能增强的Siri功能&#xff0c;即“AI聊天机器人”。除Siri外&#xff0c;新技术还可能改善Spotl…

IDEA2024版本控制台乱码怎么解决?

在使用最新版本的IDEA时&#xff0c;可能会遇到控制台输出乱码问题&#xff1f; 在网上找了很多办法&#xff0c;修改了IDEA的vmoptions文件也没有用,最后发现原来是要修改这里 Setting>>Build&#xff0c;Execution,Deployment>>Runnr中的VM Options配置&#xf…

# IDEA 复制项目 Module 出现 不同模块下的 Product 类报错

IDEA 复制项目 Module 出现 不同模块下的 Product 类报错 我们 用 IDEA 复制项目 Module 出现 不同模块下的 Product 类报错&#xff0c;发现复制的 module 名称没有改变或者 java 文件夹后面还有原项目 source root 字样&#xff0c;maven 父子项目没有标识等问题。 解决方法…

.360勒索病毒的威胁:如何恢复您的数据?

引言&#xff1a; 近年来&#xff0c;网络安全威胁层出不穷&#xff0c;其中.360勒索病毒以其独特的攻击方式和广泛的传播能力&#xff0c;成为了众多企业和个人面临的重大挑战。本文将对.360勒索病毒进行深入剖析&#xff0c;并探讨应对此类病毒的有效策略&#xff0c;以帮助…

web3风格的网页怎么设计?分享几个,找找感觉。

web3风格的网站是指基于区块链技术和去中心化理念的网站设计风格。这种设计风格强调开放性、透明性和用户自治&#xff0c;体现了Web3的核心价值观。 以下是一些常见的Web3风格网站设计元素&#xff1a; 去中心化标志&#xff1a;在网站的设计中使用去中心化的标志&#xff0…

改变视觉创造力:图像合成中基于样式的生成架构的影响和创新

原文地址&#xff1a;revolutionizing-visual-creativity-the-impact-and-innovations-of-style-based-generative 2024 年 4 月 30 日 介绍 基于风格的生成架构已经开辟了一个利基市场&#xff0c;它将机器学习的技术严谨性与类人创造力的微妙表现力融为一体。这一发展的核…

C语言——文件相关操作

2.什么是文件 3.文件的打开和关闭 4.文件的顺序读写 5.文件的随机读写 6.文本文件和二进制文件 7.文件读取结束的判定 8.文件缓冲区 一、文件相关介绍 1、为什么使用文件 文件用于永久存储数据。通过使用文件&#xff0c;我们可以在程序关闭后保存数据&#xff0c;以便将来…

手机恢复出厂设置ip地址会变吗

当我们对手机进行恢复出厂设置时&#xff0c;很多人会担心手机的IP地址是否会发生变化。IP地址对于手机的网络连接至关重要&#xff0c;它决定了手机在网络中的身份和位置。那么&#xff0c;手机恢复出厂设置后&#xff0c;IP地址到底会不会发生变化呢&#xff1f;虎观代理小二…

AI-数学-高中53-离散型随机变量的均值与方差

原作者视频&#xff1a;【随机变量】【一数辞典】3离散型随机变量的均值与方差_哔哩哔哩_bilibili 标准差 方差开根

加州大学欧文分校英语中级语法专项课程03:Tricky English Grammar 学习笔记

Tricky English Grammar Course Certificate Course Intro 本文是学习 https://www.coursera.org/learn/tricky-english-grammar?specializationintermediate-grammar 这门课的学习笔记 文章目录 Tricky English GrammarWeek 01: Nouns, Articles, and QuantifiersLearning …

17、ESP32 SPI

SPI 概述 SPI&#xff08;Serial Peripheral Interface&#xff09;协议&#xff0c;即串行外围设备接口&#xff0c;采用一主多从的全双工通信总线。被广泛使用在要求通讯速率较高的场合。 SPI 通信需要四条信号线&#xff1a; MISO&#xff1a; 主器件数据输入&#xff0c;从…

基于SSM SpringBoot vue教务排课系统

基于SSM SpringBoot vue教务排课系统 系统功能 登录 个人中心 学生信息管理 教师信息管理 课室信息管理 班级信息管理 系别信息管理 专业信息管理 课程信息管理 选课信息管理 课表信息管理 开发环境和技术 开发语言&#xff1a;Java 使用框架: SSM(Spring SpringMVC Myba…

【网络原理】UDP协议 | UDP报文格式 | 校验和 | UDP的特点 | 应用层的自定义格式

文章目录 一、UDP协议1.UDP的传输流程发送方接收方 2.UDP协议报文格式&#xff1a;长度受限校验和如何校验&#xff1a;CRC算法&#xff1a;循环冗余算法md5算法&#xff1a; 2.UDP的特点 二、开发中常见的自定义格式1.xml&#xff08;古老&#xff09;2.json&#xff08;最流行…