免注册,ChatGPT可即时访问了!

AI又有啥进展?一起看看吧

Apple进军个人家用机器人

Apple在放弃自动驾驶汽车项目并推出混合现实头显后,正在进军个人机器人领域,处于开发家用环境机器人的早期阶段

报告中提到了两种可能的机器人设计。一种是移动机器人,可以跟随用户在房子里四处走动。另一种是固定式机器人,配备屏幕,可以在视频通话时模仿人的头部动作。苹果还考虑长期内推出用于家务劳动的机器人

https://the-decoder.com/apple-sets-its-sights-on-personal-robots-as-next-frontier-after-vision-pro-debut/

SWE-agent:93秒内解决GitHub问题的AI编码器

普林斯顿大学的研究人员开发了SWE-agent,能够将诸如GPT-4之类的语言模型转化为自主软件工程代理。SWE-agent能够在93秒内识别并修复真实世界GitHub仓库中的漏洞和问题!它通过与一个专用的终端进行交互来实现这一目标,该终端允许它打开、滚动和搜索文件,使用自动语法检查编辑特定行,编写和执行测试

在SWE-Bench基准测试中,SWE-agent解决了呈现问题的12.29%,几乎与Cognition AI开发的闭源2100万美元商业AI程序员Devin所达到的13.86%相匹配

https://swe-agent.com/

Stability AI的Stable Audio 2.0来了

Stability AI发布了Stable Audio 2.0,这是一款全新的AI模型,能够生成高质量、全长度的音频轨道。基于其前身,最新模型引入了三项突破性功能:

  • 能够生成长达3分钟的音轨,具有连贯的音乐结构

  • 启用音频到音频的生成功能,允许用户使用自然语言提示转换上传的样本

  • 增强音效生成和风格迁移能力,为艺术家提供更大的灵活性和控制力

Stable Audio 2.0的架构结合了高度压缩的自编码器(autoencoder)和扩散转换器(diffusion transformer,DiT),以生成具有连贯结构的完整音轨。自编码器将原始音频波形压缩成更短的表示形式,捕获关键特征,而DiT则擅长在长序列上操作数据


https://stability.ai/news/stable-audio-2-0

马斯克认为AI可能毁灭人类,但值得冒险

在Abundance Summit的AI辩论研讨会上,马斯克分享了他对AI潜在危险的看法,他估计AI可能对人类构成生存威胁的可能性为10-20%

尽管存在风险,但马斯克认为AI的好处超过了潜在的危险。他强调教会AI保持真实和好奇的重要性,尽管没有具体说明他是如何得出风险评估结论的

https://www.indiatoday.in/technology/news/story/elon-musk-says-there-is-around-10-to-20-percent-chances-of-ai-destroying-humanity-2521670-2024-04-01

OpenAI推出即时访问ChatGPT功能

OpenAI 现在允许用户无需创建账户即可使用 ChatGPT。每周的用户超过 1 亿,遍布 185 个国家,现在任何对其功能好奇的人都可以立即访问它

虽然此举使AI更加易于访问,但OpenAI的其他产品,如DALL-E 3,仍然需要用户创建账户。此外,该公司还引入了新的内容保护措施,并允许用户选择不参与模型训练,即使他们没有账户也可以这样做

https://openai.com/blog/start-using-chatgpt-instantly

Siri能理解用户屏幕上的内容

苹果研究人员开发了一个名为ReALM的AI系统,该系统能够让Siri等语音助手理解屏幕上元素的上下文引用。通过将复杂的引用解析任务转化为语言建模问题,ReALM在理解模糊引用和上下文方面甚至超过了GPT-4

这项创新的关键在于使用解析后的屏幕实体及其位置重建屏幕,以生成能够捕捉视觉布局的文本表示。这种方法与专门用于引用解析的语言模型的微调相结合,使ReALM实现了显著的性能提升

https://arxiv.org/pdf/2403.20329.pdf

微软与OpenAI计划斥资1000亿美元打造超级计算机

微软和OpenAI计划建造一台价值高达1000亿美元的超级计算机“星际之门”(Stargate),以快速推进OpenAI的AI模型开发。知情人士透露,该项目将于2028年启动,2030年完成扩展,将成为计算史上最大的投资之一

Stargate的大部分成本将用于采购数百万个专用AI芯片,资金主要来自微软。同时,微软还计划于2026年推出一个规模较小的价值100亿美元的前置项目“第四阶段”。是否继续推进Stargate项目,将在很大程度上取决于OpenAI在AI能力方面取得的显著进步

https://www.theinformation.com/articles/microsoft-and-openai-plot-100-billion-stargate-ai-supercomputer

OpenAI最新技术仅需15秒即可克隆你的声音

OpenAI最新技术——Voice Engine已经初露端倪,这款AI模型仅需15秒的音频样本和文本输入,即可生成令人惊叹的逼真声音克隆。这项技术能够复制原始说话者的声音,为改进教育材料提供了可能性

尽管该模型具有多种应用,但公司对其可能的滥用保持警惕,尤其是在敏感时期。他们为合作伙伴制定了严格的规则,包括禁止未经授权的冒充行为、对合成声音进行明确标注,以及采取水印和监控等技术措施

https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

Cohere推出“企业最强大的LLM”

Cohere宣布推出其迄今为止最强大且可扩展的LLM——Command R+。这款模型专为企业用例设计,拥有几大关键功能:

  • 先进的检索增强生成(RAG)功能,能够访问和处理大量信息,提高响应的准确性和可靠性

  • 支持十种商业语言,确保在全球组织中的无缝运行

  • 通过与各种软件工具的交互实现复杂工作流程的自动化

此外,Command R+在关键指标上表现优于其他可扩展模型,同时以更低的成本提供强大的准确性


该LLM现已通过Cohere的API提供,并可以部署在包括Microsoft Azure和Oracle Cloud Infrastructure在内的各种云平台上

https://txt.cohere.com/command-r-plus-microsoft-azure/

Higgsfield用AI颠覆视频营销

前Snap AI首席Alex Mashrabov推出了名为Higgsfield AI的新创业公司,旨在让创作者和营销人员能够轻松使用AI驱动的视频创作。该公司的首款应用Diffuse允许用户根据文本描述生成原创视频片段,或编辑现有视频以将自己插入场景中

Higgsfield正在与Sora视频生成器竞争,凭借其移动端、用户友好的工具,它的目标受众更为广泛。尽管有关数据使用和滥用可能性的问题仍然存在,但Higgsfield相信,凭借其逼真且易于使用的视频生成功能,它能在社交媒体营销领域开辟一片天地

https://techcrunch.com/2024/04/03/former-snap-ai-chief-launches-higgsfield-to-take-on-openais-sora-video-generator/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/796265.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

鸿蒙OS元服务开发:【(Stage模型)学习窗口沉浸式能力】

一、体验窗口沉浸式能力说明 在看视频、玩游戏等场景下,用户往往希望隐藏状态栏、导航栏等不必要的系统窗口,从而获得更佳的沉浸式体验。此时可以借助窗口沉浸式能力(窗口沉浸式能力都是针对应用主窗口而言的),达到预…

二叉堆解读

在数据结构和算法中,二叉堆是一种非常重要的数据结构,它被广泛用于实现优先队列、堆排序等场景。本文将介绍二叉堆的基本概念、性质、操作以及应用场景。 一、基本概念 二叉堆是一种特殊的完全二叉树,它满足堆性质:对于每个节点…

电子商务平台中大数据的应用|主流电商平台大数据采集API接口

(一)电商平台物流管理中大数据的应用 电商平台订单详情订单列表物流信息API接口应用 电子商务企业对射频识别设备、条形码扫描设备、全球定位系统及销售网站、交通、库存等管理软件数据进行实时或近实时的分析研究,提高物流速度和准确性。部分电商平台已建立高效的物流配送网…

【STL】vector的底层原理及其实现

vector的介绍 vector是一个可变的数组序列容器。 1.vector的底层实际上就是一个数组。因此vector也可以采用连续存储空间来存储元素。也可以直接用下标访问vector的元素。我们完全可以把它就当成一个自定义类型的数组使用。 2.除了可以直接用下标访问元素,vector还…

掌握数据相关性新利器:基于R、Python的Copula变量相关性分析及AI大模型应用探索

在工程、水文和金融等各学科的研究中,总是会遇到很多变量,研究这些相互纠缠的变量间的相关关系是各学科的研究的重点。虽然皮尔逊相关、秩相关等相关系数提供了变量间相关关系的粗略结果,但这些系数都存在着无法克服的困难。例如,…

解决win7作为虚拟机无法复制粘贴共享文件的问题

win7作为虚拟机经常会出现无法与主机的剪切板共享、文件共享。 归根结底是win7虚拟机里面没有安装VMware Tools 能够成功安装vmware tools的条件: 1)win7版本为win7 sp1及以上 2)安装KB4490628,KB4474419补丁 因此下面来详细介绍…

【LeetCode题解】2192. 有向无环图中一个节点的所有祖先+1026. 节点与其祖先之间的最大差值

文章目录 [2192. 有向无环图中一个节点的所有祖先](https://leetcode.cn/problems/all-ancestors-of-a-node-in-a-directed-acyclic-graph/)思路:BFS记忆化搜索代码: 思路:逆向DFS代码: [1026. 节点与其祖先之间的最大差值](https…

为什么说AI的尽头是生物制药?

AI的尽头究竟是什么?有投资者说是光伏,也有投资者说是电力,而英伟达给出的答案则是生物制药。 在英伟达2023年投资版图中,除AI产业根基算法与基础建设外,生物制药是其重点布局的核心赛道。英伟达医疗保健副总裁Kimber…

FastEI论文阅读

前言 研究FastEI(Ultra-fast and accurate electron ionization mass spectrum matching for compound identification with million-scale in-silico library)有很长时间了,现在来总结一下,梳理一下认知。PS:为什么要…

【LeetCode: 21. 合并两个有序链表 + 链表】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

axios快速入门

一、环境配置 1.1概述 上古浏览器页面在向服务器请求数据时,因为返回的是整个页面的数据,页面都会强制刷新一下,这对于用户来讲并不是很友好。并且我们只是需要修改页面的部分数据,但是从服务器端发送的却是整个页面的数据&#…

攻防世界 Broadcast 题目解析

Broadcast 一:题目 二:解析 将压缩包解压,得到如上图所示,打开task.py,之后得到flag 这个有点简单了,不要被解压后文件太多所迷惑。

InnoDB中的索引方案

文章目录 InnoDB中的索引方案 InnoDB支持多种类型的索引,包括B-tree索引、全文索引、哈希索引等。B-tree索引是InnoDB存储引擎的默认索引类型,适用于所有的数据类型,包括字符串、数字和日期等。 以下是创建InnoDB表及其B-tree索引的示例代码…

VBA数据库解决方案第九讲:把数据库的内容在工作表中显示

《VBA数据库解决方案》教程(版权10090845)是我推出的第二套教程,目前已经是第二版修订了。这套教程定位于中级,是学完字典后的另一个专题讲解。数据库是数据处理的利器,教程中详细介绍了利用ADO连接ACCDB和EXCEL的方法…

2024年阿里云4核8G服务器多少钱一年?4C8G服务器955元

阿里云服务器4核8G租用优惠价格955元一年,配置为云服务器ECS通用算力型u1实例4核8G配置、ESSD Entry盘20G-40G、1M-3M带宽,实例规格为ecs.u1-c1m2.xlarge,阿里云优惠活动 yunfuwuqiba.com/go/aliyun 活动链接打开如下图: 阿里云4核…

【数据结构】ArrayList详解

目录 前言 1. 线性表 2. 顺序表 3. ArrayList的介绍和使用 3.1 语法格式 3.2 添加元素 3.3 删除元素 3.4 截取部分arrayList 3.5 其他方法 4. ArrayList的遍历 5.ArrayList的扩容机制 6. ArrayList的优缺点 结语 前言 在集合框架中,ArrayList就是一个…

spring boot学习第十六篇:配置多数据源

1、代码参考: dynamic-ds/spring-boot-dynamic-ds at main veminhe/dynamic-ds GitHub 2、验证 2.1调用POST接口http://localhost:8081/hmblogs/blog/addBlog 2.2改动数据源为BJ 然后调用接口添加数据 然后查看ds0库的博客数据

【最新可用】Claude国内镜像,可上传图片,可用Claude3全系模型(包括Pro版本的Opus)!亲测比GPT好用!

亲测可用,镜像地址:Claude 3 镜像 使用方法 访问镜像:Claude 3 镜像 2. 点击设置,配置授权码,关闭设置。这里免费赠送一个体验版的授权码 sk-SZcJyvx3RXRID624E2D3795578Df44C7Af03F2909a8f5eA0 即可发起对话啦&…

Android Studio学习9——使用Logcat打印日志

在Android开发中,Logcat是一个工具,它允许开发者查看设备或模拟器的日志信息。开发者可以使用Log类来打印日志信息,这对于调试和错误排查非常有帮助。 v 或 verbose: 最低等级,显示所有消息。d 或 debug: 用于调试消息。i 或 info…

深入浅出 -- 系统架构之负载均衡Nginx动静分离

一、Nginx动静分离 动静分离应该是听的次数较多的性能优化方案,那先思考一个问题:为什么需要做动静分离呢?它带来的好处是什么? 其实这个问题也并不难回答,当你搞懂了网站的本质后,自然就理解了动静分离的重…