Meta AR 眼镜团队前负责人加入 OpenAI;visionOS 2.2 Beta 引入超宽屏投屏模式丨 RTE 开发者日报

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement)领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的数据」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@SSN,@鲍勃

01有话题的新闻

1、visionOS 2.2 Beta 引入超宽屏投屏模式

在这里插入图片描述

近日,苹果在其 Vision Pro 头显的 visionOS 2.2 Beta 最新系统版本中推出了 Mac 投屏的宽屏及超宽屏模式。然而,这些新模式需要搭载最新的 macOS 15.2 Beta 系统,无法在 macOS 15.1 上运行。

据悉,Vision Pro 头显自推出以来,就具备将物理 Mac 屏幕替换为巨大虚拟显示屏的功能。用户只需看向 MacBook 并点击浮动虚拟按钮,或在台式 Mac 上使用控制中心,即可轻松连接。

该系统能够迅速在头显与 Mac 之间建立直接的无线连接,无需依赖 Wi-Fi 网络,带来了高质量、低延迟的体验。

此前,Mac 虚拟显示仅限于 16:9 的宽屏模式。但随着 visionOS 2.2 的推出,用户现在可以选择宽屏、超宽屏甚至全景沉浸的超宽显示模式。所有三种模式下,Mac 虚拟显示屏都呈现出轻微的弧度,提供更具包围感的观看体验。

苹果表示,超宽的 Mac 虚拟显示屏具有 8K 的水平分辨率,相当于将两个 4K 显示器并排放置,这得益于眼动追踪技术的支持。

此外,visionOS 2.2 还优化了音频路由功能,现在 Mac 的音频可以直接传输到 Vision Pro 播放。这一改进使得用户在享受巨大虚拟显示屏的同时,也能获得更加沉浸式的音频体验。

与 Meta 和微软等竞争对手的 PC 显示扩展方式相比,苹果的宽屏与超宽屏模式提供了不同的体验。Meta Quest 及其 Immersed 和 Virtual Desktop 等第三方应用上,用户可以虚拟添加多个侧边显示器,但这些虚拟显示器与物理显示器之间通常保留间隙。

相较而言,而苹果则通过单一扩展显示屏覆盖整个宽屏区域,无需任何显示间隙,实现了一体化的视觉体验。(@新浪 VR)

2、超快速文本转语音模型 Lightning:超低延迟, 100 毫秒生成 10 秒音频

在这里插入图片描述

近日,总部位于美国加州旧金山的 AI 初创公司 smallest.ai 推出了其新产品 Lightning,一款能够在 100 毫秒内生成长达 10 秒音频的文本转语音(TTS)模型。此项技术的进步,使得全球开发者能够构建高仿真度的语音机器人应用,且延迟时间极短,降低了实施成本,提高了应用的可及性。

Lightning 目前支持英语和印地语的多种口音,团队还计划迅速添加更多语言,以满足市场需求。这款模型的定价为每分钟仅需 0.02 美元(约 1.6 印度卢比),为语音机器人开发者提供了一种极具成本效益的解决方案,应用的运行成本可控制在每分钟 1 卢比以下,大幅降低了语音机器人构建的费用,同时扩大了市场的可达性。

与传统的 TTS 模型依赖流媒体和网络套接字,增加服务器负担和复杂的可扩展性不同,Lightning 通过简单的 REST API 设计,使音频在大约 100 毫秒内交付,避免了持续流媒体带来的服务器压力。这种快速的处理能力和成本效率,使其在语音机器人行业中成为一个显著的替代选择。

smallest.ai 由印度理工学院古瓦哈提校友 Sudarshan Kamath 和 Akshat Mandloi 创立。Kamath 表示,smallest.ai 的低价策略得益于他们对数据质量和模型效率的关注。「我们的模型比竞争对手如 ElevenLabs 的小得多,但我们通过高度精炼的数据实现了高质量的语音输出。」 他解释道。

早期获得 Lightning 使用权的语音机器人开发者报告称,他们的运营成本降低了 8 倍,同时音频质量得到了提升。除了实时的语音机器人应用,Lightning 还可以用于制作有声书和社交媒体内容的配音,如 Instagram 和 YouTube 等平台。非开发者也可以通过 Waves Speech 平台访问 Lightning,体验包括声音克隆和口音转换等功能,这些功能目前处于测试阶段。(@AIbase 基地)

3、Meta 公司 AR 眼镜团队前负责人宣布加入 OpenAI

11 月 5 日消息,Meta 前增强现实眼镜项目负责人凯特琳・卡利诺夫斯基(Caitlin Kalinowski)周一在 LinkedIn 上宣布,她将加入 OpenAI,领导机器人和消费硬件部门。

卡利诺夫斯基是一位资深的硬件主管,自 2022 年 3 月起领导 Meta 的 AR 眼镜团队。她监督了 Orion 的开发,这是一款增强现实眼镜原型,Meta 此前在年度 Connect 大会上展示了这款产品。卡利诺夫斯基还领导了 Meta 虚拟现实头显的硬件团队近九年。在此之前,她曾在苹果工作,设计 MacBook 的硬件。

「我很高兴分享,我将加入 OpenAI 领导机器人和消费硬件部门,」卡利诺夫斯基在她的帖子中说,「在我的新角色中,我将最初专注于 OpenAI 的机器人工作和合作伙伴关系,以帮助将 AI 引入物理世界并为人类解锁其潜力。」(@极客公园)

4、腾讯开源最大 MoE 大语言模型

11 月 5 日消息,腾讯宣布开源 MoE 大语言模型混元 Large、腾讯混元 3D 生成模型 Hunyuan3D-1.0 正式开源,并全面披露腾讯混元的全系列多尺寸模型、C 端应用、B 端应用版图

腾讯称混元 Large 是业界参数规模最大、效果最好的开源 MoE 大语言模型,采用 7T 训练 tokens,总参数量 389B,激活参数量 52B,上下文长度高达 256K,技术报告也同步发布。混元-Large 包括三款模型:Hunyuan-A52B-Pretrain,Hunyuan-A52B-Instruct 和 Hunyuan-A52B-FP8。

与有相似激活参数量的业界开源模型 Llama3.1-405B、Mixtral-8x22B 等相比,在多学科综合评测集、中英文 NLP 任务、代码、数学等 9 大维度,混元 Large 都实现领先。(@极客公园)

5、消息称苹果已进军智能眼镜市场,启动代号 Atlas 项目

据知情人士透露,苹果上周悄然启动了一项名为 Atlas 的内部研究项目,该项目主要聚焦于智能眼镜的开发。

为了深入了解员工对于智能眼镜的看法,苹果上周还特意收集了相关反馈,并通过电子邮件向部分选定员工确认了这一产品研究方向。

据了解,苹果在计划推出新品类产品时,通常会组建秘密小组,并倾向于收集内部员工的反馈,以保持项目的保密性。这一做法再次印证了苹果有意推进开发自有智能眼镜的传闻,而此次 Atlas 项目正是由苹果硬件工程部门的产品系统质量团队所领导。

今年 2 月,苹果发布的 Vision Pro 头显因其高达 3499 美元的售价和笨重的外观,被市场认为难以成为主流产品。然而,苹果并未放弃在这一领域的探索,多年来一直在寻求制造一款更轻便、可全天佩戴的 AR 设备,甚至期望其能够取代 iPhone。然而,由于技术上的诸多挑战,苹果在这一项目上的进展并不顺利。与此同时,Meta 通过更精简的公式取得了成功。

面对 Meta 的成功,苹果也在调整策略,寻求创造类似的产品。据推测,苹果可能会借鉴其已经广受欢迎的 AirPods 耳机的成功经验,制造一款智能眼镜。这款眼镜预计将拥有更长的电池寿命、先进的传感器和改进的音频技术,以满足用户对便携性和实用性的需求。

尽管苹果方面尚未就此事发表评论,但种种迹象表明,苹果对于智能眼镜市场的兴趣浓厚,并正在积极投入研发资源。未来,随着 Atlas 项目的深入进行,我们或许能够见证苹果在智能眼镜领域的创新与突破。(@新浪 VR)

02有态度的观点

1、吴恩达对谈斯坦福计算机系主任:生成式 AI 可赋能编程,但基础编程知识及编程思维仍值得学习与培养

Andrew Ng(吴恩达)与斯坦福大学工程学院的计算机科学系主任 Mehran Sahami 在一次演讲访谈中谈到了对生成式 AI 对编程和软件开发职业的影响、计算机科学教育的重要性,以及领域知识在 AI 应用中的关键作用。

他们认为,生成式 AI 正在加速软件开发的速度,一方面帮助有经验的开发者提高效率,另一方面也让没有太多编程经验的人能够快速进入软件工程领域。这种技术使得编写复杂程序变得更加可行,从而吸引了更多人参与软件工程。因此,整个领域的速度在加快,开发出的软件也越来越多。

此外,他们强调了计算机科学教育的必要性。尽管生成式 AI 能够帮助生成代码,但基础的计算机科学技能仍然至关重要。学生需要理解编程的基本概念、算法和数据结构,以便能够评估和优化生成的代码。教育应注重培养学生的计算思维,即如何系统地分解问题并解决问题,而不仅仅是教授编程语言的语法。

计算机科学推动的快速节奏正在给许多其他行业带来压力。生成式 AI 让团队能更快地完成任务,也可能会改变许多行业的工作模式。AI 作为一种新技术,能够提高生产力,但如何利用这些生产力的提升仍然是人类的决策。AI 的应用与特定领域的知识相结合,能够创造出更具价值的应用。(@ Z potentials)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

在这里插入图片描述

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/59315.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何对LabVIEW软件进行性能评估?

对LabVIEW软件进行性能评估,可以从以下几个方面着手,通过定量与定性分析,全面了解软件在实际应用中的表现。这些评估方法适用于确保LabVIEW程序的运行效率、稳定性和可维护性。 一、响应时间和执行效率 时间戳测量:使用LabVIEW的时…

鸢尾博客项目开源

1.博客介绍 鸢尾博客是一个基于Spring BootVue3 TypeScript ViteJavaFx的客户端和服务器端的博客系统。项目采用前端与后端分离,支持移动端自适应,配有完备的前台和后台管理功能。后端使用Sa-Token进行权限管理,支持动态菜单权限,服务健康…

拾光云影 3.3.0 | 高清秒播电视直播,支持IPV4,几千频道

拾光云影是一款Ipv4通用版电视直播APP,界面熟悉但有所改进,操作布局类似TVbox。新增了功能按钮页,提供更多功能。频道清晰,加载速度快,支持港澳台等特殊频道,大部分频道均可秒播。软件内置了直播接口&#…

【HTML】——VSCode 基本使用入门和常见操作

阿华代码,不是逆风,就是我疯 你们的点赞收藏是我前进最大的动力!! 希望本文内容能够帮助到你!! 目录 零:HTML开发工具VSCode的使用 1:创建项目 2:创建格式模板&#x…

Redis数据库测试和缓存穿透、雪崩、击穿

Redis数据库测试实验 实验要求 1.新建一张user表,在表内插入10000条数据。 2.①通过jdbc查询这10000条数据,记录查询时间。 ②通过redis查询这10000条数据,记录查询时间。 3.①再次查询这一万条数据,要求根据年龄进行排序&#…

zabbix 7.0 安装(服务器、前端、代理等)

https://www.zabbix.com/download 使用上面的地址,按教程执行命令安装

andrular输入框input监听值传递

效果图&#xff1a; step1: E:\projectgood\ajnine\untitled4\src\app\apple\apple.component.html <button mat-button (click)“openDialog()”>Open dialog step2: E:\projectgood\ajnine\untitled4\src\app\apple\apple.component.ts import {Component, inject}…

考公人数攀升?地信、测绘、地质、遥感等专业,能报考哪些单位

近年来&#xff0c;考公人数持续飙升&#xff0c;国考报名人数更逐年攀升。2025年国家公务员考试共有341.6万人通过资格审查&#xff0c;报录比达86:1。国考报名人数再创新高。 国家公务员考试时间安排 地理学相关岗位分析 地信属于地理科学类&#xff0c;测绘类中不包括地信&…

Pr 视频效果:超级键

视频效果/键控/超级键 Keying/Ultra Key 超级键 Ultra Key效果是 Premiere Pro 中功能强大的抠像工具&#xff0c;主要用于绿幕/蓝幕抠像。通过选择要抠除的颜色&#xff08;通常是绿幕或蓝幕的颜色&#xff09;&#xff0c;即可以将该颜色的像素设为透明&#xff0c;实现主体与…

24-11-1-读书笔记(三十一)-《契诃夫文集》(五)下([俄] 契诃夫 [译] 汝龙)生活乏味但不乏魅力。

文章目录 《契诃夫文集》&#xff08;五&#xff09;下&#xff08;[俄] 契诃夫 [译] 汝龙&#xff09;生活乏味但不乏魅力。目录阅读笔记总结 《契诃夫文集》&#xff08;五&#xff09;下&#xff08;[俄] 契诃夫 [译] 汝龙&#xff09;生活乏味但不乏魅力。 休息&#xff0c…

戴尔电脑 Bios 如何进入?Dell Bios 进入 Bios 快捷键是什么?

BIOS&#xff08;基本输入输出系统&#xff09;是计算机启动时运行的第一个程序&#xff0c;它负责初始化硬件并加载操作系统。对于戴尔电脑用户来说&#xff0c;有时可能需要进入 BIOS 进行一些特定的设置调整&#xff0c;比如更改启动顺序、调整性能选项或解决硬件兼容性问题…

【C++】内存管理(二):operator new/delete

大家好&#xff0c;我是苏貝&#xff0c;本篇博客带大家了解C的operator new/delete&#xff0c;如果你觉得我写的还不错的话&#xff0c;可以给我一个赞&#x1f44d;吗&#xff0c;感谢❤️ 目录 1 new/delete的底层2 new/delete的底层调用顺序3 delete[ ]调用析构函数的次数…

acmessl.cn提供接口API方式申请免费ssl证书

目录 一、前沿 二、API接口文档 1、证书可申请列表 简要描述 请求URL 请求方式 返回参数说明 备注 2、证书申请 简要描述 请求URL 请求方式 业务参数 返回示例 返回参数说明 备注 3、证书查询 简要描述 请求URL 请求方式 业务参数 返回参数说明 备注 4、证…

【docker】docker 环境配置及安装

本文介绍基于 官方存储库 docker 的环境配置、安装、代理配置、卸载等相关内容。 官方安装文档说明&#xff1a;https://docs.docker.com/engine/install/ubuntu/ 虚拟机环境 Ubuntu 20.04.6 LTS 安装步骤 添加相关依赖 sudo apt-get update sudo apt-get install ca-certifi…

机器学习在时间序列预测中的应用与实现——以电力负荷预测为例(附代码)

&#x1f4dd;个人主页&#x1f339;&#xff1a;一ge科研小菜鸡-CSDN博客 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; 1. 引言 随着数据采集技术的发展&#xff0c;时间序列数据在各个领域中的应用越来越广泛。时间序列预测旨在基于过去的时间数据来…

uniapp+vue加油服务系统 微信小程序

文章目录 项目介绍具体实现截图技术介绍mvc设计模式小程序框架以及目录结构介绍错误处理和异常处理java类核心代码部分展示详细视频演示源码获取 项目介绍 基于微信小程序的加油服务系统设计为微信小程序和后台管理两个服务端&#xff0c;并对此设计相应的功能模块如下&#x…

大数据新视界 -- 大数据大厂之 Impala 资源管理:并发控制的策略与技巧(下)(6/30)

&#x1f496;&#x1f496;&#x1f496;亲爱的朋友们&#xff0c;热烈欢迎你们来到 青云交的博客&#xff01;能与你们在此邂逅&#xff0c;我满心欢喜&#xff0c;深感无比荣幸。在这个瞬息万变的时代&#xff0c;我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

Linux(CentOS)设置防火墙开放8080端口,运行jar包,接收请求

1、查看防火墙状态 systemctl status firewalld 防火墙开启状态 2、运行 jar 包&#xff0c;使用8080端口 程序正常启动 3、使用 postman 发送请求&#xff0c;失败 4、检查端口是否开放&#xff08;需更换到 root 用户&#xff09; firewall-cmd --zonepublic --query-por…

跳表原理-课堂笔记

课程地址 跳表是一种基于随机化的有序数据结构&#xff0c;它提出是为了赋予有序单链表以 O(logn) 的快速查找和插入的能力 创建 首先在头部创建一个 sentinel 节点&#xff0c;然后在 L1 层采用“抛硬币”的方式来决定 L0 层的指针是否增长到 L1 层 例如上图中&#xff0c;L…

Mybatis学习笔记(二)

八、多表联合查询 (一) 多表联合查询概述 在开发过程中单表查询不能满足项目需求分析功能&#xff0c;对于复杂业务来讲&#xff0c;关联的表有几张&#xff0c;甚至几十张并且表与表之间的关系相当复杂。为了能够实业复杂功能业务&#xff0c;就必须进行多表查询&#xff0c…