每周AI新闻(2024年第5周)ChatGPT等多应用登陆 Vision Pro | 字节Coze国内版上线等

我是陌小北,一个正在研究硅基生命的、有趣儿的碳基生命。每周日20:00,准时解读每周AI大事件。

大厂动向

【1】ChatGPT、钉钉、Firefly AI 登陆 Vision Pro

OpenAI发布了新的ChatGPT App,允许Apple Vision Pro用户与GPT-4 Turbo模型进行自然语言交互,利用VisionOS操作系统的先进功能,支持多模态AI,实现文本、图像和声音的全方位交互。此应用免费提供,还提供ChatGPT Plus订阅,可获得更多功能和更快的响应时间。

钉钉宣布2月4日正式登陆Apple Vision Pro,并推出Vision Pro原生应用。用户在美区App Store可下载体验DingTalk App,在沉浸式环境下使用钉钉聊天、会议、直播等功能。

Adobe周五宣布其AI文生图工具Firefly AI将作为本机应用程序登陆苹果Vision Pro头显,同时其Lightroom照片编辑软件已在头显发布期间展示。新的Firefly体验是专为visionOS系统打造,支持用户将应用程序生成的图像移动并放到墙壁、桌子等现实世界的空间上。Adobe还预告了生成全景图、360度环境等功能。

【2】Google Bard启用Gemini Pro,并推出文生图新模型 Imagen 2

谷歌宣布 Google Bard 在全球范围内启用 Gemini Pro 并支持 4 多种语言,包括简体中文和繁体中文,用户不需要进行任何额外操作,现在打开 Bard 默认使用的就是 Gemini Pro 模型。
相较 PaLM 2 模型 Gemini Pro 的性能更好、逻辑推理能力更强,性能方面说是可以媲美 OPENAI 的 GPT-4 模型。

另一方面谷歌今天还推出文字生成图片的新模型 Imagen 2,这背后依靠的是谷歌实验室推出的 ImageFX 模型,用户可以使用该模型快速生成想要的图片。

【3】Meta 发布了开源大模型 Code Llama 70B

本周 Meta 发布了开源大模型 Code Llama70B,Code Llama 70B经过5000亿个代码标记和代码相关数据的训练,支持100000个Tokens的更长上下文,使其能够处理和生成更长、更复杂的代码。Code Llama 70B在HumanEval上得分为 67.8,与闭源模型GPT-4(68.2)和Gemini Pro(69.4)相当,远超此前的开源代码模型CodeGen-16B-Mono(29.3)和StarCoder(40.1)等。

GitHub地址:https://github.com/facebookresearch/llama

Hugging Face地址:https://huggingface.co/codellama

【4】字节AI Bot开发平台Coze国内版上线

新一代一站式AI Bot开发平台Coze于2月1日正式面向国内用户上线。无论用户是否有编程基础,都可以在Coze平台上快速搭建基于AI模型的各类问答Bot。并且,用户可以将搭建的Bot发布到各类社交平台和通讯软件上,与这些平台/软件上的用户互动。

【5】阿里发布手机操作智能体框架Mobile-Agent

阿里和北京交通大学的团队在arXiv上发表论文,提出了用于操作手机的智能体框架Mobile-Agent。据介绍,这是一个纯视觉解决方案,不需要XML(可拓展标记语言)和系统元数据,其操作范围不受限制,可进行多应用操作,配备多种视觉感知工具用于操作定位,且无需训练,即插即用。目前,Mobile-Agent已经学会了阿里巴巴、谷歌地图、TikTok等10个APP的操作,可以完成一些跨应用任务。

GitHub主页:https://github.com/X-PLUG/MobilAgent

论文地址:https://arxiv.org/abs/2401.16158

【6】百度文心一言内测数字分身功能

文心一言APP正在内测数字分身新功能,今日起,iOS和安卓用户可升级新版本免费试用。基于该功能,用户只需一张照片、录制三句语音,即可创建专属数字分身,并且支持个性化定义名称、声音、MBTI性格等,用户可选择是否公开自己的数字分身。

【7】iOS 18 有望成为 iPhone 历史上最大更新

据彭博社记者 Mark Gurman 透露,苹果正计划为 iOS 18 进行重大升级,iOS 18 有望成为 iPhone 历史上「最重磅」的软件更新。其中,在 AI Siri 方面, Gurman 也同样预计 iOS 18 将采用生成式 AI 技术,以提升 Siri 和 Messages 应用程序在问答和自动补全句子方面的能力。

创业 & 投融资

【1】Midjourney上线 Niji V6版本 和 风格参考图

二次元模型Niji-Journey V6上线,能生成超逼真动漫原画,Niji V6在风格的一致性上保持得不错,还能生成相应风格的文字,并且具有更多的厚涂感。新版Niji V6升级后的特点包括遵循指令能力提升、生成文本、非动漫风格、Explain to Niji等,具有更高的细节处理能力。

【2】Ack 浏览器上线 AI 直达网页功能,干掉搜索引擎屏中间商

Arc宣布推出了全新的 iOS 应用 Arc Search。这款融合了AI技术的应用致力于成为用户最便捷的搜索工具,用户只需打开应用即可开始搜索。Arc Search不仅支持常规的搜索引擎,其最大的亮点在于它的「Browse for me」功能。该功能利用 AI 技术,能够在阅读六个网页后自动提炼出主要内容,并生成一个新的网页,其中包含了关键的要点和详尽的解释。

【3】月之暗面被曝进行2亿美元融资

清华系大语言模型创企「月之暗面」近日正在进行2亿美元融资,由蚂蚁和阿里集团共同投资,投前估值预计15亿美元。近期频繁霸榜热门游戏应用“哄哄模拟器”便受益于月之暗面的技术支撑。月之暗面由清华计算机系毕业生杨植麟创办,目前团队规模在100~200人之间。

【4】美图收购站酷 扩大AI视觉大模型生态

美图公司2月2日发公告宣布收购站酷。站酷成立于2006年,聚集了来自全球300多个城市的设计师、摄影师、插画师等视觉创意从业者,拥有近1700万注册用户。随着站酷加入,美图影像与设计产品业务将得到进一步升级,为自研AI视觉大模型MiracleVision(奇想智能)的生态带来优质的协同效应,同时帮助美图在专业设计领域进行业务扩展,在版权和共创等方面增强美图的服务能力。

产品 & 模型

【1】Hugging Face发布定制AI聊天助手功能

Hugging Face宣布推出第三方、可定制的Hugging Chat Assistant。用户使用该功能,只需点击两下,即可创建具有特定功能的自定义AI聊天机器人助手,其功能与OpenAI的定制GPT Builder相近。GPT Builder完全依赖于OpenAI专有的GPT-4系列大模型,而Hugging Chat Assistant用户可从Llama 2、Mixtral等多个开源大语言模型中选择用哪个来为AI聊天助手提供支持。

【2】巨人网络完成游戏AI大模型GiantGPT的备案

据游戏公司巨人网络微信公众号发文,巨人网络正式完成游戏AI大模型GiantGPT的备案,成为游戏行业首家对外确认实现了此成果的企业,相关备案结果今日在上海正式公布。即日起,巨人网络AI大模型GiantGPT的有关服务可以正式开展业务。据介绍,GiantGPT是专注于游戏业务的垂类大模型,结合巨人网络自有数据与互联网公共数据训练,并针对角色演绎、情景推理与长期记忆等基础能力进行优化。

【3】大模型游戏“决战拜年之巅”爆火

一款演练春节期间如何应对亲戚灵魂拷问的大模型游戏“决战拜年之巅”近日蹿红。游戏出品团队是ChatMindAI,在2023年做AI思维导图工具起家,致力于AIGC应用创新,使用的大模型是国产GLM,将持续推出像拜年之巅这样的有趣作品。

【4】APUS联合波形智能推出中文创作大模型

APUS联合战略合作伙伴波形智能发布了新一代中文创作大模型,主打六大核心能力:更深更广的创作垂域、更自然真实的创作文风、更强的长文本生成能力、更快的生成速度、原生支持函数调用(function calling)、原生支持个性化知识库,据称在小说写作、营销文案写作、短视频脚本写作、论文写作等Benchmark上击败了GPT等通用大型语言模型。该模型进一步赋能APUS自身产品——萤火小说,据称显著提升内容召回的利用率达50%,并运用RAG+仿写技术让AI“越写越懂你”。

如果觉得不错,随手点个赞、评论、转发吧。我是陌小北,一个正在研究硅基生命的、有趣的碳基生命。如果你想第一时间看到我的文章,欢迎关注。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/667285.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Abp 从空白的WebApplication中添加EntityFrameworkCore生成数据库

书接上文:Abp 从空白WebApplication开始 开发环境:.NET6、Volo.Abp 数据库:Sqlite 说明:纯属个人强行入门。我个人觉得按照官网的操作不舒服,所以自己研究着来,请读者根据自己的需要进行参考。我能保证的…

Ubuntu+GPU搭建Stable-Diffusion教程

【前序】已经安装anaconda 1.git拉取项目到本地 执行git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git 进入项目目录下 cd stable-diffusion-webui/ 2. 安装对应Python依赖包 首先安装pytorch和torchvision,若是GPU环境的用户需要安装与cu…

2024年最新幻兽帕鲁服务器搭建教程

玩转幻兽帕鲁服务器,阿里云推出新手0基础一键部署幻兽帕鲁服务器教程,傻瓜式一键部署,3分钟即可成功创建一台Palworld专属服务器,成本仅需26元,阿里云服务器网aliyunfuwuqi.com分享2024年新版基于阿里云搭建幻兽帕鲁服…

Day59 单调栈part02 503. 下一个更大元素 II 42. 接雨水

Day59 单调栈part02 503. 下一个更大元素 II 42. 接雨水 503. 下一个更大元素 II class Solution { public:vector<int> nextGreaterElements(vector<int>& nums) {vector<int> result(nums.size(),-1); stack<int> st;st.push(0);for(int i 1;…

深度解析源码,Spring 如何使用三级缓存解决循环依赖

目录 一. 前言 二. 基础知识 2.1. 什么是循环依赖&#xff1f; 2.2. 三级缓存 2.3. 原理执行流程 三. 源码解读 3.1. 代码入口 3.2. 第一层 3.3. 第二层 3.4. 第三层 3.5. 返回第二层 3.6. 返回第一层 四. 原理深度解读 4.1. 什么要有三级缓存&#xff1f; 4.2.…

【HarmonyOS 4.0 应用开发实战】ArkTS 快速入门

个人名片&#xff1a; &#x1f43c;作者简介&#xff1a;一名大三在校生&#xff0c;喜欢AI编程&#x1f38b; &#x1f43b;‍❄️个人主页&#x1f947;&#xff1a;落798. &#x1f43c;个人WeChat&#xff1a;hmmwx53 &#x1f54a;️系列专栏&#xff1a;&#x1f5bc;️…

python中[[]] * (n)和[[] for _ in range(n)]的区别

1、现象 刷leetcode207的时候碰到一个坑&#xff0c;用[[]] * (n)初始化二维数组&#xff0c;逻辑是正确的&#xff0c;但是结果始终不对。 2、原因 最后定位是初始化语句使用错误导致的&#xff0c;我使用的是[[]] * (n)&#xff0c;应该使用[[] for _ in range(n)] 3、解…

Stable Diffusion 模型下载:ReV Animated

模型介绍 该模型能够创建 2.5D 类图像生成。此模型是检查点合并&#xff0c;这意味着它是其他模型的产物&#xff0c;以创建从原始模型派生的产品。 条目内容类型大模型基础模型SD 1.5来源CIVITAI作者s6yx文件名称revAnimated_v122EOL.safetensors文件大小5.13GB 生成案例 …

redis数据库设置对象的过期时间,到期后自动删除该条数据

redis数据库设置对象的过期时间,到期后自动删除该条数据&#xff01;过期时间的事情经常发生。比如大家领到了一些购物券。这张购物券有一个过期时间。必须在某节点之前&#xff08;某年某月末日&#xff09;之前&#xff0c;使用掉&#xff0c;否则该券就会过期&#xff0c;无…

Ruby详解及安装流程

文章目录 一、Ruby详解二、Ruby安装流程三、Ruby案例四、Ruby常见问题五、Ruby优缺点六、热门文章 一、Ruby详解 Ruby是一种高级编程语言&#xff0c;具有简单易学、灵活多变、优雅美丽的语法特点。它是一种面向对象的编程语言&#xff0c;具有动态类型和解释型语言的特性。在…

Aigtek高压放大器用途是什么呢

高压放大器在电子领域中扮演着至关重要的角色&#xff0c;其主要作用是将低电压信号放大到更高的电压水平。这种类型的放大器广泛用于各种应用中&#xff0c;以下是高压放大器的用途以及其关键作用的详细介绍。 1、科学研究和实验室应用&#xff1a; 高压放大器在科学研究和实验…

【Linux】Linux权限

Hello everybody!在介绍完Linux操作系统常用的基本指令后&#xff0c;咱们就要开始权限的讲解了。如果没有看过我之前文章的宝子们可以去看看呦&#xff01;有比较系统的指令讲解&#xff01; 回到正题&#xff0c;关于权限&#xff0c;实际上没有大家想象中的那么神秘&#x…

解决问题(Tensorflow框架):ImportError: cannot import name ‘merge‘ from ‘keras.layers‘

看了一圈解决方案&#xff0c;没有找到跟我这个相关的 这就是版本兼容性问题 说句最简单的&#xff0c;针对我这个问题 直接把merge删除点就完事了&#xff0c;因为新版的tensorflow框架这个里面不包含merge&#xff0c;所以直接删掉问题就解决了

Linux进程信号处理:深入理解与应用(2​​)

&#x1f3ac;慕斯主页&#xff1a;修仙—别有洞天 ♈️今日夜电波&#xff1a;its 6pm but I miss u already.—bbbluelee 0:01━━━━━━️&#x1f49f;──────── 3:18 &#x1f504; ◀️…

Android 无操作之后定时退出

android定时器监用户听对页面无操作5分钟退出登录实现 - 简书 private long advertisingTime 600000;///定时结束退出登录10分(分钟)600000毫秒public CountDownTimer countDownTimer;Overrideprotected void onResume() {super.onResume();//启动定时if (isTimedExitApp()) …

ElementUI Form:Form表单

ElementUI安装与使用指南 Form表单 点击下载learnelementuispringboot项目源码 效果图 el-form.vue&#xff08;Form表单&#xff09;页面效果图 项目里 el-form.vue代码 <script> export default {name: el_form,data() {var checkAge (rule, value, callback…

计算机设计大赛 深度学习 opencv python 公式识别(图像识别 机器视觉)

文章目录 0 前言1 课题说明2 效果展示3 具体实现4 关键代码实现5 算法综合效果6 最后 0 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 &#x1f6a9; 基于深度学习的数学公式识别算法实现 该项目较为新颖&#xff0c;适合作为竞赛课题方向&#xff0c;学…

中等题 ------ 链表

文章目录 1. 删除链表中的倒数第N个节点&#xff08;1&#xff09;栈&#xff08;2&#xff09;双指针&#xff08;快慢指针&#xff09; 2. 交换链表中的节点3. 两数相加4. 合并两个链表5. 旋转链表6. 奇偶链表7. 两两交换8. k 个一组翻转链表9. 分割链表10. 分隔链表11. 重排…

如何保障代码覆盖率?它和精准测试有什么关系?

前言 大家好&#xff0c;我是chowley&#xff0c;今天来聊一聊代码覆盖率和精准测试两者之间的关系。 在软件开发和测试中&#xff0c;代码覆盖率是一个重要的指标&#xff0c;它可以帮助我们评估测试用例对源代码的覆盖程度。精准测试则注重深入挖掘特定功能或模块的问题。 …

lombok原理介绍

文章目录 首先介绍一下springboot开始正题看看lombok源码再进一步深入(下面一段是借鉴参考文章的内容)总结参考文章由于lombok基本使用在springboot框架中,因此 首先介绍一下springboot Spring Boot是一个基于Spring框架的开源Java框架,旨在简化和加速Java应用程序的开发过程。…