每周AI新闻(2024年第4周)OpenAI GPT降价增效,ChatGPT支持对话@GPTs | 通义千问Qwen-VL升级 | 哄哄模拟器爆火

我是陌小北,一个正在研究硅基生命的、有趣儿的碳基生命。每周日20:00,准时解读每周AI大事件。
本文解读部分属于陌小北的梦话,言论与她本人以及她所在的“陌北有棵树”账号无关。

大厂动向

【1】OpenAI GPT-3.5 Turbo降价增效、GPT-4 Turbo“变懒”问题修复

OpenAI宣布推出两款全新文本嵌入模型,包括更小、更高效的text-embedding-3-small和更大、性能更强的text-embeddings-3-large。OpenAI还更新了GPT-4 Turbo预览模型,修复此前模型“变懒”情况,同时发布迄今最稳健的文本审核模型,并将于下周推出全新GPT-3.5 Turbo模型,将输入价格降低了50%,将输出价格降低25%。此外,OpenAI将推出两项平台改进,让开发人员更清楚地了解自己的使用情况,并对API密钥进行控制。

【陌小北解读】 照这个速度,5还会远吗?摩尔定律在大模型时代又一次被玩明白了,不过以前无论是Intel和微软,还是高通和各手机厂商,好歹都还有个互相制衡,如今的OpenAI却是直接ToC又ToB。在资本面前,理想主义卑微如尘,不太敢想象几年后的OpenAI会长成什么样…

【2】ChatGPT更新,可在对话中@任意GPTs

ChatGPT更新的新功能,用户可以在对话中@ 不同的GPTs,类似于建立一个团队群聊,每个GPTs都是用户的员工,可以实现复杂任务。同一个对话内的「员工」们具备上下文信息,适合用来让一堆受调教过的GPTs「员工」去实现一个复杂任务。

【陌小北解读】 甚至不用想象,就已经看到了女朋友开会大型现场…家人们,经过OpenAI的不懈努力,终于把妻妾成群这项业务的价格给你们打下来了,无需998,无需298,每月20美刀,三妻四妾领回家…

【3】通义千问视觉理解模型Qwen-VL升级

阿里云公布多模态大模型研究进展,通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后推出Max版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩,比肩OpenAI的GPT-4V和谷歌的Gemini Ultra。

相比Qwen-VL,Qwen-VL-Plus和Qwen-VL-Max拥有更强的视觉推理和中文理解能力,整体性能堪比GPT-4V和Gemini Ultra。在MMMU、MathVista等测评中远超业界所有开源模型,在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上超越GPT-4V,达到世界最佳水平。

目前Qwen-VL-Plus和Qwen-VL-Max限时免费,用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力,也可以通过阿里云灵积平台(DashScope)调用模型API。

【4】谷歌发布AI视频生成模型

谷歌1月23日在预印本平台arXiv发布文本到视频扩散模型Lumiere。Lumiere可以基于用户的自然语言提示、图像+提示生成长达5秒的视频,或者根据用户上传的单个参考图像,生成基于提示词的同风格视频,还允许用户通过自然语言指令生成一致的视频风格。用户可以指定特定区域使Lumiere对图像内容进行动画处理。

论文地址:https://arxiv.org/abs/2401.12945

地址:https://lumiere-video.github.io/

【5】Yann LeCun称生成式模型不适合处理视频

在2024世界经济论坛的一次对话中,Meta首席AI科学家杨立昆(Yann LeCun)提到生成式模型不适合处理视频的观点。当主持人问如何让机器理解视频时,杨立昆称,目前最有希望的是图像识别,并不是生成式的。最有效的模型不是图像生成模型,不是重建,也不是直接预测。它做的是在一个抽象的表征空间中进行预测……我们需要在抽象表征空间中预测,而不是具体的像素空间。这就是为什么像素空间的预测都失败了,因为它太复杂了。

【陌小北解读】 按照杨立昆的观点,这就是,一只公鸡要下蛋,不是他的活他要干…

【6】谷歌云与Hugging Face建立战略合作伙伴关系

谷歌云与Hugging Face宣布双方建立战略合作伙伴关系。双方将在开放科学、开源、云和硬件方面进行合作,以便公司能够利用Hugging Face最新开放模型和谷歌云最新的云和硬件功能构建自己的AI。

【陌小北解读】 借用一句赵本山老师的名言:这个世界太疯狂,耗子都给猫当伴娘…

【7】腾讯文档智能助手开启公测

腾讯文档智能助手正式开启公测,全面应用于Word、Excel、PPT、PDF、智能文档、收集表、思维导图等文档类型。腾讯文档AI能力的升级涵盖了文本内容秒级处理、函数公式运算应用、表格数据精准呈现、PPT快速生成美化、收集结果自动分析、思维导图一键生成等多项能力,并支持跨品类文档内容畅通流转。即日起,智能助手将面向全体用户陆续开放体验。

创业 & 投融资

【1】ElevenLabs 最新融资 8000 万美元,跻身独角兽行列

AI语音合成初创企业 ElevenLabs 已获得 8000 万美元投资,估值达到 10 亿美元。其生成的合成声音自然度在市场内处于领先地位。 ElevenLabs 提供多种免费和付费 AI 服务方案,去年 1 月推出第一个产品作为 Beta 测试版,随后新增了商业合作伙伴关系和新产品。除可根据几分钟的音频样本克隆任意语音外,ElevenLabs 还包含一个拥有各种口音、发音方式和国籍的语音库。

【2】Pika联手北大斯坦福开源文生图框架

Pika在社交平台X上宣布,Pika实验室与北京大学和斯坦福大学推出开源最新文本到图像生成、编辑框架RPG-DiffusionMaster,RPG在上下文理解、组合语义对齐、多轮对话理解等方面有显著改进。

产品 & 模型

【1】哄哄模拟器爆火24小时用户达70万

一款名为“哄哄模拟器”的AI应用昨日爆火,24小时达成70万用户、烧完10亿tokens。该应用设定用户要想方设法哄好自己的虚拟女友/男友,以获取其原谅,模型会给用户能获得的原谅值打分。该应用已经风靡QQ群和QQ空间,被网友总结出各种花式哄人套路。开发者王登科自述做该应用的起因是自己和女朋友的一次争吵,他把女朋友想象成头顶一个怒气值进度条的机器人,不同的回复会让怒气值产生变化。

【陌小北解读】 为激发程序员的创作灵感,强烈建议公司增加福利:为广大单身程序员派发男/女朋友。不过再一想也不用了,OpenAI那边已经女朋友开会了,果然科技是第一生产力。

【2】Stability Al发布Stable LM21.6B模型

Stability AI发布一款拥有16亿个参数的小语言模型和指令调优版本。该基础模型基于英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据集在约2万亿个Tokens上进行了2个epochs的训练,利用了语言模型中最近的算法进步,在速度和性能之间取得了有利的平衡。Stable LM 2 1.6B在多数基准测试中的表现优于其他参数不超过2B的小型语言模型,包括微软Phi-2(2.7B)、TinyLlama 1.1B、Falcon 1B。根据MT Bench的结果,Stable LM 2 1.6B显示出媲美甚至超越更大模型的性能。

Hugging Face地址:https://huggingface.co/spaces/stabilityai/stablelm-2-1_6b-zephyr

【3】夸克上线大模型新产品AI PPT

夸克App推出全新产品“AI PPT”。用户仅需输入PPT主题,就能在几十秒内生成一份精美专业的PPT文档。“AI PPT”可根据用户输入的主题或按照内容分类生成PPT模板,并可根据用户提供的主题生成平均页数在25页以上的智能大纲,还能够在每页中在线调整结构、文字、图片。

【4】AI创作工具animix上线

开域集团自主开发的AI创作工具animix正式上线。animix是一款个性化的AI图片生成器,可根据用户本身形象定制化建模生成数字分身,并随意生图。该产品具有上手门槛低、独创性强、风格特效多样、超逼真角色还原、场景自定义生成、秒级出图等特点,让普通用户能“傻瓜式”地创建卡通形象,生成漫画、海报、梗图、头像等。每位玩家上传5~9张自拍照,即可快速创建自己的数字人物分身,并基于此分身创造出各种令人惊艳的动漫风格头像。

【5】其他有趣的产品&研究

  • OpenAOE 是一款开源的大语言模型群聊框架,它支持同时与多个大语言模型对话,并提供串行和并行两种对话模式:https://juejin.cn/post/7328213780311457832
  • Booking.com 推出AI旅行规划师:https://globetrender.com/?p=60564
  • QDAIF:通过AI反馈实现高质量多样性的创造性文本生成变革:https://hackernoon.com/revolutionizing-creative-text-generation-with-quality-diversity-through-ai-feedback?source=rss
  • You.com 发布了新的“AI 模式”,可以解决复杂的、多步骤的问题:https://venturebeat.com/ai/another-search-breakthrough-you-com-debuts-ai-that-can-answer-multi-step-questions/
  • Mashvisor 是一个帮助你做出更好投资决策的房产投资工具:https://mashable.com/deals/jan-25-mashvisor-real-estate-investment-tool
  • SnapLogic GenAI Builder是一款无需代码的应用程序开发工具,允许组织将GenAI掌握在自己手中,并使用大型语言模型(LLM)功能构建无限、安全的应用程序:https://www.snaplogic.com/?p=47749

如果觉得不错,随手点个赞、评论、转发吧。我是陌小北,一个正在研究硅基生命的、有趣的碳基生命。如果你想第一时间看到我的文章,欢迎关注。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/661332.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

同态加密库Openfhe的介绍与安装

同态加密的基本概念 所谓的加密,其实是明文空间到密文空间的映射关系。明文空间里面的元素,叫做明文,是我们想要保护的信息,通常会含有一些特殊的信息。常见的明文有图像,视频、个人资料等等。明文空间里面的元素&…

net 一台路由器如何让两个不同网段的终端可以通信。

# 终端设备自己设置就行了 # 路由器的设置 The device is running! #################################################### <Huawei> Feb 1 2024 21:21:09-08:00 Huawei %%01IFPDT/4/IF_STATE(l)[0]:Interface GigabitEt hernet0/0/0 has turned into UP state. <…

C++层uevent获取

本文用的是#include <cutils/uevent.h> 主要讲述android中怎么在C层接收uevent uevent 是 kernel层向用户层发送的一个事件 首先创建一个线程用于循环去获取uevent void testUevent {//创建一个线程一直循环pthread_t thread;int ret pthread_create(&thread, nu…

Win11系统连接带HDMI接口的显示器后,电脑没有声音如何调试

解决这个问题的方法很简单&#xff0c;没有那么复杂。之所以使用HDMI接口连接了显示器后没声音&#xff0c;原因就是HDMI接口是包含音频视频两种信号的接口。当电脑的HDMI接口被使用时&#xff0c;系统就会默认从HDMI设备输出声音信号了&#xff0c;而此时如果HDMI设备没有声音…

取巧方式el-select单选重复选择

前言&#xff1a;之前产品是可以多选&#xff0c;我就一想在el-select 加个multiple不就完事了吗&#xff1f;我兴高采烈几分钟就实现了这个选择框&#xff0c;可是后面说单选也要重复多选几个&#xff0c;顿时我就****,又不想自己写个 首先安装element-plus 一定要安装2.5版本…

什么是模板方法模式?它的实现方式有哪些?

什么是模板方法模式&#xff1f;它的实现方式有哪些&#xff1f; 模板方法模式是一种行为型模式&#xff0c;它定义了一个操作中的算法骨架&#xff0c;而将算法的一些步骤延迟到子类中实现&#xff0c;使得子类可以不改变该算法结构的情况下重定义该算法的某些特定步骤。 模…

OSPF排错

目录 实验拓扑图 实验要求 实验排错 故障一 故障现象 故障分析 故障解决 故障二 故障现象 故障分析 故障解决 故障三 故障现象 故障分析 故障解决 故障四 故障现象 故障分析 故障解决 故障五 故障现象 故障分析 故障解决 故障六 故障现象 故障分析 …

wespeaker项目grpc-java客户端开发

非常重要的原始参考资料&#xff1a; 链接: triton-inference-server/client github/grpc java ps&#xff1a; 使用grpc协议的其它项目python/go可以参考git hub目录client/tree/main/src/grpc_generated下的其它项目 其它链接&#xff1a; 想要系统了解triton-inference-ser…

【linux】运维-磁盘空间不足-用到的命令(简洁)

【linux】运维-磁盘空间不足-用到的命令 常用&#xff1a; 注&#xff1a;du -s 和 -d 不能同时都用, -s | -d n 注&#xff1a;df -H 和 -h 区别 -H 1K1000 -h 1K1024 #-T 显示文件系统类型 -h 高可读性显示 df -Th #-c显示总和 ;sort -r 倒序显示 ;2>/dev/nul…

小白初探|神经网络与深度学习

一、学习背景 由于工作的原因&#xff0c;需要开展人工智能相关的研究&#xff0c;虽然不用参与实际研发&#xff0c;但在项目实施过程中发现&#xff0c;人工智能的项目和普通程序开发项目不一样&#xff0c;门槛比较高&#xff0c;没有相关基础没法搞清楚人力、财力如何投入&…

Mask-Free Video Instance Segmentation

论文地址&#xff1a;[2303.15904] 无掩码视频实例分割 (arxiv.org) 论文代码&#xff1a;https://github.com/SysCV/MaskFreeVis 目录 一、摘要 二、介绍 三、方法 3.1 时间掩码一致性 3.2 时间KNN-patch Loss 3.3 训练MaskFreeVIS 四. 数据集 五.消融实验 六. 结果 七…

Shell - 学习笔记 - 2.6 - Shell $*和$@之间的区别

$* 和 $ 都表示传递给函数或脚本的所有参数&#xff0c;我们已在《Shell特殊变量》一节中进行了演示&#xff0c;本节重点说一下它们之间的区别。 当 $* 和 $ 不被双引号" "包围时&#xff0c;它们之间没有任何区别&#xff0c;都是将接收到的每个参数看做一份数据&a…

深度解读NVMe计算存储协议-1

随着云计算、企业级应用以及物联网领域的飞速发展&#xff0c;当前的数据处理需求正以前所未有的规模增长&#xff0c;以满足存储行业不断变化的需求。这种增长导致网络带宽压力增大&#xff0c;并对主机计算资源&#xff08;如内存和CPU&#xff09;造成极大负担&#xff0c;进…

Python网络爬虫分步走之 – 第一步:什么是网络爬虫?

Python网络爬虫分步走之第一步&#xff1a;什么是网络爬虫&#xff1f; Web Scraping in Python Step by Step – 1st Step, What is Web Crawler? By JacksonML 1. 什么是网络爬虫&#xff1f; 在能够使用Google搜索引擎的场合&#xff0c;你是否尝试过简单搜索&#xff…

【C++】类和对象万字详解

目录 一、类与对象 1、类是什么 二、类和对象的基础知识 2.1 定义类&#xff1a;成员变量和成员函数 2.2 创建对象&#xff1a;实例化一个类的对象。 2.3对象的生命周期&#xff1a;构造函数和析构函数。 a. 构造函数 b. 析构函数 c.小结&#xff1a; 三、成员变量和…

Debezium系列之:深入理解GTID全局事务标识,并记录一次数据库重启造成数据丢失的原因和解决方案

Debezium系列之:深入理解GTID,并记录一次数据库重启造成数据丢失的原因和解决方案 一、背景二、深入理解什么是GTID三、深入理解gtid的uuid部分四、判断GTID之间的顺序大小五、解决方案一、背景 hive数据库的表与源头业务数据库的数据不一致,经过检查发现源头数据库发生了重…

腾讯云雾锁王国游戏服务器上线,10秒钟快速搭建!

随着科技的飞速发展&#xff0c;游戏行业也迎来了前所未有的繁荣。在这个时代&#xff0c;玩家们对游戏的体验需求日益增长&#xff0c;对服务器的稳定性和速度要求也越来越高。为了满足市场需求&#xff0c;腾讯云推出了雾锁王国游戏联机服务器及一键部署方案&#xff0c;只需…

❤ 做一个自己的AI智能机器人吧

❤ 做一个自己的AI智能机器人 看了扣子&#xff08;coze&#xff09;的模型&#xff0c;字节基于chatgpt搭建的一个辅助生成AI的网站&#xff0c;感觉蛮有意思&#xff0c;看了掘金以后&#xff0c;于是动手自己也实现了一个。 官网 https://www.coze.cn/ 进入的网站 1、 创…

java之基础知识、零碎知识

MENU java学习路程之篇一、知识点、path环境变量、计算机发展史、数据的存储和运算、人机交互、计算机语言java学习路程之篇二、知识点、JAVA背景介绍、配置JAVA_HOME、跨平台、JVM、JRE、JDKjava学习路程之篇三、知识点、类、模块、项目、操作、下载、安装、IDEA、开发工具jav…

CMake官方教程中文翻译 Step 6: Adding Support for a Testing Dashboard

鉴于自己破烂的英语&#xff0c;所以把cmake的官方文档用 谷歌翻译 翻译下来方便查看。 英语好的同学建议直接去看cmake官方文档&#xff08;英文&#xff09;学习&#xff1a;地址 点这里 或复制&#xff1a;https://cmake.org/cmake/help/latest/guide/tutorial/index.html …