Higgsfield AI: 对飙Sora打造个性化视频新浪潮,重塑社交媒体内容创作

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

几个月前,OpenAI用一款名叫Sora的生成式AI模型震撼了科技界,这款模型能将场景描述转换成原创视频——无需摄像机或拍摄团队。但到目前为止,Sora的使用权限非常严格,公司似乎打算将其定位于资金充裕的创意人士,比如好莱坞导演——而不太可能是业余爱好者或小规模营销人员。

然而,Snap前生成式AI负责人亚历克斯·马什拉博夫嗅到了机会。因此,他推出了Higgsfield AI,这是一个为更加定制化、个性化应用设计的AI视频创作与编辑平台。

通过定制的文本到视频模型,Higgsfield的首款应用Diffuse能够从零开始生成视频,或者拍摄自拍并生成以该人物为主角的短片。

马什拉博夫在接受TechCrunch采访时表示,“我们的目标受众是各种类型的创作者,从想要与朋友一起创作有趣内容的普通用户,到希望尝试新内容格式的社交内容创作者,再到希望他们的品牌脱颖而出的社交媒体营销人员。”

马什拉博夫通过他之前的创业项目AI Factory加入Snap,该项目于2020年以1.66亿美元被Snap收购。在Snap期间,马什拉博夫帮助构建了Snapchat的AR效果和滤镜,包括Cameos,以及Snapchat备受争议的MyAI聊天机器人。

Higgsfield与AI研究员、专门从事生成视频的Yerzat Dulat共同推出,提供一套精选的预生成剪辑、一个上传参考媒体(如图片和视频)的工具,以及一个提示编辑器,让用户描述他们希望描绘的角色、动作和场景。通过Diffuse,用户可以直接将自己插入到AI生成的场景中,或让他们的数字化形象模仿其他视频中捕捉到的动作——如舞蹈动作。

马什拉博夫说:“我们的模型支持高度逼真的动作和表情。我们正在为消费者开创‘世界模型’,这将使我们能够构建具有极高控制级别的一流视频生成和编辑。”

Higgsfield并不是唯一一家与OpenAI竞争的生成视频初创公司。Runway是最早进入这一领域的公司之一,其工具持续改进。还有Haiper,它得到了两位DeepMind校友的支持,以及超过1300万美元的风险投资。

马什拉博夫认为,Diffuse将凭借其面向移动设备、社交导向的市场进入策略脱颖而出。

“通过优先考虑iOS和Android应用而不是桌面工作流,我们使创作者能够随时随地创建引人注目的社交媒体内容,”马什拉博夫说。“实际上,通过构建移动平台,我们能够从第一天起优先考虑易用性和面向消费者的特性。”

Higgsfield还在保持精简运营。马什拉博夫表示,支撑平台的生成模型是由一个16人的团队在不到九个月的时间内开发的,并在一个32GPU的集群上进行了训练(32GPU听起来可能很多,但考虑到OpenAI使用了数万个,这实际上并不多)。到目前为止,Higgsfield只筹集了800万美元,其中大部分来自于最近一轮由Menlo Ventures领投的种子融资。

为了领先于竞争对手,Higgsfield计划将种子资金用于构建一个改进的视频编辑器,让用户能够修改视频中的角色和物体,以及针对社交媒体用例训练更强大的视频生成模型。实际上,马什拉博夫认为社交媒体——以及社交媒体营销——是Higgsfield的主要盈利领域。

虽然Diffuse目前是免费使用的,但马什拉博夫设想未来营销人员将为高级功能,或大规模活动付费或订阅。

“我们相信Higgsfield为社交媒体营销人员解锁了难以置信的现实主义和内容制作用例,”他说。“我们经常听到首席营销官和创意总监说,他们需要在保持内容影响力的同时,优化内容制作预算并缩短时间表。因此,我们相信视频生成AI解决方案将成为帮助他们实现这一目标的核心解决方案。”

当然,Higgsfield也无法避免面临生成式AI初创公司普遍面临的挑战。

众所周知,像Diffuse这样的生成式AI模型可以“重复”训练数据。为什么这是个问题呢?嗯,如果这些模型是在没有获得许可或某种许可协议的情况下,使用了

受版权保护的内容进行训练,那么这些模型的用户可能会无意中生成侵犯版权的作品——将他们暴露于诉讼风险中。

马什拉博夫不愿透露Higgsfield训练数据的来源(除了说它来自“多个公开可用”的地方),也不愿说Higgsfield是否会保留用户数据以训练未来的模型,这可能不会让一些商业客户感到满意。他确实指出,Diffuse用户可以随时通过应用程序要求删除他们的数据。

像Higgsfield这样的数字“克隆”平台也容易被滥用,正如近几个月社交媒体上深度伪造视频的疯狂传播所显示的那样。

以类似的方式,Higgsfield可能使窃取创作者内容变得更容易。例如,只需上传某人舞蹈编排的视频,就可以生成一个展示自己执行同样舞蹈的视频。

我询问了马什拉博夫关于Higgsfield可能使用的任何保护措施或防范措施,以试图防止滥用——虽然他不愿透露具体细节——他声称平台采用了自动和人工审核的混合模式。

“我们决定首先在选定的市场逐步推出产品,这样我们就可以监控潜在的滥用情况,并根据需要对产品进行调整,”马什拉博夫补充说。

我们将不得不等待并看看这在实践中的效果如何。

Higgsfield – Foundational video model for social media

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/792955.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

算法设计与分析实验报告python实现(排序算法、三壶谜题、交替放置的碟子、带锁的门)

一、 实验目的 1.加深学生对算法设计方法的基本思想、基本步骤、基本方法的理解与掌握; 2.提高学生利用课堂所学知识解决实际问题的能力; 3.提高学生综合应用所学知识解决实际问题的能力。 二、实验任务 1、排序算法…

Github 2024-04-04 开源项目日报 Top10

根据Github Trendings的统计,今日(2024-04-04统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Python项目5TypeScript项目2Go项目1Jupyter Notebook项目1Java项目1C++项目1非开发语言项目1Vue项目1编程面试大学:成为软件工程师的全面学习计…

Spark-Scala语言实战(12)

在之前的文章中,我们学习了如何在spark中使用键值对中的join,rightOuterJoin,leftOuterJoin三种方法。想了解的朋友可以查看这篇文章。同时,希望我的文章能帮助到你,如果觉得我的文章写的不错,请留下你宝贵的点赞,谢谢…

攻防世界 xff_referer 题目解析

xff_referer 一:了解xxf和Referer X-Forwarded-For:简称XFF头,它代表客户端,也就是HTTP的请求端真实的IP,只有在通过了HTTP 代理或者负载均衡服务器时才会添加该项。 一般的客户端发送HTTP请求没有X-Forwarded-For头的&#xff0…

宁波ISO27001认证:信息安全管理的黄金标准

😃宁波ISO27001认证:🤖信息安全管理的💡黄金标准 随着信息技术💻的迅猛发展,信息安全🔏问题日益凸显,成为企业🏬稳定运营和持续发展的📊关键因素。在这样&am…

Finite Element Procedures K.J.Bathe 【教材pdf+部分源码】|有限元经典教材 | 有限元编程

专栏导读 作者简介:工学博士,高级工程师,专注于工业软件算法研究本文已收录于专栏:《有限元编程从入门到精通》本专栏旨在提供 1.以案例的形式讲解各类有限元问题的程序实现,并提供所有案例完整源码;2.单元…

Paddle实现人脸对比

人脸对比 人脸对比,顾名思义,就是对比两个人脸的相似度。本文将用Paddle实现这一功能。 PS:作者肝了整整3天才稍微搞明白实现方法 数据集准备 这里使用百度AI Studio的开源数据集: 人脸数据_数据集-飞桨AI Studio星河社区 (b…

[C#]OpenCvSharp使用HoughCircles霍夫圆检测算法找出圆位置并计数

【效果展示】 原图: 找出位置: 【测试环境】 vs2019,netframework4.7.2,opencvsharp4.8.0 【函数用法】 cv2提供了一种圆检测的方法:HoughCircles。该函数的返回结果与参数设置有很大的关系。 检测的图像时9枚钱币,分别使用了…

特征融合篇 | 结合内容引导注意力 DEA-Net 思想 实现双主干特征融合新方法 | IEEE TIP 2024

本篇改进已集成到 YOLOv8-Magic 框架。 摘要—单幅图像去雾是一个具有挑战性的不适定问题,它从观察到的雾化图像中估计潜在的无雾图像。一些现有的基于深度学习的方法致力于通过增加卷积的深度或宽度来改善模型性能。卷积神经网络(CNN)结构的学习能力仍然未被充分探索。本文…

【算法题】换水问题 II

> 插:AI时代,程序员或多或少要了解些人工智能,前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 坚持不懈,越努力越幸运,大家…

Linux第3课 Linux系统安装及换源方法

文章目录 Linux第3课 Linux系统安装及换源方法一、VMware虚拟机下系统的安装及配置(一)创建新的虚拟机 二、换源三、初次配置四、修改分辨率五、共享文件夹的实现(一)创建并查看共享文件夹 Linux第3课 Linux系统安装及换源方法 用…

Node.js 与 webpack(四)

上一篇:Node.js与webpack(三)-CSDN博客 webpack原理 yu 优化 本章节主要介绍 Webpack 高级配置。 所谓高级配置其实就是进行 Webpack 优化,让我们代码在编译/运行时性能更好~ 我们会从以下角度来进行优化: 提升开发体…

Data-efficient Fine-tuning for LLM-based Recommendation

目录 Introduction 利用大型语言模型(LLM)进行推荐最近引起了相当大的关注,其中微调在 LLM 的适应中发挥着关键作用。然而,在快速扩展的推荐数据上微调LLMs的成本限制了其实际应用。为了应对这一挑战,小样本微调提供了…

【深入理解计算机系统第3版】有符号数和无符号数转换以及移位运算练习题2.23

题目 考虑下面的C函数&#xff1a; int fun1(unsigned word) {return (int) ((word << 24) >> 24); }int fun2(unsigned word) {return ((int) word << 24) >> 24; } 假设一个采用补码运算的机器上以32位程序来执行这些函数。还假设有符号数值的右移…

代码审计-PHP原生开发篇SQL注入数据库监控正则搜索文件定位静态分析

文章目录 前言1、Bluecms-CNVD-1Day-常规注入审计分析2、emlog-CNVD-1Day-常规注入审计分析3、emlog-CNVD-1Day-2次注入审计分析 前言 挖掘技巧&#xff1a; -语句监控-数据库SQL监控排查可利用语句定向分析 -功能追踪-功能点文件SQL执行代码函数调用链追踪 -正则搜索-(update…

QT----opencv4.8.0编译cuda版本,QTcreater使用

目录 1 编译opencv4.8.02 验证能否加载GPU cuda12.1 opencv4.8.0 vs2019 cmake3.29 1 编译opencv4.8.0 打开cmake&#xff0c;选择opencv480路径&#xff0c;build路径随意 点击configure后&#xff0c;选择这些选项&#xff0c;opencv_word&#xff0c;cuda全选&#xff0c;…

工业组态 物联网组态 组态编辑器 web组态 组态插件 编辑器

体验地址&#xff1a;by组态[web组态插件] BY组态是一款非常优秀的纯前端的【web组态插件工具】&#xff0c;可无缝嵌入到vue项目&#xff0c;react项目等&#xff0c;由于是原生js开发&#xff0c;对于前端的集成没有框架的限制。同时由于BY组态只是一个插件&#xff0c;不能独…

【Linux】Ubuntu 文件权限管理

Linux 系统对文件的权限有着严格的控制&#xff0c;用于如果相对某个文件执行某种操作&#xff0c;必须具有对应的权限方可执行成功&#xff0c;这也是Linux有别于Windows的机制&#xff0c;也是基于这个权限机制&#xff0c;Linux可以有效防止病毒自我运行。因为运行的条件是必…

【接口】HTTP(1)|请求|响应

1、概念 Hyper Text Transfer Protocol&#xff08;超文本传输协议&#xff09;用于从万维网&#xff08;就是www&#xff09;服务器传输超文本到本地浏览器的传送协议。 HTTP协议是基于TCP的应用层协议&#xff0c;它不关心数据传输的细节&#xff0c;主要是用来规定客户端和…

详解python中的迭代

如果给定一个list或tuple&#xff0c;我们可以通过for循环来遍历这个list或tuple&#xff0c;这种遍历我们称为迭代&#xff08;Iteration&#xff09;。 在Python中&#xff0c;迭代是通过for ... in来完成的&#xff0c;而很多语言比如C语言&#xff0c;迭代list是通过下标完…