Higgsfield AI: 对飙Sora打造个性化视频新浪潮,重塑社交媒体内容创作

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

几个月前,OpenAI用一款名叫Sora的生成式AI模型震撼了科技界,这款模型能将场景描述转换成原创视频——无需摄像机或拍摄团队。但到目前为止,Sora的使用权限非常严格,公司似乎打算将其定位于资金充裕的创意人士,比如好莱坞导演——而不太可能是业余爱好者或小规模营销人员。

然而,Snap前生成式AI负责人亚历克斯·马什拉博夫嗅到了机会。因此,他推出了Higgsfield AI,这是一个为更加定制化、个性化应用设计的AI视频创作与编辑平台。

通过定制的文本到视频模型,Higgsfield的首款应用Diffuse能够从零开始生成视频,或者拍摄自拍并生成以该人物为主角的短片。

马什拉博夫在接受TechCrunch采访时表示,“我们的目标受众是各种类型的创作者,从想要与朋友一起创作有趣内容的普通用户,到希望尝试新内容格式的社交内容创作者,再到希望他们的品牌脱颖而出的社交媒体营销人员。”

马什拉博夫通过他之前的创业项目AI Factory加入Snap,该项目于2020年以1.66亿美元被Snap收购。在Snap期间,马什拉博夫帮助构建了Snapchat的AR效果和滤镜,包括Cameos,以及Snapchat备受争议的MyAI聊天机器人。

Higgsfield与AI研究员、专门从事生成视频的Yerzat Dulat共同推出,提供一套精选的预生成剪辑、一个上传参考媒体(如图片和视频)的工具,以及一个提示编辑器,让用户描述他们希望描绘的角色、动作和场景。通过Diffuse,用户可以直接将自己插入到AI生成的场景中,或让他们的数字化形象模仿其他视频中捕捉到的动作——如舞蹈动作。

马什拉博夫说:“我们的模型支持高度逼真的动作和表情。我们正在为消费者开创‘世界模型’,这将使我们能够构建具有极高控制级别的一流视频生成和编辑。”

Higgsfield并不是唯一一家与OpenAI竞争的生成视频初创公司。Runway是最早进入这一领域的公司之一,其工具持续改进。还有Haiper,它得到了两位DeepMind校友的支持,以及超过1300万美元的风险投资。

马什拉博夫认为,Diffuse将凭借其面向移动设备、社交导向的市场进入策略脱颖而出。

“通过优先考虑iOS和Android应用而不是桌面工作流,我们使创作者能够随时随地创建引人注目的社交媒体内容,”马什拉博夫说。“实际上,通过构建移动平台,我们能够从第一天起优先考虑易用性和面向消费者的特性。”

Higgsfield还在保持精简运营。马什拉博夫表示,支撑平台的生成模型是由一个16人的团队在不到九个月的时间内开发的,并在一个32GPU的集群上进行了训练(32GPU听起来可能很多,但考虑到OpenAI使用了数万个,这实际上并不多)。到目前为止,Higgsfield只筹集了800万美元,其中大部分来自于最近一轮由Menlo Ventures领投的种子融资。

为了领先于竞争对手,Higgsfield计划将种子资金用于构建一个改进的视频编辑器,让用户能够修改视频中的角色和物体,以及针对社交媒体用例训练更强大的视频生成模型。实际上,马什拉博夫认为社交媒体——以及社交媒体营销——是Higgsfield的主要盈利领域。

虽然Diffuse目前是免费使用的,但马什拉博夫设想未来营销人员将为高级功能,或大规模活动付费或订阅。

“我们相信Higgsfield为社交媒体营销人员解锁了难以置信的现实主义和内容制作用例,”他说。“我们经常听到首席营销官和创意总监说,他们需要在保持内容影响力的同时,优化内容制作预算并缩短时间表。因此,我们相信视频生成AI解决方案将成为帮助他们实现这一目标的核心解决方案。”

当然,Higgsfield也无法避免面临生成式AI初创公司普遍面临的挑战。

众所周知,像Diffuse这样的生成式AI模型可以“重复”训练数据。为什么这是个问题呢?嗯,如果这些模型是在没有获得许可或某种许可协议的情况下,使用了

受版权保护的内容进行训练,那么这些模型的用户可能会无意中生成侵犯版权的作品——将他们暴露于诉讼风险中。

马什拉博夫不愿透露Higgsfield训练数据的来源(除了说它来自“多个公开可用”的地方),也不愿说Higgsfield是否会保留用户数据以训练未来的模型,这可能不会让一些商业客户感到满意。他确实指出,Diffuse用户可以随时通过应用程序要求删除他们的数据。

像Higgsfield这样的数字“克隆”平台也容易被滥用,正如近几个月社交媒体上深度伪造视频的疯狂传播所显示的那样。

以类似的方式,Higgsfield可能使窃取创作者内容变得更容易。例如,只需上传某人舞蹈编排的视频,就可以生成一个展示自己执行同样舞蹈的视频。

我询问了马什拉博夫关于Higgsfield可能使用的任何保护措施或防范措施,以试图防止滥用——虽然他不愿透露具体细节——他声称平台采用了自动和人工审核的混合模式。

“我们决定首先在选定的市场逐步推出产品,这样我们就可以监控潜在的滥用情况,并根据需要对产品进行调整,”马什拉博夫补充说。

我们将不得不等待并看看这在实践中的效果如何。

Higgsfield – Foundational video model for social media

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/792955.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【leetcode面试经典150题】9.跳跃游戏(C++)

【leetcode面试经典150题】专栏系列将为准备暑期实习生以及秋招的同学们提高在面试时的经典面试算法题的思路和想法。本专栏将以一题多解和精简算法思路为主,题解使用C语言。(若有使用其他语言的同学也可了解题解思路,本质上语法内容一致&…

算法设计与分析实验报告python实现(排序算法、三壶谜题、交替放置的碟子、带锁的门)

一、 实验目的 1.加深学生对算法设计方法的基本思想、基本步骤、基本方法的理解与掌握; 2.提高学生利用课堂所学知识解决实际问题的能力; 3.提高学生综合应用所学知识解决实际问题的能力。 二、实验任务 1、排序算法…

Oracle常规操作

1、查看用户和密码 select username,password from dba_users; --修改用户和密码 alter user system identified by manager; alter user system identified by values 2D594E86F93B17A1; --解锁用户 alter user system account unlock; -- 用SYSDBA身份进入数据库,然…

Github 2024-04-04 开源项目日报 Top10

根据Github Trendings的统计,今日(2024-04-04统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Python项目5TypeScript项目2Go项目1Jupyter Notebook项目1Java项目1C++项目1非开发语言项目1Vue项目1编程面试大学:成为软件工程师的全面学习计…

Spark-Scala语言实战(12)

在之前的文章中,我们学习了如何在spark中使用键值对中的join,rightOuterJoin,leftOuterJoin三种方法。想了解的朋友可以查看这篇文章。同时,希望我的文章能帮助到你,如果觉得我的文章写的不错,请留下你宝贵的点赞,谢谢…

攻防世界 xff_referer 题目解析

xff_referer 一:了解xxf和Referer X-Forwarded-For:简称XFF头,它代表客户端,也就是HTTP的请求端真实的IP,只有在通过了HTTP 代理或者负载均衡服务器时才会添加该项。 一般的客户端发送HTTP请求没有X-Forwarded-For头的&#xff0…

宁波ISO27001认证:信息安全管理的黄金标准

😃宁波ISO27001认证:🤖信息安全管理的💡黄金标准 随着信息技术💻的迅猛发展,信息安全🔏问题日益凸显,成为企业🏬稳定运营和持续发展的📊关键因素。在这样&am…

Finite Element Procedures K.J.Bathe 【教材pdf+部分源码】|有限元经典教材 | 有限元编程

专栏导读 作者简介:工学博士,高级工程师,专注于工业软件算法研究本文已收录于专栏:《有限元编程从入门到精通》本专栏旨在提供 1.以案例的形式讲解各类有限元问题的程序实现,并提供所有案例完整源码;2.单元…

Paddle实现人脸对比

人脸对比 人脸对比,顾名思义,就是对比两个人脸的相似度。本文将用Paddle实现这一功能。 PS:作者肝了整整3天才稍微搞明白实现方法 数据集准备 这里使用百度AI Studio的开源数据集: 人脸数据_数据集-飞桨AI Studio星河社区 (b…

[C#]OpenCvSharp使用HoughCircles霍夫圆检测算法找出圆位置并计数

【效果展示】 原图: 找出位置: 【测试环境】 vs2019,netframework4.7.2,opencvsharp4.8.0 【函数用法】 cv2提供了一种圆检测的方法:HoughCircles。该函数的返回结果与参数设置有很大的关系。 检测的图像时9枚钱币,分别使用了…

特征融合篇 | 结合内容引导注意力 DEA-Net 思想 实现双主干特征融合新方法 | IEEE TIP 2024

本篇改进已集成到 YOLOv8-Magic 框架。 摘要—单幅图像去雾是一个具有挑战性的不适定问题,它从观察到的雾化图像中估计潜在的无雾图像。一些现有的基于深度学习的方法致力于通过增加卷积的深度或宽度来改善模型性能。卷积神经网络(CNN)结构的学习能力仍然未被充分探索。本文…

SpringAI如何集成Ollama开发AI应用

文章目录 spring AI 介绍1. Spring ML2. Spring Data3. Spring Integration4. Spring Boot5. Spring Cloud如何开始使用 Spring AI注意事项 Spring AI集成Ollama1. 添加依赖2. 配置应用3. 注入和使用 AiClient4. 运行和测试注意事项 spring AI 介绍 Spring AI 是一个基于 Spri…

技术人的清明节:数字哀思与虚拟纪念

清明节,这是一个寄托哀思、缅怀先人的日子。对于我们这些日夜与代码为伴的技术人来说,这个节日不仅仅是对亲人的怀念,更是一次对生命、时间和记忆的深刻反思。 技术人的情感表达:独特而真挚 我们技术人,常被误解为情…

【算法题】换水问题 II

> 插:AI时代,程序员或多或少要了解些人工智能,前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 坚持不懈,越努力越幸运,大家…

代理模式:全局 规则 直连 脚本四种模式的区别

当涉及到网络代理时,不同模式具有不同的设置,选择不同模式应根据实际需求和网络环境来决定。 代理模式的区别如下: 1. 全局模式 整个设备的所有流量都会通过代理服务器转发。无论是浏览器、应用程序还是系统其他组件,都将通过代理…

Linux第3课 Linux系统安装及换源方法

文章目录 Linux第3课 Linux系统安装及换源方法一、VMware虚拟机下系统的安装及配置(一)创建新的虚拟机 二、换源三、初次配置四、修改分辨率五、共享文件夹的实现(一)创建并查看共享文件夹 Linux第3课 Linux系统安装及换源方法 用…

阿里云PAI + pytorch大语言模型开发环境简介

文章目录 阿里云PAI pytorch大语言模型开发环境简介PAI-DSW 快速入门1. 安装和配置2. 模型训练2.1 数据集准备2.2 模型训练脚本准备2.3 提交训练作业 3. 部署模型为推理服务4. 调用推理服务 阿里云PAI pytorch大语言模型开发环境简介 PAI-DSW 快速入门 阿里云机器学习PAI&a…

Node.js 与 webpack(四)

上一篇:Node.js与webpack(三)-CSDN博客 webpack原理 yu 优化 本章节主要介绍 Webpack 高级配置。 所谓高级配置其实就是进行 Webpack 优化,让我们代码在编译/运行时性能更好~ 我们会从以下角度来进行优化: 提升开发体…

如何在 Ubuntu 12.04 VPS 上使用 LDAP 对客户端计算机进行身份验证

简介 LDAP(轻量级目录访问协议)是将认证信息保存在单一集中位置的一种方式。在之前的一篇文章中,我们讨论了如何在 Ubuntu 12.04 VPS 上设置 LDAP 服务器。这解释了实际的服务器配置。 在本文中,我们将讨论如何配置客户端机器以远…

Data-efficient Fine-tuning for LLM-based Recommendation

目录 Introduction 利用大型语言模型(LLM)进行推荐最近引起了相当大的关注,其中微调在 LLM 的适应中发挥着关键作用。然而,在快速扩展的推荐数据上微调LLMs的成本限制了其实际应用。为了应对这一挑战,小样本微调提供了…