《AI生成式工具使用》之:AI文本生视频(二战!)

目录

背景说明及目标

尝试练手

1、豆包AI之图片生成

        总结:豆包AI生成的图片,不太能看细节,涉及到中文的基本上不能细看都是类似乱码的东西,有明显的逻辑性问题(比如不符合道路交规)。需要根据生成的结果不断地调整关键词,存在着太多的不确定性。

2、用即梦AI生成图片

        总结:相比豆包AI,即梦AI生成的图片没有明显的逻辑性错误,更有氛围感,对于成语和动词更具有理解性,且能表现出来。存在相同的问题:涉及到中文都是乱码,存在细节问题。

3、用可灵AI生成图片

        总结:可灵AI生成的图片氛围感不错,相比即梦AI貌似可灵AI没能理解"拥挤",更多的体现了"清晨"的氛围。存在相同的问题:涉及到中文都是乱码,另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了,还是学习的数据来源有偏差。

4、用即梦AI尝试图片生视频和文案生视频

       1)即梦AI图片生视频

        总结:不能看细节,物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。

         2)即梦AI文本生视频

        结论:即梦AI生成视频依旧有中文乱码、细节性问题,逻辑性问题会很随机的出现,也就是不确定性很大。

5、用可灵AI尝试图片生视频和文案生视频

       1)可灵AI图片生视频

         2)可灵AI文本生视频

总结

关注我,躺不平就一起卷吧


背景说明及目标

        想在抖音上创建账号,主要用于日常读书分享。抖音流量大,因为是视频平台,所以需要制作视频。因本人从没有过这方面的经验,所以思考是否可以考虑借助外部工具。       

        背景:想运营一个抖音的读书账号:斯斯讲书。第一本要分享的书名叫《急救比医生快一步》

        目标:做一个预告视频,预告一下,希望能吸引关注。以预告做一个入门练习,熟悉了后面的所有分享就可以用AI生成视频,而我只需要专注于读书分享的文案就可以。

        上一篇“《AI生成式工具使用》之:自助生成视频”完全没摸着AI生成视频或者AI生成图片的边儿,导致生成的“玩意儿”一言难尽。重新做了梳理,决定二战AI文本生视频!

        学习中的小总结:AI写作、AI画图、AI生成视频对于非这类工作的人其实还是有门槛的,并不是有了AI工具,所有人都能通过AI工具去替代写文案的、画图的、做视频的。本质上还是需要有工作能力和创作思维。有工作能力+创作思维+AI能提高工作效率,事半功倍。有创作思维+AI可以一定程度上实现跨界。但是很不幸,在写作、画图、视频这块完全门外汉的我,显然是既没有相关的工作能力,又没有创作思维,手上拿个AI也是个棒槌。

        不过一生要强的中国女人,为了省钱,就是得一人身兼多职,AI文本生视频怎么滴都得拿下,也就只能蹒跚学步了。毕竟AI这股潮流,谁都得赶一赶。

尝试练手

        想象中的预告片描述:

        远景:拥挤繁忙的早高峰,街头热闹而拥挤。刺耳且紧迫的120急救车的鸣笛声穿透出来,由远及近,再匆匆驶离

        中景:医院的急救大厅,医生护士匆忙的进行着抢救,家属慌乱的呼唤着病人的名字

        近景:逆光的太平间的大门

1、豆包AI之图片生成

  • 下载豆包App,可通过抖音绑定注册登录
  • 登陆后进入主界面,选择下方"图片生成"

  • 在图片生成页面,比例选择9:16(手机竖屏显示),点击”+添加特征词“
  • 镜头视角:全景;光线:自然光;风景:城市景观;人像:无,点击"添加"
  • 继续补充输入"拥挤繁忙的早高峰,街头喧闹拥挤,急速行驶的120急救车",点击发送按钮,生成图片如下:

        (问题:地点没有在中国,生成的人物和地点都是外国,车上的标语都是英语。人都是随便的散在了机动车道。仔细看细节异常奇怪,有人头是反的,缺胳膊少腿儿的。)

  • 重新生成,修改特征词如下:“全景、自然光、城市景观、北京繁忙的早高峰,街头喧闹拥挤,急速行驶的120急救车”,点击发送按钮,生成图片如下:

        (问题:依旧是行人在机动车道上乱窜,没有交规。如果不看细节倒也还能接受。)

  • 重新生成:“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。比例9:16”,生成图片如下:

        总结:豆包AI生成的图片,不太能看细节,涉及到中文的基本上不能细看都是类似乱码的东西,有明显的逻辑性问题(比如不符合道路交规)。需要根据生成的结果不断地调整关键词,存在着太多的不确定性。

2、用即梦AI生成图片

  • 采用与上面相同的内容,“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下:

        总结:相比豆包AI,即梦AI生成的图片没有明显的逻辑性错误,更有氛围感,对于成语和动词更具有理解性,且能表现出来。存在相同的问题:涉及到中文都是乱码,存在细节问题。

3、用可灵AI生成图片

  • 采用与上面相同的内容,“全景,自然光,清晨,一辆中国的急救车行驶在拥挤的北京街道上。”。生成图片如下:

 

        总结:可灵AI生成的图片氛围感不错,相比即梦AI貌似可灵AI没能理解"拥挤",更多的体现了"清晨"的氛围。存在相同的问题:涉及到中文都是乱码,另外其实中国全红色涂装的急救车很少见。不确定它这个是跟消防车弄混了,还是学习的数据来源有偏差。

4、用即梦AI尝试图片生视频和文案生视频

       1)即梦AI图片生视频

  • 用即梦AI图片生视频,选用之前AI生成的图片,填写文案如下“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,随机运镜、慢速、标准模式、3s,生成视频如下:

        (问题:生成图片时没有细看,现在图片生视频,图片上的车动起来之后发现了逻辑错误的地方,急救车逆向行驶了!!!!)

        (问题:车的行驶状态飘忽,总有正在发生车祸的感觉。远处出莫名其妙的飘出来了鬼东西!!!)

        总结:不能看细节,物体的运动状态也不太写实。一旦动起来之后就会出现一些逻辑性问题。

         2)即梦AI文本生视频

  • 填写文案“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,随机运镜,慢速,3s,9:16,生成视频如下:

         (问题:中文乱码,出现了警车。给出的是清晨,画面太暗了。调整文本重新再试一下)

  • 调整文案“北京繁忙的上午,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶,不要出现警车”,随机运镜,慢速,3s,9:16,生成视频如下:

        (问题:改成上午了,还是没有很亮的感觉。另外!!!!MD!!!真的吓人,边上出鬼东西了!!!!!)

        结论:即梦AI生成视频依旧有中文乱码、细节性问题,逻辑性问题会很随机的出现,也就是不确定性很大。

5、用可灵AI尝试图片生视频和文案生视频

       1)可灵AI图片生视频

  • 用即梦AI图片生视频,选用之前AI生成的图片,填写文案如下“北京繁忙的清晨,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,实际上等了近3个小时均未能生成成功。

         2)可灵AI文本生视频

  • 文案输入“北京繁忙的上午,一道急促紧急的鸣笛声穿过,一辆急救车在拥挤的道路上行驶”,生成视频如下(忘记选9:16了,但不影响其生成的内容):

        (问题:一言难尽,一台晃晃悠悠的老头乐??边上出现的诡异车..)

总结

        AI生成视频还是比较适合创意性的、虚拟的、非真实的应用场景。对于写实一点或者细节很多的场景,逻辑问题会很随机的出现,输出的结果不确定性很大!另外,出现中文的地方都是乱码!!!问题蛮大的。

        像我的实际需求可能更偏向于真实存在的场景,因此对我来说可能更好的选择是选用现成的视频模板进行替换、剪辑。

        另外还有个AI Mate App,可以直接输入文案(可以是故事),然后生成视频。因为没有试用功能,直接就需要充钱使用,风险蛮大的,暂时未测试。

        即梦AI也有类似AI Mate的故事创作功能,但需要充值VIP,暂时未测试。

        依旧没有完成目标,没能按照需求生成想要的视频。但至少验证了,我的需求没办法通过AI完全满足。得学习基础剪辑,或者试试AI剪辑功能。        

关注我,躺不平就一起卷吧

        顺便厚颜的打个广告,♥关注我♥,发布的文章专辑涉及到嵌入式开发、AI知识、日常调试bug记录、AI工具使用记录等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/57136.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java-继承与多态-上篇

关于类与对象&#xff0c;内容较多&#xff0c;我们分为两篇进行讲解&#xff1a; &#x1f4da; Java-继承与多态-上篇&#xff1a;———— <就是本篇> &#x1f4d5; 继承的概念与使用 &#x1f4d5; 父类成员访问 &#x1f4d5; super关键字 &#x1f4d5; supe…

laravel 查询数据库

数据库准备 插入 三行 不同的数据 自行搭建 laravel 工程 参考 工程创建点击此处 laravel 配置 数据库信息 DB_CONNECTIONmysql #连接什么数据库 DB_HOST127.0.0.1 # 连接 哪个电脑的 ip &#xff08;决定 电脑 本机&#xff09; DB_PORT3306 # 端口 DB_DATABASEyanyu…

【记录】VSCode|自用设置项

文章目录 1 基础配置1.1 自动保存1.2 编辑区自动换行1.3 选项卡换行1.4 空格代替制表符1.5 开启滚轮缩放 2 进阶设置2.1 选项卡不自我覆盖2.2 选项卡限制宽度2.3 选项卡组限制高度2.4 字体设置2.5 字体加粗2.6 侧边栏2.7 沉浸式代码模式 Zen Mode2.8 设置 Zen 模式的选项卡组 3…

filebeat接入nginx和mysql获取日志

下载nginx &#xff08;1&#xff09; 直接下载 yum install nginx -y&#xff08;2&#xff09;查看状态启动 systemctl start nginx systemctl status nginx&#xff08;3&#xff09;配置文件检查 nginx -t&#xff08;4&#xff09;端口检查 netstat -tulpn | grep :80&am…

Flutter项目打包ios, Xcode 发布报错 Module‘flutter barcode_scanner‘not found

报错图片 背景 flutter 开发的 apple app 需要发布新版本&#xff0c;但是最后一哆嗦碰到个报错&#xff0c;这个小问题卡住了我一天&#xff0c;之间的埪就不说了&#xff0c;直接说我是怎么解决的&#xff0c;满满干货 思路 这个报错 涉及到 flutter_barcode_scanner; 所…

携手并进,智驭教育!和鲸科技与智谱 AI 签署“101 数智领航计划”战略合作协议

近日&#xff0c;上海和今信息科技有限公司&#xff08;以下简称“和鲸科技”&#xff09;与北京智谱华章科技有限公司&#xff08;以下简称“智谱 AI”&#xff09;签署“101 数智领航计划”战略合作协议。双方将携手营造智能化学科教育与科研环境&#xff0c;提供多种大模型工…

前后端联调需要改ip联调多个后端,用nginx代理

前后端联调需要改ip联调多个后端 Nginx #user nobody; worker_processes 1;#error_log logs/error.log; #error_log logs/error.log notice; #error_log logs/error.log info;#pid logs/nginx.pid;events {worker_connections 1024; }http {include mime…

空洞卷积:Atrous/Dilated convolution - 语义分割中多用到

没办法&#xff0c;我还是很多基础的、底层的模块不通透&#xff0c;读论文难免会受到阻碍&#xff0c;而且这现在科研任务很急了&#xff0c;必须要马上动手实验&#xff0c;全给我弄明白、特别是算法&#xff01; 空洞卷积-可变形卷积-这一个个我都要。 空洞卷积据说在语义分…

MySQL企业常见架构与调优经验分享

文章目录 一、选择 PerconaServer、MariaDB 还是 MYSQL二、常用的 MYSQL 调优策略三、MYSOL 常见的应用架构分享四、MYSOL 经典应用架构 观看学习课程的笔记&#xff0c;分享于此~ 课程&#xff1a;MySQL企业常见架构与调优经验分享 mysql官方优化文档 一、选择 PerconaServer、…

机器学习与深度学习2:梯度下降算法和BP反向传播算法

梯度下降算法&#xff1a; 算法原理 上一章我们已知神经网络算法就是求解拟合函数&#xff0c;通过线性变换和非线性变换来得出损失函数最小的模型。那么是如何进行求解的呢&#xff0c;其中之一就是梯度下降算法。 如图&#xff0c;当我们需要求解拟合曲线时&#xff0c;如何…

Verilog基础:层次化标识符的使用

相关阅读 Verilog基础https://blog.csdn.net/weixin_45791458/category_12263729.html?spm1001.2014.3001.5482 一、前言 Verilog HDL中的标识符(identifier)是一个为了引用而给一个Verilog对象起的名字&#xff0c;分为两大类&#xff1a;普通标识符大类和层次化标识符大类。…

HarmonyOS NEXT 应用开发实战(六、组件导航Navigation使用详解)

在鸿蒙应用开发中&#xff0c;Navigation 组件是实现界面间导航的重要工具。本文将介绍如何使用 Navigation 组件实现页面跳转及参数传递&#xff0c;确保你能轻松构建具有良好用户体验的应用。 当前HarmonyOS支持两套路由机制&#xff08;Navigation和Router&#xff09;&…

字典学习算法

分为固定基字典和学习型字典 学习型字典 是指通过训练大量与目标数据相似的数据&#xff0c;学习其特征获得的字典。字典学习主要包括两个阶段&#xff0c;一个是字典构建阶段&#xff0c;一个是利用字典进行样本表示阶段。 首次提出&#xff1a;最优方向法&#xff08;Method …

Euporie 是一款功能强大、使用便捷的终端 Jupyter 交互工具,让Jupyter Notebook在终端下运行

在现代数据科学领域&#xff0c;Jupyter Notebook 已成为不可或缺的工具&#xff0c;它以其强大的交互性、可读性和可移植性而闻名。然而&#xff0c;在某些场景下&#xff0c;例如远程服务器、容器环境或仅仅个人偏好&#xff0c;使用终端进行操作更便捷。 Euporie 应运而生&a…

spring day 1021

ok了家人们&#xff0c;这周学习spring框架&#xff0c;我们一起去看看吧 Spring 一.Spring概述 1.1 Spring介绍 官网&#xff1a; https://spring.io/ 广义的 Spring &#xff1a; Spring 技术栈 &#xff08;全家桶&#xff09; 广义上的 Spring 泛指以 Spring Framework…

STM32L010F4 最小系统设计

画一个 STM32L010F4 的测试板子...... by 矜辰所致前言 最近需要用到一个新的 MCU&#xff1a; STM32L010F4 &#xff0c;上次测试的 VL53L0X 需要移植到这个芯片上&#xff0c;网上一搜 STM32L010F4&#xff0c;都是介绍资料&#xff0c;没有最小系统&#xff0c;使用说明等。…

在VMware上创建虚拟机以及安装Linux操作系统,使用ssh进行远程连接VMware安装注意点 (包含 v1,v8两张网卡如果没有的解决办法)

一&#xff0c;VMware上创建虚拟机 1.VMware下载 1&#xff09;点击VMware官网进入官网 网址:VMware by Broadcom - Cloud Computing for the EnterpriseOptimize cloud infrastructure with VMware for app platforms, private cloud, edge, networking, and security.https…

NAT工作原理详解:网络地址转换的关键角色

NAT工作原理详解&#xff1a;网络地址转换的关键角色 在现代计算机网络中&#xff0c;网络地址转换&#xff08;NAT&#xff09;扮演着至关重要的角色。它不仅仅是简单地将私有IP地址转换为公共IP地址&#xff0c;而是在多个方面保证了网络的正常运行和安全性。本文将详细讲解…

从网络请求到Excel:自动化数据抓取和保存的完整指南

背景介绍 在投资和财经领域&#xff0c;论坛一直是投资者们讨论和分享信息的重要平台&#xff0c;而东方财富股吧作为中国最大的财经论坛之一&#xff0c;聚集了大量投资者实时交流股票信息。对于投资者来说&#xff0c;自动化地采集这些发帖信息&#xff0c;并进行分析&#…

Maven私服架构

目录 1.maven私服介绍 1.1 私服介绍 1.2 Nexus介绍 2. maven私服实战 2.1 nexus安装 2.2 nexus仓库类型 2.3 将项目发布到私服 2.4 从私服下载jar包 2.5 将第三方jar包发布到私服 1.maven私服介绍 1.1 私服介绍 正式开发时&#xff0c;不同的项目组开发不同的工程。m…