✨ 1: DomoAI
升级中国水墨画风格2.0
DomoAI是一个多功能的AI视频处理工具,可以将视频转换成多种风格,包括日本动漫、3D卡通、漫画和像素风格等。用户只需上传原始视频,通过简单的操作就能实现风格转换,制作出具有个性的高质量视觉作品。除了视频风格转换,DomoAI还能从图片生成视频,实现从文本到图片、动漫风格到现实风格的图像转换等多种操作。此外,DomoAI还提供免费的100积分体验额度供新注册用户使用,让用户能够轻松释放创造力,享受创作乐趣。
将现有模型升级到 /video 2.0,包括:
- 日本动画 2.1
- 纸艺2.0
- 像素艺术2.0
- 纯色动漫2.0
- 中国水墨画风格2.0
- 详细的动漫风格2.0
地址:https://domoai.app/
✨ 2: AnyV2V
新颖的视频编辑框架,可以帮助用户通过两个简单步骤来编辑视频,提示(prompt-based)的编辑,风格转移,身份操控都不在话下
AnyV2V是一个无需调整即可实现高外观和时间一致性的视频编辑框架。它可以无缝地结合最先进的图像编辑方法来执行多种类型的编辑任务,包括基于提示(prompt-based)的编辑、基于参考(reference-based)的风格转移、以主题(subject-driven)驱动的编辑和身份操控(identity manipulation)。这意味着,无论你想修改视频中的人物形象、改变场景风格,还是根据文本提示调整视频内容,AnyV2V都能够帮你实现。
地址:https://github.com/TIGER-AI-Lab/AnyV2V
✨ 3: StyleTTS2
通过风格扩散与大型语音语言模型对抗训练实现接近人类水平的文本到语音合成
StyleTTS 2是一个先进的文本到语音(TTS)模型,它利用风格扩散和与大型语音语言模型(SLMs)的对抗训练来实现接近人类水平的语音合成。与其前身不同,StyleTTS 2通过将风格模型化为一个随机的潜变量,并通过扩散模型来生成最适合给定文本的风格,而不需要参考语音,从而实现了高效的潜在扩散并受益于扩散模型提供的丰富语音合成。此外,该模型还使用了如WavLM这样的大型预训练SLM作为判别器,并配合新颖的可微时长建模进行端到端训练,从而提高了语音的自然度。在单一说话人的LJSpeech数据集上,StyleTTS 2超越了人类录音,并在多说话人的VCTK数据集上达到了与人类相同的水平。此外,在LibriTTS数据集上的训练还使得模型在零样本说话人适配上超越了之前公开可用的模型。
地址:https://github.com/yl4579/StyleTTS2
✨ 4: StyleSketch
通过少量数据和生成模型提取多种风格人脸草图的技术
StyleSketch是一个使用了生成模型优先级(generative prior)的工具,专门设计来从人脸照片中提取风格化的面部草图。这个技术是基于有限的数据来实现的,意味着它能够在只有少量训练数据的情况下也能产生高质量的结果。StyleSketch的主要功能可以总结如下:
地址:https://github.com/kwanyun/StyleSketch
更多AI工具,参考国内AiBard123,Github-AiBard123