Diffusion Models视频生成-博客汇总
前言:在 AI 领域,近年来各个子领域都逐渐向 transformer 架构靠拢,只有视觉生成领域一直以 diffusion 结构作为主流方向,但是近年来谷歌、Meta、华为等大厂都在尝试使用基于LLMs的结构完成视觉生成任务。相比于趋于成熟的图像生成任务,视频生成任务是当下最火爆最具探索意义的方向。那么视频生成的最终路线还会由SD统治吗?基于LLMs的技术路线是否能颠覆基于SD的技术方案?这两种技术方案各自有哪些优点和缺点?
目录
基于LLMs的视频生成原理