数字人训练数据修正和查看 不需要GPU也能运行的DH_live-加载自己训练-

自己训练模pth报错

 le "D:\ai\dh_live\app.py", line 42, in demo_mini
    interface_mini(asset_path, wav_path, output_video_name)
  File "D:\ai\dh_live\demo_mini.py", line 21, in interface_mini
    renderModel_mini.loadModel("checkpoint/DINet_mini/epoch_40.pth")
  File "D:\ai\dh_live\talkingface\render_model_mini.py", line 24, in loadModel
    self.net.infer_model.load_state_dict(net_g_static)
  File "D:\CyberWin\devpro\Python311\Lib\site-packages\torch\nn\modules\module.py", line 2581, in load_state_dict
    raise RuntimeError(
RuntimeError: Error(s) in loading state_dict for DINet_mini:
        Missing key(s) in state_dict: "ref_in_conv.3.conv.weight", "ref_in_conv.3.conv.bias", "ref_in_conv.3.norm.weight", "ref_in_conv.3.norm.bias", "ref_in_conv.3.norm.running_mean", "ref_in_conv.3.norm.running_var", "appearance_conv.0.conv1.weight", "appearance_conv.0.conv1.bias", "appearance_conv.0.conv2.weight", "appearance_conv.0.conv2.bias", "appearance_conv.0.norm1.weight", "appearance_conv.0.norm1.bias", "appearance_conv.0.norm1.running_mean", "appearance_conv.0.norm1.running_var", "appearance_conv.0.norm2.weight", "appearance_conv.0.norm2.bias", "appearance_conv.0.norm2.running_mean", "appearance_conv.0.norm2.running_var", "out_conv.2.conv.weight", "out_conv.2.conv.bias", "out_conv.2.norm.weight", "out_conv.2.norm.bias", "out_conv.2.norm.running_mean", "out_conv.2.norm.running_var".
        Unexpected key(s) in state_dict: "appearance_conv_list.0.0.conv1.weight", "appearance_conv_list.0.0.conv1.bias", "appearance_conv_list.0.0.conv2.weight", "appearance_conv_list.0.0.conv2.bias", "appearance_conv_list.0.0.norm1.weight", "appearance_conv_list.0.0.norm1.bias", "appearance_conv_list.0.0.norm1.running_mean", "appearance_conv_list.0.0.norm1.running_var", "appearance_conv_list.0.0.norm1.num_batches_tracked", "appearance_conv_list.0.0.norm2.weight", "appearance_conv_list.0.0.norm2.bias", "appearance_conv_list.0.0.norm2.running_mean", "appearance_conv_list.0.0.norm2.running_var", "appearance_conv_list.0.0.norm2.num_batches_tracked", "appearance_conv_list.0.1.conv1.weight", "appearance_conv_list.0.1.conv1.bias", "appearance_conv_list.0.1.conv2.weight", "appearance_conv_list.0.1.conv2.bias", "appearance_conv_list.0.1.norm1.weight", "appearance_conv_list.0.1.norm1.bias", "appearance_conv_list.0.1.norm1.running_mean", "appearance_conv_list.0.1.norm1.running_var", "appearance_conv_list.0.

 


To create a public link, set `share=True` in `launch()`.
ffmpeg -i G:\C盘临时缓存\Temp\gradio\93e68ec176966d4d582e464f62c252b2594238a1f21b8ae03549ab7588398fed\test.wav -ac 1 -ar 16000 -y video_data/tmp.wav
ffmpeg version N-118789-gb5be0c0aa9-20250316 Copyright (c) 2000-2025 the FFmpeg developersbuilt with gcc 14.2.0 (crosstool-NG 1.27.0.18_7458341)configuration: --prefix=/ffbuild/prefix --pkg-config-flags=--static --pkg-config=pkg-config --cross-prefix=x86_64-w64-mingw32- --arch=x86_64 --target-os=mingw32 --enable-gpl --enable-version3 --disable-debug --enable-shared --disable-static --disable-w32threads --enable-pthreads --enable-iconv --enable-zlib --enable-libfreetype --enable-libfribidi --enable-gmp --enable-libxml2 --enable-lzma --enable-fontconfig --enable-libharfbuzz --enable-libvorbis --enable-opencl --disable-libpulse --enable-libvmaf --disable-libxcb --disable-xlib --enable-amf --enable-libaom --enable-libaribb24 --enable-avisynth --enable-chromaprint --enable-libdav1d --enable-libdavs2 --enable-libdvdread --enable-libdvdnav --disable-libfdk-aac --enable-ffnvcodec --enable-cuda-llvm --enable-frei0r --enable-libgme --enable-libkvazaar --enable-libaribcaption --enable-libass --enable-libbluray --enable-libjxl --enable-libmp3lame --enable-libopus --enable-librist --enable-libssh --enable-libtheora --enable-libvpx --enable-libwebp --enable-libzmq --enable-lv2 --enable-libvpl --enable-openal --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenh264 --enable-libopenjpeg --enable-libopenmpt --enable-librav1e --enable-librubberband --enable-schannel --enable-sdl2 --enable-libsnappy --enable-libsoxr --enable-libsrt --enable-libsvtav1 --enable-libtwolame --enable-libuavs3d --disable-libdrm --enable-vaapi --enable-libvidstab --enable-vulkan --enable-libshaderc --enable-libplacebo --disable-libvvenc --enable-libx264 --enable-libx265 --enable-libxavs2 --enable-libxvid --enable-libzimg --enable-libzvbi --extra-cflags=-DLIBTWOLAME_STATIC --extra-cxxflags= --extra-libs=-lgomp --extra-ldflags=-pthread --extra-ldexeflags= --cc=x86_64-w64-mingw32-gcc --cxx=x86_64-w64-mingw32-g++ --ar=x86_64-w64-mingw32-gcc-ar --ranlib=x86_64-w64-mingw32-gcc-ranlib --nm=x86_64-w64-mingw32-gcc-nm --extra-version=20250316libavutil      59. 59.100 / 59. 59.100libavcodec     61. 33.102 / 61. 33.102libavformat    61.  9.107 / 61.  9.107libavdevice    61.  4.100 / 61.  4.100libavfilter    10.  9.100 / 10.  9.100libswscale      8. 13.102 /  8. 13.102libswresample   5.  4.100 /  5.  4.100libpostproc    58.  4.100 / 58.  4.100
[aist#0:0/pcm_s16le @ 00000231d6f122c0] Guessed Channel Layout: mono
Input #0, wav, from 'G:\C盘临时缓存\Temp\gradio\93e68ec176966d4d582e464f62c252b2594238a1f21b8ae03549ab7588398fed\test.wav':Metadata:comment         : vid:v0200fg10000c7e0kdbc77u98d4v9c9gencoder         : Lavf59.28.100Duration: 00:00:07.62, bitrate: 256 kb/sStream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 16000 Hz, mono, s16, 256 kb/s
Stream mapping:Stream #0:0 -> #0:0 (pcm_s16le (native) -> pcm_s16le (native))
Press [q] to stop, [?] for help
Output #0, wav, to 'video_data/tmp.wav':Metadata:ICMT            : vid:v0200fg10000c7e0kdbc77u98d4v9c9gISFT            : Lavf61.9.107Stream #0:0: Audio: pcm_s16le ([1][0][0][0] / 0x0001), 16000 Hz, mono, s16, 256 kb/sMetadata:encoder         : Lavc61.33.102 pcm_s16le
[out#0/wav @ 00000231d6e5cc40] video:0KiB audio:238KiB subtitle:0KiB other streams:0KiB global headers:0KiB muxing overhead: 0.050879%
size=     238KiB time=00:00:07.61 bitrate= 256.1kbits/s speed=22.7x
Traceback (most recent call last):File "D:\CyberWin\devpro\Python311\Lib\site-packages\gradio\queueing.py", line 625, in process_eventsresponse = await route_utils.call_process_api(^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\CyberWin\devpro\Python311\Lib\site-packages\gradio\route_utils.py", line 322, in call_process_apioutput = await app.get_blocks().process_api(^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\CyberWin\devpro\Python311\Lib\site-packages\gradio\blocks.py", line 2103, in process_apiresult = await self.call_function(^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\CyberWin\devpro\Python311\Lib\site-packages\gradio\blocks.py", line 1650, in call_functionprediction = await anyio.to_thread.run_sync(  # type: ignore^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\CyberWin\devpro\Python311\Lib\site-packages\anyio\to_thread.py", line 56, in run_syncreturn await get_async_backend().run_sync_in_worker_thread(^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^File "D:\CyberWin\devpro\Python311\Lib\site-packages\anyio\_backends\_asyncio.py", line 2470, in run_sync_in_worker_threadreturn await future^^^^^^^^^^^^File "D:\CyberWin\devpro\Python311\Lib\site-packages\anyio\_backends\_asyncio.py", line 967, in runresult = context.run(func, *args)^^^^^^^^^^^^^^^^^^^^^^^^File "D:\CyberWin\devpro\Python311\Lib\site-packages\gradio\utils.py", line 890, in wrapperresponse = f(*args, **kwargs)^^^^^^^^^^^^^^^^^^File "D:\ai\dh_live\app.py", line 42, in demo_miniinterface_mini(asset_path, wav_path, output_video_name)File "D:\ai\dh_live\demo_mini.py", line 19, in interface_minifrom talkingface.render_model_mini import RenderModel_MiniFile "D:\ai\dh_live\talkingface\render_model_mini.py", line 28

 

 

 File "D:\ai\dh_live\app.py", line 42, in demo_mini
    interface_mini(asset_path, wav_path, output_video_name)
  File "D:\ai\dh_live\demo_mini.py", line 21, in interface_mini
    renderModel_mini.loadModel("checkpoint/DINet_mini/epoch_40.pth")
  File "D:\ai\dh_live\talkingface\render_model_mini.py", line 57, in loadModel
RuntimeError: dictionary changed size during iteration

  File "D:\ai\dh_live\app.py", line 42, in demo_mini
    interface_mini(asset_path, wav_path, output_video_name)
  File "D:\ai\dh_live\demo_mini.py", line 21, in interface_mini
    renderModel_mini.loadModel("checkpoint/DINet_mini/epoch_40.pth")
  File "D:\ai\dh_live\talkingface\render_model_mini.py", line 61, in loadModel
NameError: name 'net_g_static' is not defined

e "D:\ai\dh_live\talkingface\render_model_mini.py", line 62, in loadModelFile "D:\CyberWin\devpro\Python311\Lib\site-packages\torch\nn\modules\module.py", line 2581, in load_state_dictraise RuntimeError(
RuntimeError: Error(s) in loading state_dict for DINet_mini:size mismatch for source_in_conv.0.conv.weight: copying a param with shape torch.Size([32, 6, 7, 7]) from checkpoint, the shape in current model is torch.Size([12, 3, 3, 3]).

FileNotFoundError: [Errno 2] No such file or directory: 'assets\\combined_data.json.gz'
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/74457.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基姆拉尔森计算公式

基姆拉尔森计算公式(Zellers Congruence 的变体)是一种快速根据公历日期计算星期几的数学公式。其核心思想是通过对年月日的数值进行特定变换和取模运算,直接得到星期几的结果。 公式定义 对于日期 年-月-日,公式如下&#xff1a…

数字孪生在智慧城市中的前端呈现与 UI 设计思路

一、数字孪生技术在智慧城市中的应用与前端呈现 数字孪生技术通过创建城市的虚拟副本,实现了对城市运行状态的实时监控、分析与预测。在智慧城市中,数字孪生技术的应用包括交通流量监测、环境质量分析、基础设施管理等。其前端呈现主要依赖于Web3D技术、…

基于CNN-LSTM的深度Q网络(Deep Q-Network,DQN)求解移动机器人路径规划,MATLAB代码

一、深度Q网络(Deep Q-Network,DQN)介绍 1、背景与动机 深度Q网络(DQN)是深度强化学习领域的里程碑算法,由DeepMind于2013年提出。它首次在 Atari 2600 游戏上实现了超越人类的表现,解决了传统…

结构型设计模式。持续更新

结构型 - 外观 提供了一个统一的接口,用来访问子系统中的一群接口,从而让子系统更容易使用。 public class SubSystem {public void turnOnTV() {System.out.println("turnOnTV()");}public void setCD(String cd) {System.out.println(&quo…

从零构建大语言模型全栈开发指南:第五部分:行业应用与前沿探索-5.1.2行业落地挑战:算力成本与数据隐私解决方案

👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 文章大纲 从零构建大语言模型全栈开发指南-第五部分:行业应用与前沿探索5.1.2 行业落地挑战:算力成本与数据隐私解决方案1. 算力成本挑战与优化策略1.1 算力成本的核心问题1.2 算力优化技术方案2. 数据隐私挑战…

量子计算与人工智能融合的未来趋势

最近研学过程中发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。 在当今科技飞速发展…

六种光耦综合对比——《器件手册--光耦》

目录 十二、光耦 简述 基本结构 工作原理 主要特点 应用领域 优势与局限性 选择光耦时需要考虑的因素 详尽阐述 1 栅极驱动光耦 基本结构 工作原理 主要特点 应用领域 选择栅极驱动光耦时需要考虑的因素 典型产品示例 总结 2 逻辑输出光耦 基本结构 工作原理 主要特点 应用…

【蓝桥杯嵌入式——学习笔记一】2016年第七届省赛真题重难点解析记录,闭坑指南(文末附完整代码)

在读题过程中发现本次使用的是串口2,需要配置串口2。 但在查看产品手册时发现PA14同时也是SWCLK。 所以在使用串口2时需要拔下跳线帽去连接CH340。 可能是用到串口2的缘故,在烧录时发现报了一个错误。这时我们要想烧录得按着复位键去点击烧录&#xff0c…

三、GPIO

一、GPIO简介 GPIO(General Purpose Input Output)通用输入输出口GPIO引脚电平:0V(低电平)~3.3V(高电平),部分引脚可容忍5V 容忍5V,即部分引脚输入5V的电压,…

Java实战报错

哪错了 Preview 在这段Java代码中,map.put("Cc", 20); 这一行的键 "Cc" 被标记为错误。这可能是由于以下几种原因: 键值类型不匹配:虽然在你的代码中没有显示出来,但确保 HashMap 的键是 String 类型&#xf…

25大唐杯赛道一本科B组知识点大纲(下)

5G/6G网络技术知识点(10%) 工程概论及通信工程项目实践(20%) 5G垂直行业应用知识点(20%) ⭐⭐⭐为重点知识,尽量要过一遍哦 大唐杯赛道一国一备赛思路 大唐杯国一省赛回忆录--有付出就会有收…

docker的文件系统Overlay2

OverlayFS(Overlay2)文件系统深度解析 Overlay2 是 Docker 默认使用的联合文件系统(Union Filesystem),用于管理容器镜像的分层存储和容器运行时文件系统的合并。它基于 Linux 内核的 OverlayFS 技术,是早…

WebRTC技术简介及应用场景

写在前面 本文是参考稀土掘金的文章,整理得出,版权归原作者所有! 参考链接:https://juejin.cn/book/7168418382318927880/section/7171376753263247396 WebRTC(Web Real-Time Communication) 是一项开源技术,允许浏览器和移动应用直接进行…

Windows 图形显示驱动开发-WDDM 2.1 功能(四)

驱动程序版本控制 图形适配器或芯片集的驱动程序 DLL 和 SYS 文件必须具有正确格式的文件版本。 驱动程序信息文件 (.inf)、内核模式驱动程序 (.sys) 和用户模式驱动程序 (.dll) 文件的版本信息必须一致。 此外,.inf 的 [SignatureAttributes] 部分中标识为 PETru…

什么是 StarRocks?核心优势与适用场景解析

在数据量持续爆发的时代,企业对实时分析的需求日益迫切。例如,电商大促期间的交易监控、广告投放效果的即时反馈等场景,均要求毫秒级的响应速度。然而,传统工具如 Hadoop、Hive 等存在明显短板:复杂查询性能不足、资源…

Java基础 4.3

1.对象机制练习 public class Object03 {public static void main(String[] args) {Person a new Person();a.age 10;a.name "小明";Person b;b a;System.out.println(b.name);//小明b.age 200;b null;System.out.println(a.age);//200System.out.println(b.a…

视频设备轨迹回放平台EasyCVR综合智能化,搭建运动场体育赛事直播方案

一、背景 随着5G技术的发展,体育赛事直播迎来了新的高峰。无论是NBA、西甲、英超、德甲、意甲、中超还是CBA等热门赛事,都是值得记录和回放的精彩瞬间。对于体育迷来说,选择观看的平台众多,但是作为运营者,搭建一套体…

搬砖--贪心+排序的背包

a在上面b在下面->a.v-M-b.m>b.v-M-a.m->剩余率大 所以我先遍历a&#xff0c;让a在上面 这就是要考虑贪心排序的01背包 因为它有放的限制条件 #include<bits/stdc.h> using namespace std; #define N 100011 typedef long long ll; typedef pair<ll,int>…

《2024年全球DDoS攻击态势分析》

从攻击态势来看&#xff0c;2024年DDoS攻击频次继续呈增长趋势&#xff0c;2024年同步增加1.3倍&#xff1b;超大规模攻击激增&#xff0c;超800Gbps同比增长3.1倍&#xff0c;累计高达771次&#xff0c;且互联网史上最大带宽和最大包速率攻击均被刷新&#xff1b;瞬时泛洪攻击…

数据分析参考架构详解

1.数仓方法论 2. 数仓建模参考架构 3.大数据参考架构 4.数据分析参考架构