简介 关于接口输入输出的讨论。 输入 1、音频文件路径,类型为:字符串; 2、预测多标签类型的排名,前n名,类型为:整型。 处理 1、将输入的音频分割为多个以1s为时间单位的音频片段; 2、利用PANN框架预测音频片段的标签分布; 3、输出鼾声、梦话等音频事件对应片段的标签分布及开始结束时间。 输出 1、鼾声、梦话等音频事件对应片段的标签分布及开始结束时间; 2、多个音频片段构成的自定义类列表。 下图为音频事件对应片段的类定义: