6、片花关联长视频
脏话检测功能本身远不如上一篇介绍的片花关联长视频有技术挑战性,不过还是值得说说,因为这是我们采用技术方式提高工作效率的第一次尝试。
游戏解说是审核难度比较大的一类短视频内容,一方面是时间比较长,很多游戏一局下来要5分钟以上,超过10分钟甚至15分钟的情况也很普遍,需要的审核时间比较长;主要的风险是容易出现主播说脏话的情况,而且这种情况的出现非常随机,可能这个主播的心态一直都很平和,突然被人一枪爆头,就忍不住飙出来一句 @#$%^& ,因为时间比较短很容易被跳过,可内容中存在这种情况是坚决不能上电视大屏的,又必须把这种内容找出来。大家碰到这种情况很多时候都是宁可错杀也不要错放,这又导致大屏可用的游戏解说内容比较少,不能满足业务发展的需求。
最早我们是从账号维度进行管理,对于习惯性飙脏话的主播,会在前端高亮显示,提醒审核人员注意,这个方法有一点效果,但还不能让人满意,一是管理的颗粒度比较粗,容易出现误杀或误放,二是账号维护的工作量也不小,只能针对一些头部账号,而且账号维护有滞后性,把一个账号加入告警名单之前可能很多问题内容已经被放过去了。
后面我们考虑能不能通过技术手段辅助审核,如果要识别字幕计算量太大,而且很多脏话并不出现在字幕上,于是想到了音频识别的方案。首先抽取视频的音频信息,进行语音识别,把音频转成文字,再从文字中识别关键词,如果命中了关键词,会返回疑似在某个位置可能存在脏话。
前端的审核界面也对脏话识别的结果做了处理,在视频的进度条上用特殊标记加了提醒,表明这个位置疑似存在脏话,需要人工判断,并且增加了快捷键可以直接跳到下一个告警位置,以方便审核人员快速判断。
通过上面的方式,游戏解说内容的审核效率和正确率都有了明显的提升。