目前互联网是非常发达的,但是随着技术的发展,有些问题逐渐变得严重。对于一般企业而言,一个比较重要的问题就是审核准确性和成本问题。
比如知乎的审判官,我本人是最早的一批审判官,然而多年下来的经历却很让人感到无语。因为审判官的准确率非常低,大量有问题的评论,尤其是掌握了话术的评论,基本要考审判官去二次申诉才行。
人工智能算是一个可行的方法,但是问题在于成本太高。一个网站上一天可能有上亿条的文本,近期在和某高效一起研究某教育政策的网络影响确实也发现了一些问题,和我一起合作的研究者本人就是这个教育政策指定人之一,目前就是后续的研究就是在考虑后续政策是否要有变化。
过程中自然收集了很多网络数据,自然也遇到了很多审核问题,于是内心有很多感慨,不过也都是感慨而已。
直到最近,我本人也确实遇到了一个让人忍俊不禁,又让我本人很生气的事情。b站有人直接骂人,然而我怎么举报都不管用,我一生气直接问客服“如果有人说陈睿他爹pc也不算人身攻击吗?”(文本申诉的客服)
客服啥都没回复的时候,当我以为举报算成功的时候,我自己被封禁了。
这一刻,我好像才领悟了什么,在以往中,我都是以仲裁者,数据研究者的身份去面对一些明显有问题的评论的,然而事实是每一条攻击性的评论背后最起码牵扯到两个人,每一条诉苦的评论背后其实也可能牵扯到最少一个家庭,实际从研究看绝对不止一个。
或许我该做点什么。于是便有了这个系列,和这个预告。系列报告的内容包含三部分(1)网络数据研究的主要技术与方法(2)可以公开的本次教育政策研究的部分数据与成功(3)目前网咯管理中的一些问题和可能有效的解决方法。
敬请期待,谢谢。