敏感词系列
sensitive-word-admin 敏感词控台 v1.2.0 版本开源
sensitive-word-admin v1.3.0 发布 如何支持分布式部署?
01-开源敏感词工具入门使用
02-如何实现一个敏感词工具?违禁词实现思路梳理
03-敏感词之 StopWord 停止词优化与特殊符号
04-敏感词之字典瘦身
05-敏感词之 DFA 算法(Trie Tree 算法)详解
06-敏感词(脏词) 如何忽略无意义的字符?达到更好的过滤效果
v0.10.0-脏词分类标签初步支持
v0.11.0-敏感词新特性:忽略无意义的字符,词标签字典
v0.12.0-敏感词/脏词词标签能力进一步增强
v0.13.0-敏感词特性版本发布 支持英文单词全词匹配
v0.16.1-敏感词新特性之字典内存资源释放
业务背景
[功能]建议增加IP地址过滤 #43
请求增加一个过滤IP地址的功能,可以避免掉一些链接发不出去改发IP的
https://github.com/houbb/sensitive-word/issues/43
IP 的检测
说明
支持版本:v0.17.0
我适合使用在避免一些用户绕过网址检测,输入 ip 的场景。
使用方式
final String text = "个人网站,如果网址打不开可以访问 127.0.0.1。";
final SensitiveWordBs sensitiveWordBs = SensitiveWordBs
.newInstance()
.enableIpv4Check(true)
.init();List<String> wordList = sensitiveWordBs.findAll(text);
Assert.assertEquals("[127.0.0.1]", wordList.toString());
启用方式
通过引导类 enableIpv4Check 开关控制,默认为关闭。
小结
ip 的检测相对比较复杂一点。
虽然技术的发展,ipv6 也逐渐投入使用。
最好是可以把这个定义的能力放开,后续可以考虑。
开源代码
敏感词 https://github.com/houbb/sensitive-word
敏感词 https://github.com/houbb/sensitive-word-admin