【转】关键字过滤算法

 

using System;
using System.Collections.Generic;
using System.Text;
using System.Data;
using System.Collections;namespace BLL.Common
{#region 操作类public class KeywordsFilter{#region 关键字过滤/// <summary>/// 关键字过滤/// /// </summary>/// <param name="keywords"></param>/// <returns></returns>public static string Filter(string keywords){//需过滤关键字集合List<string> badwords = new List<string>();KeywordsFilterClass kf = new KeywordsFilterClass();keywords = kf.BadwordInKeywords(keywords, badwords);return keywords;}#endregion}#endregion#region 关键字过滤类/// <summary>/// 关键字过滤类/// </summary>public class KeywordsFilterClass{private Dictionary<string, object> hash = new Dictionary<string, object>();//脏字字典 开头脏字存储private BitArray firstCharCheck = new BitArray(char.MaxValue);//脏字字典 单个char存储private BitArray allCharCheck = new BitArray(char.MaxValue);private int maxLength = 0;/// <summary>/// 初始化 已存储的 过滤字符串/// </summary>/// <param name="words"></param>private void InitHash(List<string> badwords){foreach (string word in badwords){//保存字典内不存在的脏字if (!hash.ContainsKey(word)){hash.Add(word, null);//设置脏字计算长度this.maxLength = Math.Max(this.maxLength, word.Length);firstCharCheck[word[0]] = true;foreach (char c in word){allCharCheck[c] = true;}}}}/// <summary>/// 替换字符串中的脏字为指定的字符/// </summary>/// <param name="text"></param>/// <returns></returns>public string BadwordInKeywords(string text, List<string> badwords){//初始化 脏字字典this.InitHash(badwords);int index = 0;while (index < text.Length){//判断开头脏字if (!firstCharCheck[text[index]]){//未找到开头脏字 则索引累加while (index < text.Length - 1 && !firstCharCheck[text[++index]]) ;}for (int j = 1; j <= Math.Min(maxLength, text.Length - index); j++){if (!allCharCheck[text[index + j - 1]]){break;}string sub = text.Substring(index, j);if (hash.ContainsKey(sub)){text = text.Replace(sub, "**");//this.InitHash(badwords);index += j;break;}}index++;}return text;}}#endregion
}

 

转载于:https://www.cnblogs.com/TiestoRay/articles/2686115.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/548318.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

char*转wstring

void char_to_wchar(const char* ch, std::wstring& w_str) { wchar_t* wchar; int len MultiByteToWideChar(CP_ACP, 0, ch, strlen(ch), NULL, 0); wchar new wchar_t[len 1]; MultiByteToWideChar(CP_ACP, 0, ch, strlen(ch), wchar, len); wchar[len] ‘\0’; w_st…

如何用cmd命令加密文件夹

如何用cmd命令加密文件夹? 首先先从开始&#xff0d;运行中打开Cmd窗口。然后在cmd窗口中输入如下命令 md d:\test..\ 在d盘上创建一个名为test.的文件夹。我们刚才在d盘创建的那个文件夹在普通方式是打不开的&#xff0c;不信你就试试。 那么我们如何才能打开这个test.的文件…

任何项目都适用的CMakeLists配置

声明下&#xff1a;本人想把CMakeLists中的内容写好,csdn格式化了&#xff0c;无能为力&#xff0c;以下是本人在生产环境中已经使用过了。 测试代码: #include int main() { //不支持linux //#ifndef _DEBUG #ifndef DEBUG std::cout << “release” << std::end…

深入 Apache Kylin Cube 与查询优化

2019独角兽企业重金招聘Python工程师标准>>> 近几年&#xff0c;Apache Kylin作为一个高速的开源分布式大数据查询引擎正在迅速崛起。它充分发挥Hadoop、Spark、HBase等技术的优势&#xff0c;通过对超大规模数据集进行预计算&#xff0c;实现秒级甚至亚秒级的查询响…

关于lock_guard使用细节

c11之后新增的了lock_guard函数&#xff0c;使用起来比较方便&#xff0c;但难免会遇到很多坑&#xff0c;接下来&#xff0c;我就简单说一下&#xff1a; 1&#xff1a;如何自己实现一个mutex类的话&#xff0c;需要使用lock函数和unlock函数&#xff0c;而且名字要一模一样 2…

WPF的WebBrowser屏蔽弹出脚本错误窗口

WPF中使用System.Windows.Controls.WebBrowser时脚本错误会弹出提示框&#xff0c;但这个WebBrowser没有提供类似System.Windows.Forms.WebBrowser的ScriptErrorsSuppressed方法&#xff0c;于是MSDN上有了解决办法&#xff0c;但是试了试不行&#xff0c;改了下就可以啦&#…

混乱开发,既伤身体又伤感情

这几天读了些UML用户指南和设计模式面向对象开发&#xff0c;由于写了很长时间的程序&#xff0c;突然发现体力劳动越来越严重&#xff0c;情绪有些低落和凌乱。 实现虽然已经结束&#xff0c;可是竟然在不知不觉中留下了一丝软件开发的阴影。这几天很不情愿去写代码&#xff…

常见的排序算法二——希尔排序

原理&#xff1a;被称为增量缩小排序。先将序列按增量划分为元素个数相同的若干组&#xff0c; 使用直接插入排序法进行排序&#xff0c;然后不断缩小增量直至为1&#xff0c; 最后使用直接插入排序完成排序。 要点&#xff1a;增量的选择以及排序最终以1为增量进行排序结束。 …

Centos搭建SVN服务器及配置文件

2019独角兽企业重金招聘Python工程师标准>>> 1、安装 #yum install subversion 判断是否安装成功 yum安装结束时会显示版本 svnserve, version 1.6.11 (r934486) 出现上面的提示&#xff0c;说明安装成功。 有了SVN软件后还需要建立SVN库。 #mkdir /opt/svn/repos …

.Net Micro Framework导航总贴(新手必看)

一、什么是.Net Micro Framework它是一个.Net框架&#xff08;微型框架&#xff09;&#xff0c;也是一个嵌入式系统OS&#xff0c;可以裸奔在ARM单片机上&#xff0c;也可以运行在别的嵌入式系统上。我们可以用VisualStudio C#开发代码&#xff0c;调用对应各种硬件的类库方法…

char数组拷贝wchar数组

std::string str “123”; size_t nDestSize mbstowcs(NULL, str.c_str(), 0) 1; //size_t nDestSize strlen(str.c_str()) 1; wchar_t* wchDest new wchar_t[nDestSize]; wmemset(wchDest, 0, nDestSize); mbstowcs(wchDest, str.c_str(), nDestSize); std::wstring wst…

IP地址查询接口及调用方法

为什么80%的码农都做不了架构师&#xff1f;>>> 设计蜂巢IP地址查询接口&#xff1a;http://www.hujuntao.com/api/ip/ip.php腾讯IP地址查询接口&#xff1a;http://fw.qq.com/ipaddress新浪IP地址查询接口&#xff1a;http://int.dpool.sina.com.cn/iplookup/iplo…

c++11或c++14或c++17参数包的使用

include //张开函数啦 template void display1(T a) { std::cout << a << std::endl; } template void display1() { std::cout << “void” << std::endl; } //逗号展开函数 template<typename Tvoid,typename … Args> void display1(T fi…

加解密技术(Cryptography)基本概念

转载自&#xff1a;http://www.cnblogs.com/piyeyong/archive/2010/06/10/1744692.html 要想实现在不安全的网络上的安全通信&#xff0c;需要考虑3个方面的问题&#xff1a;保密(Privacy)&#xff0c;认证(Authentication)&#xff0c;完整性(Integrity)。 1.保密(Privacy) 数…

select的列子说明select内部实现原理

1:select内部是个数组&#xff0c;而epoll内部结构是红黑二叉树 2&#xff1a;select查询起来慢&#xff0c;而epoll查询起来快 3:每次循环&#xff0c;内部都要发生拷贝&#xff08;查看相关代码&#xff09;而epoll不需要这样的操作,也就是初始化一次拷贝 #include #include&…

.NET配置文件读写实例(附SosoftConfigHelper类)

配置文件在软件开发中起到举足轻重的作用&#xff0c;可以说不可或缺。.NET程序可使用.config文件作为配置文件&#xff0c;例如WinForm程序的*.app.config、Web程序的web.config。.config文件是标准的XML文件。本实例可读取、修改和添加app.confing或者web.config文件的appSet…

关于shared_from_this的转换

声明&#xff1a;以下这函数&#xff0c;使用场景再lambda表达式中使用 std::weak_ptr<websockets_session> weak_self() { return std::weak_ptr<websockets_session>(shared_from_this()); }

HTML5标签

<header>主要用于导航&#xff0c;头部&#xff0c;可以嵌套&#xff0c;但不可以嵌套在<address>标签中。 <hgroup>在<header>里面定义具体内容的&#xff0c;是一个小容器。 <article></article>:大块文章&#xff0c;主要用于文字的显示…

多态的调用方法

1: 父类的指针指向子类的地址&#xff0c;然后调用虚函数 列子: #include<iostream> #include<memory> class A { public: A() default; virtual ~A() default; virtual void display() { std::cout << "A" <<…

spring security3 统计在线用户

首先&#xff0c;我们需要使得ConcurrentSessionFilter生效并在spring-security.xml配置。[html] view plaincopy<http auto-config"true" use-expressions"true"> <!-- Uncomment to limit the number of sessions a user can have --> …