敏感词过滤的php代码,PHP敏感词过滤

/**

* 禁词过滤

* 执行效率:每篇用时0.05秒

* @author liuxu

*

*/

class Logic_BlackWord

{

const APP_FORUM = 1;

const APP_BLOG  = 2;

const APP_VOTE  = 3;

/**

* 过滤得到禁词

* @param unknown $txt

* @return Ambigous

*/

public function getHitList($txt)

{

$hitList = array();

//对禁词分批过滤

$max = $this->getMax();

if($max)

{

$size = 1000;

$last = ceil($max/$size);

for($page=1;$page<=$last;$page++)

{

$result = $this->getHitListByPage($txt,$page,$size);

if($result) $hitList = array_merge($hitList,$result);

}

}

$hitList2 = array();

foreach($hitList as $hit=>$type)

{

$hitList2[$type][] = $hit;

}

return $hitList2;

}

private function getMax()

{

$redis = Rds::factory();

$memKey = 'blackWord_max';

$max = $redis->get($memKey);

if($max===false)

{

$max = 0;

$blackWord = new Model_BlackWord_BlackWord();

$para['field'] = "MAX(id) AS max";

$result = $blackWord->search($para);

if(isset($result[0]['max'])) $max = $result[0]['max'];

$redis->setex($memKey,300,$max);

}

return $max;

}

/**

* 分批过滤得到禁词

* @param unknown $txt

* @param number $page

* @param number $size

* @return multitype:Ambigous

*/

private function getHitListByPage($txt,$page=1,$size=1000)

{

$hitList = array();

//分批得到禁词树

$wordTree = $this->getWordTreeByPage($page,$size);

$txt = strip_tags($txt);

$txt = preg_replace('/[^a-zA-Z0-9\\x{4e00}-\\x{9fa5}]/iu','',$txt);

$len = mb_strlen($txt,'UTF-8');

for($i=0;$i

{

$char = mb_substr($txt,$i,1,'UTF-8');

if(isset($wordTree[$char]))

{

$result = $this->getHitListByTree(mb_substr($txt,$i,50,'UTF-8'),$wordTree);

if($result)

{

foreach($result as $hit=>$type)

{

$hitList[$hit] = $type;

}

}

}

}

return $hitList;

}

/**

* 是否禁词

* @param str $txt

* @param arr $wordTree

* @return multitype:unknown

*/

private function getHitListByTree($txt,&$wordTree)

{

$len = mb_strlen($txt,'UTF-8');

$point = & $wordTree;

$hit = '';

$hitList = array();

for($i=0;$i

{

$char = mb_substr($txt,$i,1,'UTF-8');

if(isset($point[$char]))

{

$hit .= $char;

$point = & $point[$char];

if(isset($point['type']))//匹配成功

{

$hitList[$hit] = $point['type'];

}

}

else

{

break;

}

}

return $hitList;

}

/**

* 分批得到禁词树

* @param int $page

* @param int $size

* @return arr:

*/

private function getWordTreeByPage($page=1,$size=1000)

{

$redis = Rds::factory();

$memKey = 'blackWord_tree_'.$page.'_'.$size;

$wordTree = $redis->get($memKey);

if($wordTree===false)

{

$wordTree = array();

$blackWord = new Model_BlackWord_BlackWord();

$start = ($page-1)*$size;

$end = $start + $size;

$para['where'] = "status=1 AND id>".$start." AND id<=".$end;

$result = $blackWord->search($para);

if($result)

{

foreach($result as $value)

{

if($value['word'])

{

$value['word'] = preg_split('/(?

$point = & $wordTree;

foreach($value['word'] as $char)

{

$point = & $point[$char];

}

$point['type'] = $value['type'];

}

}

}

$redis->setex($memKey,300,$wordTree);

}

return $wordTree;

}

}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/528373.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

? php 为啥报错,如何解决js里面的php代码报错问题

在一个模块中&#xff0c;前端是extjs,后端是php&#xff0c;报错&#xff0c;这是在php的错误警告开到最严格的时候报的错&#xff0c;虽然程序可以跑&#xff0c;可是日志堆积越来越多。Undefined variable&#xff1a;loginUserNameExt.onReady(function () {var app Ext.c…

java其他进程,Java进程优先于其他Windows进程

我的任务是创建一个自定义文件备份服务,允许任何使用此服务的笔记本电脑在连接到我们的网络服务器时备份某些目录.我得到的一个要求是,该服务应该基本上优先于用户在该笔记本电脑上的正常活动而不是阻碍性能……太多了.我用Java创建了这个程序,目的是将它作为服务包装在YAJSW中…

centos php redhat,RHEL / CentOS 安装 OPcache 提升 PHP 效能

OPcache 在 PHP 5.5 (默认没有开启)开始内建在 PHP, 前身是 Zend Optimizer, PHP 5.2, 5.3 及 5.4 则要透过安装 PECL extension 安装。它的作将已经编译的 PHP Script 储存在内存, 当下次存取 PHP Script 时不用重新编译, 这样便可以提高 PHP 的效能。以下是在 CentOS 7 安装指…

php数据回显是什么意思,jquery回显是什么意思

首先来看一下回显是什么意思&#xff1f;在数据提交出现错误的时候, 已填写的信息仍在文本框中, 比如用户登录, 当用户输入错误的密码之后, 用户名仍在文本框, 只是密码框清空。对于一些要填写很多信息的表单, 如果因为一些错误导致已经填写的整个表单信息重新填写, 对于用户非…

Java摩托车汽车轮胎数量,摩托车轮子上的知识,你知道多少?

原标题&#xff1a;摩托车轮子上的知识,你知道多少?摩托车轮子好比人的两条腿&#xff0c;决定了车子跑得远&#xff0c;跑得快和跑得是否安稳。摩友们似乎对轮子的关心不多&#xff0c;因为它是易损件&#xff0c;概念中轮子轮胎出了问题&#xff0c;随便找路边的“风火补胎”…

matlab中的 variable,matlab中的问题Missing variable or function

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼请教各位大虾啦!!matlab中的问题Missing variable or function.??? Error: File: D:\matlab\one.m Line: 17 Column: 11Missing variable or function.是什么意思啊?源程序是:%machine characteristic %p109 machine parameter…

php抽象方法db,PHP笔记之抽象方法抽象类

抽象方法定义&#xff1a;一个方法如果没有方法体&#xff0c;则这个方法就是抽象方法。1.一个方法们没有{}&#xff0c;直接使用分号结束的方法&#xff1b;2.如果是抽象方法&#xff0c;必须使用abstract(抽象关键字来修饰)抽象类1.如果一个类中有一个方法是抽象方法&#xf…

php配置文件加盐解密,PHP实现支持加盐的图片加密解密

一个简单的图片加解密函数&#xff0c;使用client跑&#xff0c;不要使用浏览器跑话不多说&#xff0c;直接上代码/*** Created by hello.* User: qq 845875470* Date: 2016/4/2* Time: 11:21*/$notice <<为了稳定性&#xff0c;必须在客户端跑格式 &#xff1a;php pat…

matlab中的uint8函数,未定义与 'uint8' 类型的输入参数相对应的函数 'fitnessty'

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼程序如下&#xff1a;clear allclcticpopsize15;lanti10;maxgen50;cross_rate0.4;mutation_rate0.1;a00.7;zpopsize5;bestf0;nf0;number0;Iimread(C:\Users\Yu\Pictures\feiji.jpg);if numel(I)>2Irgb2gray(I);end[m,n]size(I);…

php文本文件操作,文本文件操作的php类

var $file;var $index;//建立一个文件并写入输入 function null_write($new) {$ffopen($this->file,w);flock($f,LOCK_EX);fputs($f,$new);fclose($f);} // 添加数据记录到文件末端 function add_write($new) { $ffopen($this->file,a);flock($f,LOCK_EX);fputs($f,$new)…

php创建输入文本框,Asp:文本框与输入文本(PHP开发人员学习ASP)

What is the advantage to using an over using a standard ?>您可以在代码隐藏页面中更容易地引用文本框>注意,您可以通过在控件中使用runat “server”来访问代码隐藏中的任何HTML元素>您可以访问文本框上的更多属性,而不是输入html元素>您可以与其他ASP.NET控件…

oracle没有注册mdsdora,oracle rac一个节点服务注册不上,必须重启监听才能注册上,各位大神帮忙看一下...

环境是windows 2008 oracle 11.2.0.4 rac其中rac1节点服务总是注册不上&#xff0c;rac2节点正常--1、查看监听状态C:\Users\Administrator>lsnrctl statusLSNRCTL for 64-bit Windows: Version 11.2.0.4.0 - Production on 22-1月 -2017 17:24:16Copyright (c) 1991, 2013…

Oracle导入dmp文件报12504,ORA-12504:TNS :监听程序在 CONNECT_DATA 中未获得SERVICE_NAME...

使用本地的SQLPlus连接服务器上的Oracle数据库&#xff0c;这是由于本地有安装了Oracle数据库服务&#xff0c;所以才会系统先提示&#xff1a;ORA-12504:TNS: 监听程序在 CONNECT_DATA 中未获得 SERVICE_NAME再次输入用户名密码系统又提示&#xff1a;ORA-12560: TNS: 协议适配…

oracle数据库创建回滚,如何重建Oracle数据库的回滚段?

1、将数据关闭 svrmgrl >Shutdown abort2、修改初始化参数文件 $ vi $ORACLE_HOME/dbs/init。ora添加以下参数 rollback_segments(system) _corrupted_rollback_segments(r01,r02,r03,r04) _allow_resetlogs_corruptionture3、重新装载数据库 svrmgrl >Startup mount4、从…

oracle去掉默认值sql,如何在T-SQL中删除默认值或类似约束?

这里有我自己的版本&#xff0c;它会删除所有依赖的约束 – 默认约束 (如果存在的话)和所有受影响的检查约束 (正如SQL标准似乎暗示的一样&#xff0c;和其他一些数据库似乎是这样)declare constraints varchar(4000); declare sql varchar(4000); with table_id_column_positi…

oracle 取消exp权限,oracle 复制账号权限oracle11gexp导出问题:部分表导不出来

在oracle导出表的命令exp时候发现一个问题&#xff0c;就是部分表完全的导不oracle账号出来&#xff0c;经检查发现只要是表为空的都会导不出来。在如下表中发现segment_created都为NO的是导不出来的&#xff0c;经查询后&#xff0c;将语句提取出来执行即可。select alter tab…

linux下挂载samba服务器,Linux使用mount挂载samba共享

mysql can&&num;39&semi;t create threads in threadpool最近,我们在券商端的mysql运行一段时间后,发生mysql cant create threads in threadpool,如下所示: 据官网一个报告显示,目测是一个bug,内存紧张导致,那天 ...css content之counter-reset、content-incremen…

linux分区 挂盘,linux分区,挂盘,LVM

1. 虚拟机可以添加sisc硬盘&#xff0c;添加了要重启虚拟机才能生效重启后用fdisk -l可以查看到新添的盘&#xff0c;/dev/sdb是新加的第二块硬盘[[email protected] ~]# fdisk -lDisk /dev/sdb: 1073 MB, 1073741824 bytes255 heads, 63 sectors/track, 130 cylindersUnits c…

linux上源码安装mysql,Linux中源码包安装MySQL的shell脚本

#!/bin/bash#安装MYSQLyum -y install ncurses-develyum -y install autoconftar zxf /cmake--C /cd /cmake-./configure && gmake && gmake installcdgroupadd mysqluseradd -M -s /sbin/nologin/ mysql -g mysqltar zxf /mysql--C /usr/srccd /usr/src/mysql…

文本界面安装linux 7,安装 CentOS7 后必做的事 [最小化、文本界面]

软件包&#xff1a;1、参数自动补齐&#xff1a;#yum install bash-completion2、安装第三方软件包库&#xff1a;#yum -y install epel-release3、域名解析dig#yum install bind-utils4、下载文件命令 wget#yum install wget5、CentOS 6 之前常用网络命令安装:#yum install ne…