背景
用户上传的商品表一般会包含商品名称,由于这些商品名称是用户自己起的,里面可能包含了敏感词,需要通过sql找出来哪些商品的商品名称包含了敏感词汇
hive sql实现查找商品表名称中包含敏感词的商品
实现思路:
1.商品表和敏感词表进行join时的连接条件设置成name contains 敏感词的形式
2.一般来说join的on条件都只是需要有一个equal等值连接,所以我们每个表设置一个虚拟列,仅仅是为了满足join的on条件有一个等值操作
结果sql如下所示:
SELECT merchandise_const.mid, merchandise_const.name
FROM (SELECT mid, name, 'constant_value' AS constant_col FROM merchandise
) AS merchandise_const
JOIN (SELECT key, 'constant_value' AS constant_col FROM sensitive
) AS sensitive_const
ON merchandise_const.constant_col = sensitive_const.constant_col
AND merchandise_const.name LIKE CONCAT('%', sensitive_const.key, '%');
这样就可以查找到商品名称中包含了敏感词的商品列表