mysql 全文索引中的Stopwords

Full-Text Stopwords 是指在全文搜索时被索引系统默认忽略的一组单词。这些通常是最常见的单词,比如 "the"、"is"、"at" 等英语中的助词、介词、连接词等。它们通常不含有具体的搜索意义,因此在创建全文索引的时候会被排除在外,以便减少索引大小并提高搜索效率。

在 MySQL 中使用全文索引和搜索时,Stopwords 的作用如下:

  1. 索引构建 - 当创建全文索引时,Stopwords 不会被包括在内。这意味着,如果你的搜索关键字包含了这些词,它们不会出现在索引结果中。

  2. 搜索查询 - 当执行全文搜索时,如果搜索字符串包含 Stopwords,那么这些词将不会被用于匹配。

你可以通过查看 MySQL 的官方文档来获取默认的 Stopword 列表,并根据需要修改它。例如,在 MyISAM 引擎中,停用词列表存储在 storage/myisam/ft_static.c 文件中,而 InnoDB 引擎的停用词列表是由服务器变量 innodb_ft_default_stopword 指定的表。

若要改变默认的停用词集合,你可以进行以下操作:

  1. 自定义停用词表 - 通过设置系统变量(例如 ft_stopword_file)来指定自己的停用词文件路径,或者对于 InnoDB 表,通过给 innodb_ft_server_stopword_table 设置一个指向你自己停用词表的值。

  2. 重新生成索引 - 更改停用词表后,相关的全文索引需要重建,以确保新的停用词列表生效。

  3. 使用IN BOOLEAN MODE搜索 - 如果你想在搜索时忽略停用词列表,可以在全文搜索中使用 IN BOOLEAN MODE 选项,这样即使是停用词也会被用于搜索匹配。

举例来说,如果你对一个包含文章文本的列使用全文索引搜索,但希望 "the" 和 "is" 这样的常见单词能够在搜索中匹配,你可能需要自定义停用词表或使用 IN BOOLEAN MODE 进行搜索。

请注意,调整停用词列表可能影响搜索结果的相关性和性能,因此应谨慎进行。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/184930.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

XC1136 功率传输(PD) Sink控制器IC PD诱骗器芯片 输出可调 可支持多个

XC1136是一款功率传输(PD) Sink控制器IC。XC1136可以从符合Type-CPD协议的电源中请求最大或指定电压。输入电压范围:3V~28V支持USBType-C规范版本1.3支持USB PD2.0和PD3.0通讯协议,最多支持七个电源对象 该XC1136内置拉低电阻CC1和CC2引脚。当XC1136连接到T…

Java —— ArrayList与顺序表

目录 1. 线性表 2. 顺序表 接口的实现 3. ArrayList简介 3.1 ArrayList介绍 3.2 ArrayList的构造方法 4. ArrayList的扩容机制 5. ArrayList的常见操作 6. ArrayList的遍历 7. 例题 8. ArrayList的具体使用 8.1 简单的洗牌算法 8.2 杨辉三角 9. ArrayList的问题及思考 1. 线性表…

“Install Js dependencies failed“JS SDK安装失败【Bug已解决-鸿蒙开发】

文章目录 项目场景:问题描述原因分析:解决方案:解决措施1解决方案2:其他解决方案解决方案3:此Bug解决方案总结项目场景: 在下载JS SDK时,出现下载失败的情况,并显示“Install Js dependencies failed”。 在使用版本为DevEco Studio 3.0.0.601 Beta1进行低代码开发时…

掌握Vue计算属性的应用

随着前端开发的发展,Vue 已经成为了前端开发的主流框架之一。在 Vue 中,计算属性是一个非常重要的概念,它可以让我们更好地管理数据和逻辑,让代码更加简洁易懂。 🍃计算属性的定义 计算属性是 Vue 中一个非常重要的概…

世微 低功耗 PFM DC-DC 升压芯片 AP8105 干电池手持设备驱动IC

概述 AP8105 系列产品是一种高效率、低纹波、工作频率高的 PFM 升压 DC-DC 变换器。AP8105 系列产品仅需要四个外围元器件,就可完成将低输入的电池电压变换升压到所需的工作电压,非常适合于便携式 1~4 节普通电池应用的场合。电路采用了高性能…

mybatis快速入门(基于Mapper接口编程)

1、准备数据模型,建库建表 CREATE DATABASE mybatis-example;USE mybatis-example;CREATE TABLE t_emp(emp_id INT AUTO_INCREMENT,emp_name CHAR(100),emp_salary DOUBLE(10,5),PRIMARY KEY(emp_id) );INSERT INTO t_emp(emp_name,emp_salary) VALUES("tom&qu…

测试相关-面试高频

测试面试相关 面试 测试的具体场景 功能测试 具体的测试工具Jmeter Postman selenium pytest 怎么看待测试的潜力与挑战 软件测试是正在快速发展,充满挑战的领域。尽管现在许多自动化测试软件的出现使得传统手工测试的方式被代替,但自动化测试工具的…

低功耗无线SOC芯片Si24R03

Si24R03是一款高度集成的低功耗无线SOC芯片,芯片为QFN32 5x5mm封装,集成了资源丰富的MCU内核与2.4G收发器模块,最低功耗可达1.6uA,极少外围器件,大幅降低系统应用成本,同时配套有成熟的开发调试软件和丰富的…

Oracle SQL优化

1、书写顺序和执行顺序 在Oracle SQL中,查询的书写顺序和执行顺序是不同的。 1.1SQL书写顺序如下: SELECTFROMWHEREGROUP BYHAVINGORDER BY 1.2 SQL执行顺序 FROM:数据源被确定,表连接操作也在此步骤完成。 WHERE:对…

MySQL进阶知识:SQL性能优化

目录 SQL性能分析 SQL执行频率 慢查询日志 profile详情 explain执行计划 索引的使用 最左前缀法则 范围查询 索引列运算 字符串加引号 模糊查询 or连接的条件 数据分布影响 SQL提示 覆盖索引 前缀索引 索引设计原则 SQL优化 insert优化 主键优化 页分裂 …

【Docker】安装RabbitMQ

1.拉取镜像 docker pull rabbitmq 2.运行容器 docker run \-e RABBITMQ_DEFAULT_USERitcast \-e RABBITMQ_DEFAULT_PASS123321 \-v mq-plugins:/plugins \--name mq \--hostname mq \-p 15672:15672 \-p 5672:5672 \-d \rabbitmq 3.安装管理页面的插件 进入容器内部 dock…

Linux C语言 24-格式化操作

Linux C语言 24-格式化操作 本节关键字:输入输出格式化参数 相关C库函数:printf、scanf、fprintf、fscanf 参考本栏目第20篇文章:Linux C语言 20-文件I/O 中的格式化参数部分。

前端项目环境的搭建

一、下载并且安装Node(不安装node,就安装nvm。nvm安装教程): 1.官网下载Node:https://nodejs.org/en/ 2.测试nodejs安装是否成功: 在windows powerShell中输入node -v 和 npm -v,看到版本号就…

Leetcode 236 二叉树的最近公共祖先

题意理解: 二叉树的最近公共祖先: 简单理解,就是p和q值的那两个节点,不断向上返回,然后会在一个点汇合,那么他们第一次汇合的这个点就是他们的最近公共祖先。 解题的思路就是: 如果这一层找到了…

Mac下更新python

1. 查看python版本 python3 -V2. 更新python版本 brew upgrade python3. 查看python3的路径: which python34. 修改.bash_profile文件 vim ~/.bash_profile插入python默认执行文件 alias python"/usr/local/bin/python3"5. 应用环境变量 source ~/.…

CRM与ERP如何协同服务于企业

在当今的商业环境中,客户关系管理(CRM)和 Enterprise Resource Planning(ERP)是两个不可或缺的系统。它们各自独立,但也可以协同工作,以提供更高效、更全面的企业解决方案。这种协同作用可以在销…

JAVA的一些便捷性方法(Object)

在IDEA中,如何查看JDK的源码? CTRL B; 常用方法: 1.equals() booleanequals(Object obj) 指示其他某个对象是否与此对象“相等”。 与 的比较: ,即可判断基本类型,也…

lodash中foreach踩坑

什么是lodash Lodash 是一个 JavaScript 实用工具库,提供了很多用于处理数据、简化开发等方面的功能。它提供了一组常用的工具函数,用于处理数组、对象、字符串等常见数据结构,同时也包含了一些函数式编程的工具。对于前端开发来说&#xff…

SAE-J1939协议入门解析

文章目录 前言一、SAE J1939物理层二、SAE J1939数据链路层1、帧结构1.1、帧起始(SOF)1.2、优先级(P)1.3、扩展数据页EDP(R)1.4、数据页(DP)1.5、替换远程请求Substitute Remote Request &#…

JavaScript解构数组

还记得之前我们是如何读取到数组里面的元素的么? const arr [2, 3, 4]; const a arr[0]; const b arr[1]; const c arr[2];然后通过这个方式去读取数组中的数据; 现在我们可以使用解构赋值的方法去实现 const [x, y, z] arr; console.log(x, y, …