Android 分词的两种方式

前言:

        本文分别介绍了原生和三方(Jieba)两种分词方式的使用和注意事项

1、安卓原生BreakIterator分词

        比较简单,但是效果不太行

    /***  功能:原生分词*  参数:text:需要分词的语句*  返回值:return:分词后的语句*  作者:赵星海*/private fun setTextBreakIterator(text: String) :String {val boundary: BreakIterator = BreakIterator.getWordInstance(Locale.CHINA)boundary.setText(text)var start: Int = boundary.first()var end: Intval arrayListOf = arrayListOf<String>()while (start != BreakIterator.DONE) {end = boundary.next()if (end <= start) continueval word: String = text.substring(start, end)arrayListOf.add(word)start = boundary.next()}return arrayListOf.toString()}
        执行结果:

                绿色区域为分词结果

        

        

2、Jieba分词 也叫“结巴”分词

        准备:

               Jieba的依赖是坏的,不能用的,

                网上给出的和github上写的依赖都是不可以使用的,

                所以拷贝其中的核心类是目前最靠谱的方案

                去Github把Jieba项目下载下来,然后把关键类和文件拷贝到自己项目中

https://github.com/452896915/jieba-androidicon-default.png?t=O83Ahttps://github.com/452896915/jieba-android        需要这些文件:

        

        注意:assets下的文件都要拷贝过来,否则会报空指针,即便处理了空指针也无法中文分词

         使用:

                1、提前初始化JiebaSegmenter         

        JiebaSegmenter.init(applicationContext)

                2、切子线程调用getJiebaSegmenterSingleton() ->同步分词方法

                    Thread {val string: String =JiebaSegmenter.getJiebaSegmenterSingleton().getDividedString(text).toString()runOnUiThread {//在主线程将结果stirng 显示出来}}.start()

                3、还有一个异步分词方法这边就不介绍了,直接调用就行了

                      方法名:getDividedStringAsync()

                      所属类:JiebaSegmenter

        执行结果:

        


 更多内容推荐:

https://blog.csdn.net/qq_39731011/category_7565212.html?fromshare=blogcolumn&sharetype=blogcolumn&sharerId=7565212&sharerefer=PC&sharesource=qq_39731011&sharefrom=from_linkicon-default.png?t=O83Ahttps://blog.csdn.net/qq_39731011/category_7565212.html?fromshare=blogcolumn&sharetype=blogcolumn&sharerId=7565212&sharerefer=PC&sharesource=qq_39731011&sharefrom=from_link


如果您感觉文章有用的话,麻烦点个赞吧!
如果您发现文章有任何错误或建议,请评论区留言或者私信!
深海谢过各位的支持,一起加油!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/61998.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何开展单元测试

1、是什么 单元测试&#xff08;Unit Testing&#xff09;又称为模块测试&#xff0c;是针对程序模块来进行正确性检验的测试工作。 程序模块是软件设计的最小单位&#xff0c;程序单元是应用的最小可测试部件 • 在面向过程编程中&#xff0c;一个单元就是单个程序、函数、过…

40分钟学 Go 语言高并发:服务性能调优实战

服务性能调优实战 一、性能优化实战概述 优化阶段主要内容关键指标重要程度瓶颈定位收集性能指标&#xff0c;确定瓶颈位置CPU、内存、延迟、吞吐量⭐⭐⭐⭐⭐代码优化优化算法、并发、内存使用代码执行时间、内存分配⭐⭐⭐⭐⭐系统调优调整系统参数、资源配置系统资源利用率…

代码随想录-算法训练营day31(贪心算法01:分发饼干,摆动序列,最大子数组和)

第八章 贪心算法 part01● 理论基础 ● 455.分发饼干 ● 376. 摆动序列 ● 53. 最大子序和 贪心算法其实就是没有什么规律可言&#xff0c;所以大家了解贪心算法 就了解它没有规律的本质就够了。 不用花心思去研究其规律&#xff0c; 没有思路就立刻看题解。基本贪心的题目 …

JVM 参数前缀 -XX: 含义 详解

在 Java 虚拟机&#xff08;JVM&#xff09;中&#xff0c;参数前缀 -XX: 表示的是 JVM 的非标准&#xff08;实验性&#xff09;选项。这些参数用于调整和优化 JVM 的性能、垃圾回收行为、内存分配策略等。 1. 参数分类 -XX: 参数大致分为三类&#xff0c;根据其格式区分&…

有趣的Docker

&#x1f449;【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中 1. Docker 上的“全世界”命令行 你可以在 Docker 容器中运行一个模拟的 “世界地图”&#xff0c;并通过命令行与它互动。这是一个非常有趣的项目&#xff0c;结合了命令行和图形界面的交互。…

win11无法检测到其他显示器-NVIDIA

https://www.nvidia.cn/software/nvidia-app/ https://cn.download.nvidia.cn/nvapp/client/11.0.1.163/NVIDIA_app_v11.0.1.163.exe 下载安装后&#xff0c;检测驱动、更新驱动。

(数据结构与算法)如何提高学习算法的效率?面试算法重点有哪些?面试需要哪些能力?

面试官眼中的求职者 通过对你算法的考察&#xff01;&#xff01;&#xff01;&#xff01; 缩进太多&#xff01;&#xff01;一般不要超过三层&#xff01;&#xff01;&#xff01;缩进越少&#xff0c;bug越少&#xff1b;逻辑比较复杂&#xff0c;把这些包装成为函数&…

Applied Intelligence投稿

一、关于手稿格式&#xff1a; 1、该期刊是一个二区的&#xff0c;模板使用Springer nature格式&#xff0c; 期刊投稿要求&#xff0c;详细期刊投稿指南&#xff0c;大部分按Soringernature模板即可&#xff0c;图片表格声明参考文献命名要求需注意。 2、参考文献&#xff…

洛谷 P1150:Peter 的烟 ← while循环

【题目来源】https://www.luogu.com.cn/problem/P1150【题目描述】 Peter 有 n 根烟&#xff0c;他每吸完一根烟就把烟蒂保存起来&#xff0c;k&#xff08;k>1&#xff09;个烟蒂可以换一个新的烟&#xff0c;那么 Peter 最终能吸到多少根烟呢&#xff1f; 与某些脑筋急转弯…

【学习总结|DAY010】Java 流程控制与数据操作练习四:简易计算器

在这段 Java 代码中&#xff0c;我将解析一段简单的 Java 计算器代码&#xff0c;它能够执行基本的数学运算&#xff0c;包括加法、减法、乘法和除法。 一、主要代码 import java.util.Scanner;public class demo101Calculator {public static void main(String[] args) {Sca…

深入云电脑PC Farm技术探讨,以阿里云、华为云、ToDesk为例

&#x1f31d;引言 近年来&#xff0c;云计算技术的飞速发展为各行各业的数字化转型带来了全新机遇&#xff0c;其中云电脑作为一种虚拟化桌面解决方案&#xff0c;逐渐成为个人用户与企业的核心选择。从远程办公、在线教育到高性能计算需求&#xff0c;云电脑通过为用户提供随…

力扣88题:合并两个有序数组

力扣88题&#xff1a;合并两个有序数组 题目描述 给定两个按非递减顺序排列的整数数组 nums1 和 nums2&#xff0c;以及它们的长度 m 和 n&#xff0c;要求将 nums2 合并到 nums1&#xff0c;使得合并后的数组仍按非递减顺序排列。 输入与输出 示例 1&#xff1a; 输入&am…

MAUI APP开发蓝牙协议的经验分享:与跳绳设备对接

在开发MAUI应用程序时&#xff0c;蓝牙协议的应用是一个重要的环节&#xff0c;尤其是在需要与外部设备如智能跳绳进行数据交换的场景中。以下是我在开发过程中的一些经验和心得&#xff0c;希望能为你的项目提供帮助。 1. 蓝牙协议基础 蓝牙协议是无线通信的一种标准&#x…

Vector软件CANdb++的信号起始位Bug

问题现象 前几天导入DBC文件发现不对劲&#xff0c;怎么生成代码的起始地址都怪怪的&#xff0c;检查下工程里面的配置&#xff0c;还真的是这样&#xff0c;一路查到输入文件——DBC文件&#xff0c;发现是DBC文件就有错误&#xff1a;一些CAN报文之后8字节长度&#xff0c;也…

Qt 面试题学习12_2024-11-30

Qt 面试题 1、描述Qt的TCP通讯流程2、自定义控件流程3、什么是Qt的插件机制 &#xff1f; 1、描述Qt的TCP通讯流程 服务端&#xff08;QTcpServer&#xff09; 1、创建TcpServer对象 2、使用listen()方法将服务器绑定到本地地址和端口 3、当有新的客户端连接成功发送newConnec…

2022-12-4----Android11(H713m)---- WiFi驱动添加写入mac号补丁

一、问题 用全志的写号工具&#xff0c;写入wifi_mac&#xff0c;设置下边不生效 二、分析 因为我们的WiFi不是用全志平台的&#xff0c;也不是用全志集成好的&#xff0c;而是用希微这家第三方的WiFi/BT&#xff0c;所以该驱动还没完善。 三、修改前的准备 用写号工具写号…

网站维护记录

服务器重启&#xff0c;网站打不开&#xff1a;chown -R manager:manager /run/php-fpm/www.sock wordpress升级需设置ftp&#xff1a; // 设置权限0777 //define("FS_METHOD", "direct"); //define("FS_CHMOD_DIR", 0777); //define("…

单端和差分信号的接线法

内容来源&#xff1a;【单端信号 差分信号与数据采集卡的【RSE】【 NRES】【 DIFF】 模式的连接】 此篇文章仅作笔记分享。 单端输入 单端信号指的是输入信号由一个参考端和一个信号端构成&#xff0c;参考端一般是地端&#xff0c;信号就是通过计算信号端口和地端的差值所得…

C++——名字遮蔽与类的作用域

C 类的作用域以及继承的特殊关系 名字遮蔽与类的作用域继承的特殊关系 名字遮蔽与类的作用域 如果派生类中的成员&#xff08;包括成员变量和成员函数&#xff09;和基类中的成员重名&#xff0c;通过派生类对象或者在派生类的成员函数中使用该成员时&#xff0c;将使用派生类…

Solana VS 以太坊:基于数据、市场情绪和催化剂对比分析,Solana 能否实现逆袭?

2023年&#xff0c;加密货币市场再度迎来了波动与重塑。在这一轮周期中&#xff0c;Solana&#xff08;SOL&#xff09;凭借其强劲的价格表现和创新的技术架构&#xff0c;成为市场的焦点之一。SOL的价格从2022年12月的低点一路飙升&#xff0c;甚至创下了历史新高264 USDT&…