zbb20180117 汉字转拼音 pinyin4

包地址
https://pan.baidu.com/disk/home?#list/vmode=list&path=%2F%E5%AD%A6%E4%B9%A0
Pinyin4j的基本用法
1. 简单介绍
有时候,需要将汉字编程对应的拼音,以方便数据的处理。比如在Android手机应用的开发上,要查询联系人的姓名,通常都是用拼音进行查询的。比如要查询曹孟德,就可以输入cmd,即曹孟德三个汉字的拼音caomengde各字的首字母。但是怎样才能将曹孟德翻译成caomengde呢?很简单的办法就是建立一个大的对照表(比如用关联容器Map),比如<cao><” meng><” de>但这样的做法,需要维护好一个比较大的对照表,同时一个汉字可能有多个发音,也就是说Map这样的容器时不行的,因为其<key,value>必须是一一对应的。在C++中可以用STL里面的multimap来解决这个问题,但Java中没有类似multimap这样的东西,除非自己实现一个。
 
Pinyin4j就是为了解决类似这样的问题的。它是sourceforge.net上的一个开源项目,功能非常强大:
支持同一汉字有多个发音
还支持拼音的格式化输出,比如第几声之类的,
同时支持简体中文、繁体中文转换为拼音使用起来也非常简单。下面是其官方网址,其中提供了下载:
http://pinyin4j.sourceforge.net/
 
2. 基本用法:
通常情况下,只需要用到其中的PinyinHelper类中的静态方法toHanyuPinyinStringArray就可以了,比如:
String[] pinyinArray =PinyinHelper.toHanyuPinyinStringArray('');
for(int i = 0; i < pinyinArray.length; ++i)
{
System.out.println(pinyinArray[i]);
}
就会输出:
dan1
chan2
shan4
这三种发音,后面的数字代表第几声。可以看到静态方法toHanyuPinyinStringArray返回的数据类型是一个String数组,它用来接收一个汉字的多个发音,如果toHanyuPinyinStringArray中的参数不是汉字,那么它会返回null
 
3.格式支持
Pinyin4j支持拼音输出的格式化,比如,可以输出为huanghuang2huáng等等,下面的代码就似是输出huáng的示例:
HanyuPinyinOutputFormat format= new HanyuPinyinOutputFormat();
format.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
 
String[] pinyinArray = null;
try
{
pinyinArray = PinyinHelper.toHanyuPinyinStringArray('', format);
}
catch(BadHanyuPinyinOutputFormatCombination e)
{
e.printStackTrace();
}
for(int i = 0; i < pinyinArray.length; ++i)
{
System.out.println(pinyinArray[i]);
}
此外,还支持大小写转换、ü等等。详细情况,可以查看Pinyin4j自带的文档。
 
4.实际示例代码
如果我们要将一段文字中的汉字全部转换成不带音调的拼音输出,而这段文字中又可能包含阿拉伯数字、英文、标点符号等等。如果完全靠自己写代码进行转换,那是非常麻烦的,其中一个首先就要区别,这段文字中那些是汉字,那些是非汉字。有了Pinyin4j,这个问题就不再困难了,因为对于非汉字,Pinyin4j会自动输出null。参考下面的示例代码:
importnet.sourceforge.pinyin4j.*;
importnet.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
importnet.sourceforge.pinyin4j.format.HanyuPinyinToneType;
importnet.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
 
public class Chinese2PY
{
public static void main(String[] args)
{
Hanyu hanyu = new Hanyu();
// 中英文混合的一段文字
String str = "荆溪白石出,Hello 天寒红叶稀。Android 山路元无雨,What's up? 空翠湿人衣。";
String strPinyin = hanyu.getStringPinYin(str);
System.out.println(strPinyin);
}
}
 
class Hanyu
{
private HanyuPinyinOutputFormat format = null;
private String[] pinyin;
 
public Hanyu()
{
format = new HanyuPinyinOutputFormat();
format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
 
pinyin = null;
}
 
//转换单个字符
public String getCharacterPinYin(char c)
{
try
{
pinyin = PinyinHelper.toHanyuPinyinStringArray(c, format);
}
catch(BadHanyuPinyinOutputFormatCombination e)
{
e.printStackTrace();
}
 
// 如果c不是汉字,toHanyuPinyinStringArray会返回null
if(pinyin == null) return null;
 
// 只取一个发音,如果是多音字,仅取第一个发音
return pinyin[0];
}
 
//转换一个字符串
public String getStringPinYin(String str)
{
StringBuilder sb = new StringBuilder();
String tempPinyin = null;
for(int i = 0; i < str.length(); ++i)
{
tempPinyin =getCharacterPinYin(str.charAt(i));
if(tempPinyin == null)
{
// 如果str.charAt(i)非汉字,则保持原样
sb.append(str.charAt(i));
}
else
{
sb.append(tempPinyin);
}
}
return sb.toString();
}
}

转载于:https://www.cnblogs.com/super-admin/p/8303633.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/466888.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

终于有人将进程间通信讲明白了

使用多进程协作来实现应用和系统是一种被广泛使用的开发方法。多进程协作主要有以下三点优势。将功能模块化&#xff0c;避免重复造轮子。增强模块间的隔离&#xff0c;提供更强的安全保障。提高应用的容错能力。进程间通信&#xff08;Inter-Process Communication&#xff0c…

个人喜欢的歌曲——女生篇

个人喜欢的歌曲 —— 女生篇 1、吴汶芳&#xff1a;孤独的总和2、蔡依林&#xff1a;妥协、柠檬草的味道3、陈姿彤&#xff1a;战争世界、我的世界4、雁卿&#xff1a;怕寂寞5、张碧晨&#xff1a;年轮6、庄心妍&#xff1a;爱囚&#xff0c;以后的以后7、魏新雨&#xff1a;…

神舟本本放心率

总得票8520 可以放心购买 22.0% 1942票 不太放心 64.0% 5510票 看情况 12.0% 1068票投票起止时间&#xff1a;2007-11-15 至2008-11-22转载于:https://www.cnblogs.com/badapple126/archive/2007/11/16/962020.html

梯度下降算法

在学习逻辑回归时&#xff0c;对梯度上升算法进行了应用&#xff0c;看到其他的博客讲解&#xff0c;梯度上升算法适合求最大值&#xff0c;梯度下降算法适合求最小值&#xff0c;这里有一个分析&#xff1a;梯度上升算法公式是学习率&#xff0c;是一个常数。这个是根据逻辑回…

花了一个深夜,才用C语言写了一个2048游戏雏形

12年我毕业的第二个月工资&#xff0c;我就买了一个IPAD&#xff0c;然后在IPAD上下了一个2048游戏&#xff0c;玩起来非常爽。然后这几天看到好几个公众号都发了自己写这个游戏的代码&#xff0c;然后我自己也想试试&#xff0c;所以就有了这篇文章&#xff0c;写代码还是很有…

向银行贷款20万, 分期三年买50万的车,个人借款40万, 贷款10年买200万的房子,再贷款120万分创业...

向银行贷款20万按1年期贷款利率为&#xff1a;6%&#xff0c;若按年还贷款&#xff0c;银行贷款利息为&#xff1a;200&#xff0c;000*6%12&#xff0c;000。连本带息&#xff1a;20*106%21.2万分期三年买50万的车 贷款总额30万 年利率按10%算&#xff0c;分三年还清&#xff…

如何避免测试盲区

测试盲区&#xff0c;也就是软件中测试人员未测试到的地方&#xff0c;造成这方面的原因主要有测试人员对测试需求理解不足、经验不足和思维僵化等原因造成的。接下来&#xff0c;就如何避免测试盲区给出几点建议。 一、 充分理解软件需求需求方面的如果理解有误或者分析遗漏&a…

集成算法——Adaboost代码

集成算法是我们将不同的分类器组合起来&#xff0c;而这种组合结果就被称为集成方法或者是元算法。使用集成方法时会有多种形式&#xff1a;可以是不同算法的集成&#xff0c;也可以是同意算法在不同设置下的集成&#xff0c;还可以是数据集不同部分分配给不同分类器之后的集成…

年终抽奖来了

时间很快&#xff0c;2020年已经到了12月份&#xff0c;我从2018年开始写公众号&#xff0c;经过了快两年是时间&#xff0c;我收获了4万的读者&#xff0c;非常开心。我自己是一个挺逗逼的人&#xff0c;而且我写公众号并不觉得我比别人厉害&#xff0c;技术上我真的就是一个很…

DOS状态下可以安装Win XP

在DOS状态下可以安装Win XP&#xff0c;插入Win XP光盘后&#xff0c;首先从开始中进入MS-DOS&#xff0c;然后在MS-DOS下输入“G:\Setup.exe”(G为光驱盘符)即可。 如果想从纯DOS下进行安装&#xff0c;可用启动盘启动到DOS状态&#xff0c;安装时首先加载Smartdrv.exe(将Win …

嵌入式 Linux下永久生效环境变量bashrc

作者&#xff1a;skdkjxy原文&#xff1a;http://blog.sina.com.cn/s/blog_8795b0970101f1f9.html.bashrc文件 在linux系统普通用户目录&#xff08;cd /home/xxx&#xff09;或root用户目录&#xff08;cd /root&#xff09;下&#xff0c;用指令ls -al可以看到4个隐藏文件&am…

回归分析——线性回归

机器学习中&#xff0c;对于离散的数据可以做分类问题&#xff0c;那对于连续的数据就是做回归问题&#xff0c;这里对一元线性回归和多元线性回归做一个简介&#xff0c;帮组理解。回归分析&#xff1a;从一组样本数据出发&#xff0c;确定变量之间的数学关系式&#xff0c;对…

编译原理(五)自底向上分析之算符优先分析法

自底向上分析之算符优先分析法 说明&#xff1a;以老师PPT为标准&#xff0c;借鉴部分教材内容&#xff0c;AlvinZH学习笔记。 基本过程 1. 一般方法&#xff1a;采用自左向右地扫描和分析输入串&#xff0c;从输入符号串开始&#xff0c;通过反复查找当前句型的句柄&#xff0…

做Android开发,要清楚init.rc里面的东西

init.rc 复习看这个之前&#xff0c;先看看大神总结的文章这篇文章总结的非常到位&#xff0c;但是因为代码不是最新的Android版本&#xff0c;对我们最新的Android版本不适用。http://gityuan.com/2016/02/05/android-init/#init rc文件拷贝拷贝其实也就是把文件放到机器的某个…

abap常用系统变量

常用的系统变量如下: 1.sy-pagno当前页号 2.SY-DATUM当前时间 3.SY-LINSZ当前报表宽度 4.SY-LINCT当前报表长度 5.SPACE空字符 6.SY-SUBRC执行状态为0,表示成功. 7.SY-UNAME 用户名 8.SY-UZEIT当前时间 9.SY-TCODE当前的事务代码 10.SY-LSIND列表索引页 11.SY-LISTI上一个列表的…

随机森林

随机森林的思想&#xff1a;随机取样&#xff0c;创建M棵决策树&#xff0c;并对决策树的结果进行投票&#xff0c;选出最多的类别作为最后的分类结果。这里在创建决策树的时候引入了基尼指数的概念&#xff0c;基尼指数和信息增益的作用一样&#xff0c;都是选出数据集的最佳分…

Linux静态库和动态库的设计

静态库和动态库的设计 宗旨&#xff1a;技术的学习是有限的&#xff0c;分享的精神是无限的。 Linux应用程序设计中需要的外部函数主要由函数库和系统调用来提供 Linux应用程序使用的主要函数库均存放于/lib, /usr/lib目录下&#xff0c;其中采用*.so.*方式命名的是动态函数库…

操作excel

static void create(String path) throws Exception {//读取文件FileInputStream in new FileInputStream(path);XSSFWorkbook wb new XSSFWorkbook(in);// 获得该工作区的第一个sheetXSSFSheet sheet wb.getSheetAt(0);int rowNum sheet.getLastRowNum();//行int columnNu…

无法安装软件之解决其一 (windows installer服务篇)

早上接到兄弟求助&#xff0c;无法安装软件&#xff0c;于是把最直接方法告诉他&#xff0c;还原啊。但ghost 进程到一半就当了&#xff0c;真是对不起他。。挂了电话后查了一下&#xff0c;现将方法总结如下&#xff1a;两种环境1 windows 2000系统 中&#xff1a;第一步&…

决策树——CART和模型树

CART树 理解&#xff1a; 如果CART树处理离散型数据&#xff0c;叫做分类决策树&#xff0c;那么&#xff0c;引入基尼指数作为寻找最好的数据划分的依据&#xff0c;基尼指数越小&#xff0c;说明数据的“纯度越高”&#xff0c;随机森林的代码里边就运用到了基尼指数。如…