小編給大家分享一下Java漢字轉(zhuǎn)拼音類庫Pinyin4j怎么用,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
創(chuàng)新互聯(lián)建站是一家專業(yè)從事成都網(wǎng)站制作、成都網(wǎng)站設(shè)計、外貿(mào)營銷網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計的品牌網(wǎng)絡(luò)公司。如今是成都地區(qū)具影響力的網(wǎng)站設(shè)計公司,作為專業(yè)的成都網(wǎng)站建設(shè)公司,創(chuàng)新互聯(lián)建站依托強大的技術(shù)實力、以及多年的網(wǎng)站運營經(jīng)驗,為您提供專業(yè)的成都網(wǎng)站建設(shè)、營銷型網(wǎng)站建設(shè)及網(wǎng)站設(shè)計開發(fā)服務(wù)!
pinyin4j的使用很方便,一般轉(zhuǎn)換只需要使用PinyinHelper類的靜態(tài)工具方法即可:
String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘劉'); //該類還有其他的拼音轉(zhuǎn)換形式,但是基本上用不到,就不介紹了
返回的數(shù)組即是該字符的拼音,如上例就是pinyin[0]=liu2,后面的數(shù)字代表聲調(diào),聲調(diào)為5表示輕讀,無聲調(diào)。之所謂返回數(shù)組,是因為被判定的漢字有可能有多個讀音。如果輸入的參數(shù)不是漢字,則返回null。
如果對于拼音轉(zhuǎn)換后的結(jié)果有一些特定的格式要求目前pinyin4j支持:
聲調(diào)格式化。例如:“劉”字的格式化后為“l(fā)iu2”或“l(fā)iu”或“l(fā)iú”
對特殊拼音ü的的顯示格式。例如“u:”或“v”或“ü”
大小寫的轉(zhuǎn)換。例如:“l(fā)iu2”或“LIU2”
以上這些格式可以混合使用,下面就來介紹具體的使用方法,首先需要創(chuàng)建格式化對象HanyuPinyinOutputFormat,例如:
HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
然后分別調(diào)用outputFormat的set方法設(shè)置上述一些格式要求:
設(shè)置聲調(diào)格式:
outputFormat.setToneType(HanyuPinyinToneType);
方法參數(shù)HanyuPinyinToneType有以下常量對象:
HanyuPinyinToneType.WITH_TONE_NUMBER 用數(shù)字表示聲調(diào),例如:liu2
HanyuPinyinToneType.WITHOUT_TONE 無聲調(diào)表示,例如:liu
HanyuPinyinToneType.WITH_TONE_MARK 用聲調(diào)符號表示,例如:liú
設(shè)置特殊拼音ü的顯示格式:
outputFormat.setVCharType(HanyuPinyinVCharType);
方法參數(shù)HanyuPinyinVCharType有以下常量對象:
HanyuPinyinVCharType.WITH_U_AND_COLON 以U和一個冒號表示該拼音,例如:lu:
HanyuPinyinVCharType.WITH_V 以V表示該字符,例如:lv
HanyuPinyinVCharType.WITH_U_UNICODE 以ü表示
設(shè)置大小寫格式
outputFormat.setCaseType(HanyuPinyinCaseType);
HanyuPinyinCaseType.LOWERCASE 轉(zhuǎn)換后以全小寫方式輸出
HanyuPinyinCaseType.UPPERCASE 轉(zhuǎn)換后以全大寫方式輸出
設(shè)置好格式對象后還是利用上述的工具類方法進(jìn)行拼音轉(zhuǎn)換,只不過需要將格式化對象當(dāng)成方法參數(shù)傳入轉(zhuǎn)換方法,告知要轉(zhuǎn)換的格式要求:
String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘劉', outputFormat);
但該方法會有異常拋出,注意處理。
示例
import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; public class Test { public static void main(String[] args) { import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; public class Test { public static void main(String[] args) { HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat(); outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_MARK); outputFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE); outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE); try { System.out.println(concatPinyinStringArray(PinyinHelper.toHanyuPinyinStringArray('劉',outputFormat))); } catch (BadHanyuPinyinOutputFormatCombination e) { // TODO Auto-generated catch block e.printStackTrace(); } } private static String concatPinyinStringArray(String[] pinyinArray) { StringBuffer pinyinStrBuf = new StringBuffer(); if ((null != pinyinArray) && (pinyinArray.length > 0)) { for (int i = 0; i < pinyinArray.length; i++) { pinyinStrBuf.append(pinyinArray[i]); pinyinStrBuf.append(System.getProperty("line.separator")); } } String outputString = pinyinStrBuf.toString(); return outputString; } }
輸出結(jié)果為:LIú
PinyinHelper還有其他的靜態(tài)方法,但示例和講解中使用的方法是常見的拼音格式,因此其他靜態(tài)方法我沒有調(diào)研其含義。
貌似支持生僻字,我試過很怪異的字,都可以將其讀音拼寫出來,因此這個工具包還是很強的。
拼音工具
package cn.itcast.bos.utils; import java.util.Arrays; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType; import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat; import net.sourceforge.pinyin4j.format.HanyuPinyinToneType; import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination; public class PinYin4jUtils { /** * 將字符串轉(zhuǎn)換成拼音數(shù)組 * * @param src * @return */ public static String[] stringToPinyin(String src) { return stringToPinyin(src, false, null); } /** * 將字符串轉(zhuǎn)換成拼音數(shù)組 * * @param src * @return */ public static String[] stringToPinyin(String src, String separator) { return stringToPinyin(src, true, separator); } /** * 將字符串轉(zhuǎn)換成拼音數(shù)組 * * @param src * @param isPolyphone * 是否查出多音字的所有拼音 * @param separator * 多音字拼音之間的分隔符 * @return */ public static String[] stringToPinyin(String src, boolean isPolyphone, String separator) { // 判斷字符串是否為空 if ("".equals(src) || null == src) { return null; } char[] srcChar = src.toCharArray(); int srcCount = srcChar.length; String[] srcStr = new String[srcCount]; for (int i = 0; i < srcCount; i++) { srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator); } return srcStr; } /** * 將單個字符轉(zhuǎn)換成拼音 * * @param src * @return */ public static String charToPinyin(char src, boolean isPolyphone, String separator) { // 創(chuàng)建漢語拼音處理類 HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); // 輸出設(shè)置,大小寫,音標(biāo)方式 defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); StringBuffer tempPinying = new StringBuffer(); // 如果是中文 if (src > 128) { try { // 轉(zhuǎn)換得出結(jié)果 String[] strs = PinyinHelper.toHanyuPinyinStringArray(src, defaultFormat); // 是否查出多音字,默認(rèn)是查出多音字的第一個字符 if (isPolyphone && null != separator) { for (int i = 0; i < strs.length; i++) { tempPinying.append(strs[i]); if (strs.length != (i + 1)) { // 多音字之間用特殊符號間隔起來 tempPinying.append(separator); } } } else { tempPinying.append(strs[0]); } } catch (BadHanyuPinyinOutputFormatCombination e) { e.printStackTrace(); } } else { tempPinying.append(src); } return tempPinying.toString(); } public static String hanziToPinyin(String hanzi) { return hanziToPinyin(hanzi, " "); } /** * 將漢字轉(zhuǎn)換成拼音 * * @param hanzi * @param separator * @return */ public static String hanziToPinyin(String hanzi, String separator) { // 創(chuàng)建漢語拼音處理類 HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat(); // 輸出設(shè)置,大小寫,音標(biāo)方式 defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE); defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE); String pinyingStr = ""; try { pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat, separator); } catch (BadHanyuPinyinOutputFormatCombination e) { // TODO Auto-generated catch block e.printStackTrace(); } return pinyingStr; } /** * 將字符串?dāng)?shù)組轉(zhuǎn)換成字符串 * * @param str * @param separator * 各個字符串之間的分隔符 * @return */ public static String stringArrayToString(String[] str, String separator) { StringBuffer sb = new StringBuffer(); for (int i = 0; i < str.length; i++) { sb.append(str[i]); if (str.length != (i + 1)) { sb.append(separator); } } return sb.toString(); } /** * 簡單的將各個字符數(shù)組之間連接起來 * * @param str * @return */ public static String stringArrayToString(String[] str) { return stringArrayToString(str, ""); } /** * 將字符數(shù)組轉(zhuǎn)換成字符串 * * @param str * @param separator * 各個字符串之間的分隔符 * @return */ public static String charArrayToString(char[] ch, String separator) { StringBuffer sb = new StringBuffer(); for (int i = 0; i < ch.length; i++) { sb.append(ch[i]); if (ch.length != (i + 1)) { sb.append(separator); } } return sb.toString(); } /** * 將字符數(shù)組轉(zhuǎn)換成字符串 * * @param str * @return */ public static String charArrayToString(char[] ch) { return charArrayToString(ch, " "); } /** * 取漢字的首字母 * * @param src * @param isCapital * 是否是大寫 * @return */ public static char[] getHeadByChar(char src, boolean isCapital) { // 如果不是漢字直接返回 if (src <= 128) { return new char[] { src }; } // 獲取所有的拼音 String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src); // 創(chuàng)建返回對象 int polyphoneSize = pinyingStr.length; char[] headChars = new char[polyphoneSize]; int i = 0; // 截取首字符 for (String s : pinyingStr) { char headChar = s.charAt(0); // 首字母是否大寫,默認(rèn)是小寫 if (isCapital) { headChars[i] = Character.toUpperCase(headChar); } else { headChars[i] = headChar; } i++; } return headChars; } /** * 取漢字的首字母(默認(rèn)是大寫) * * @param src * @return */ public static char[] getHeadByChar(char src) { return getHeadByChar(src, true); } /** * 查找字符串首字母 * * @param src * @return */ public static String[] getHeadByString(String src) { return getHeadByString(src, true); } /** * 查找字符串首字母 * * @param src * @param isCapital * 是否大寫 * @return */ public static String[] getHeadByString(String src, boolean isCapital) { return getHeadByString(src, isCapital, null); } /** * 查找字符串首字母 * * @param src * @param isCapital * 是否大寫 * @param separator * 分隔符 * @return */ public static String[] getHeadByString(String src, boolean isCapital, String separator) { char[] chars = src.toCharArray(); String[] headString = new String[chars.length]; int i = 0; for (char ch : chars) { char[] chs = getHeadByChar(ch, isCapital); StringBuffer sb = new StringBuffer(); if (null != separator) { int j = 1; for (char ch2 : chs) { sb.append(ch2); if (j != chs.length) { sb.append(separator); } j++; } } else { sb.append(chs[0]); } headString[i] = sb.toString(); i++; } return headString; } public static void main(String[] args) { // pin4j 簡碼 和 城市編碼 String s1 = "中華人民共和國"; String[] headArray = getHeadByString(s1); // 獲得每個漢字拼音首字母 System.out.println(Arrays.toString(headArray)); String s2 ="長城" ; System.out.println(Arrays.toString(stringToPinyin(s2,true,","))); String s3 ="長"; System.out.println(Arrays.toString(stringToPinyin(s3,true,","))); } }
以上是“Java漢字轉(zhuǎn)拼音類庫Pinyin4j怎么用”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!