Tag: 组合标记

检测Java中的任何组合字符

我正在寻找一种方法来检测java字符串中的字符是否是“组合字符”。 例如, String khmerCombiningVowel = new String(new byte[]{(byte) 0xe1,(byte) 0x9f,(byte) 0x80}, “UTF-8″); // unicode 17c0 代表结合高棉元音符号 。 我试过”\\p{InCombiningDiacriticalMarks}” 正则表达式,但似乎并不适用于这些特殊的组合字符。 或者即使有一些全面的unicode组合字符块列表,我也可以为它们制作一个正则表达式?