Tag: character class

使用Java regexp匹配(例如)Unicode字母

StackOverflow上有许多问题和答案,假设“字母”可以在[a-zA-Z]的正则表达式中匹配。 然而,对于Unicode,还有更多的字符,大多数人会认为是一个字母(所有的希腊字母,Cyrllic ..还有更多.Unicode定义了许多块,每个块可能有“字母”。 Java定义为像alpha字符这样的东西定义了Posix类 ,但是它被指定为仅使用US-ASCII。 预定义的字符类定义由[a-zA-Z_0-9]组成的单词,它也排除了许多字母。 那么如何正确匹配Unicode字符串呢? 有没有其他图书馆能够做到这一点?

字符类减法,从Java语法转换为RegexBuddy

Java使用哪个正则表达式引擎? 在像RegexBuddy这样的工具中使用 [az&&[^bc]] Java中的表达式很好但是在RegexBuddy中它还没有被理解。 事实上它报道: 匹配下面列表中的单个字符[az&&[^bc] a和z之间范围内的字符: az 其中一个字符&[^bc : &&[^bc 匹配字符]字面意思: ] 但我想匹配a和z之间a一个字符与一个非b或c的字符相交