正则表达式匹配java中的变量声明
我想解析变量声明语句并获取变量名称。 我正在做以下事情
String var = "private String ipaddress;";
我正在使用下面的正则表达式匹配上面的字符串
.*private\\s+([az]*)\\s+([a-z0-9_]*);
这是行不通的。 它说找不到匹配任何人都可以帮忙。
首先,从正则表达式的开头删除该点,因为它需要在private
之前用于匹配的字符。
其次,你的正则表达式区分大小写,与资本s不匹配。 使用[a-zA-Z]
或使表达式不区分( (?i)
在起始IIRC)。
顺便说一句, [a-zA-Z0-9_]
与\w
相同。
另一件事:您的表达式也会捕获非法变量名称以及错过合法变量名称。 变量不允许以数字开头,但也可以包含美元符号。 因此,名称表达式应该类似于([a-zA-Z_$][\w$]*)
这意味着第一个字符必须是字母,下划线或美元符号,后跟任意数量的单词字符或美元符号。
最后一点:根据您对这些声明的处理方式,请记住您可能需要检查这些保留字。 例如,调整后的表达式仍然匹配"private String private"
。
另外一个注意事项:请记住,对于变量,可能存在比private
更多的修饰符,例如public
, protected
, static
等 – 或者根本没有。
编辑 :
现在您在第一个点后面有星号,这对于您的特殊情况应该不是问题。 但是,点几乎匹配任何字符,因此也匹配fooprivate
。 根据您要实现的目标,移除点或在.*
后添加\s+
。
由于Java中变量的声明可以在变量名之前有更多3个单词,我建议你不要限制你的搜索并使用它:
String var = "private String ipaddress;"; //String var2 = "private static final int test=13;"; Pattern p = Pattern.compile(".+\\s(.+?)(;|=)"); Matcher m = p.matcher(var); while(m.find()){ System.out.println(m.group(1)); }
它将查找以空格开头并以“;”结尾的任何变量名称。 或“=”。 这是变量名称的更一般搜索。
编辑这个实际上让我思考,因为这也是Java中的法律声明:
private static volatile String s , t1 = "";
这实际上可能会因为它被快速思考/完成而得到改善。
public static void main(String[] args) { String var0 = "private static final int test,test2;"; String var1 = "private \n static \n final \n int \n testName \n =\n 5 \n"; String var2 = "private \n static \n final \n String \n testName \n =\n \" aaa = bbbb \" \n"; String var3 = "private \n static \n final \n String \n testName,testName2 \n =\n \" aaa = bbbb \" \n"; String var4 = "int i;"; String var5 = "String s ;"; String var6 = "final String test ; "; String var7 = "public int go = 23;"; String var8 = "public static final int value,valu2 ; "; String var9 = "public static final String t,t1,t2 = \"23\";"; String var10 = "public \n static \n final \n String s1,s2,s3 = \" aaa , bbb, fff, = hhh = , kkk \";"; String var11 = "String myString=\"25\""; LinkedList input = new LinkedList (); input.add(var0);input.add(var1);input.add(var2);input.add(var3);input.add(var4);input.add(var5); input.add(var6);input.add(var7);input.add(var8);input.add(var9);input.add(var10); input.add(var11); LinkedList result = parametersNames(input); for(String param: result){ System.out.println(param); } } private static LinkedList parametersNames(LinkedList input){ LinkedList result = new LinkedList (); for(String var: input){ if(var.contains("\n")) var = var.replaceAll("\n", ""); var = var.trim(); if(var.contains("=")){ var = var.substring(0, var.indexOf("=")).trim() + ""; Pattern p = Pattern.compile(".+\\s(.+)$"); Matcher m = p.matcher(var); if(m.find()){ if(m.group(1).contains(",")){ String [] tokens = m.group(1).split(","); for(String token : tokens){ result.add(token); } } else{ result.add(m.group(1)); } } } else{ Pattern p = Pattern.compile(".+\\s(.+?)(;|=)"); Matcher m = p.matcher(var); if(m.find()){ if(m.group(1).contains(",")){ String [] tokens = m.group(1).split(","); for(String token : tokens){ result.add(token); } } else{ result.add(m.group(1)); } } } } return result; }
查看Checkstyle正则表达式模式的命名约定(类型,方法,包等)。 更多信息在这里 。
.*private\\s+(\\w*)\\s+(\\w*);
使用这种模式。 [az]是一个小写字母,但文本中的“String”以大写字母S
开头。 \\w
是一个单词字符。 它与[a-zA-Z0-9_]
您的文本似乎就像"private
如果是这样,你的类型可以包含大写的小写字母,数字或下划线,所以写\\w
是一个很好的解决方案。
你应该使用这个正则表达式:
^(?s)\\s*private\\s+(\\w+)\\s+(\\w+)\\s*;\\s*$
这将确保匹配:
- 除关键字
private
之外的不区分大小写的匹配 - 多行声明
- 开始,结束和中间的空白区域