Java Regex – 从String中提取Hashtags

需要从Java中的源字符串中提取出标签字符串。 任何想法/例子?

谢谢,斯里兰卡

这是我正在使用的(它也处理UTF-8标签,而不仅仅是ASCII):

private static final Pattern TAG_PATTERN = Pattern.compile("(?:^|\\s|[\\p{Punct}&&[^/]])(#[\\p{L}0-9-_]+)"); 

顺便说一下,你应该能够从推文实体中获取主题标签( include_entities=true