Java Regex – 从String中提取Hashtags
需要从Java中的源字符串中提取出标签字符串。 任何想法/例子?
谢谢,斯里兰卡
这是我正在使用的(它也处理UTF-8标签,而不仅仅是ASCII):
private static final Pattern TAG_PATTERN = Pattern.compile("(?:^|\\s|[\\p{Punct}&&[^/]])(#[\\p{L}0-9-_]+)");
顺便说一下,你应该能够从推文实体中获取主题标签( include_entities=true
)