XMLPullParser解析器无法解析“（??????）＆middot;”xml标记内部

我正在使用Jsoup解析XMLPullParser

(??????) [????]0 BLACK LAGOON -???? · ????- ?01-09? http://fenopy.eu/torrent/+black+lagoon+A+01+09+/OTcyOTA3Mw Wed, 27 Feb 2013 11:00:04 GMT Anime http://fenopy.eu/torrent/+black+lagoon+A+01+09+/OTcyOTA3Mw  <![CDATA[ Category: Anime
Size: 542.9 MB
Ratio: 0 seeds, 3 leechers
 ]]>

这是我的解析代码

 int eventType = -1; while (eventType != XmlPullParser.END_DOCUMENT) { switch (eventType) { // at start of document: START_DOCUMENT case XmlPullParser.START_DOCUMENT: break; // at start of a tag: START_TAG case XmlPullParser.START_TAG: // get tag name String tagName = parser.getName(); if (tagName.equalsIgnoreCase(TAG_TITLE)) String t = parser.nextText();

当我调用下一个文本时，它会抛出exception…

 org.xmlpull.v1.XmlPullParserException: unresolved: · (position:TEXT (??????) [????] ...@36:59 in java.io.StringReader@40540698) at org.kxml2.io.KXmlParser.exception(KXmlParser.java:273) at org.kxml2.io.KXmlParser.error(KXmlParser.java:269) at org.kxml2.io.KXmlParser.pushEntity(KXmlParser.java:818) at org.kxml2.io.KXmlParser.pushText(KXmlParser.java:849) at org.kxml2.io.KXmlParser.nextImpl(KXmlParser.java:354) at org.kxml2.io.KXmlParser.next(KXmlParser.java:1378) at org.kxml2.io.KXmlParser.nextText(KXmlParser.java:1432)

你的xml无效。 · 是xml的无效引用。

XML中有5个预定义的实体引用：

< <小于

> >大于

& ＆符号

' ‘撇号

" “引号

更新

简单地使用正则表达式替换XML中的所有HTML字符

 XMLString.replaceAll("(&[^\\s]+?;)", ""));

这将取代· 通过“”

我正在处理同样的问题，我找到了超级简单的解决方案：

 xmlPullParser.setFeature(Xml.FEATURE_RELAXED, true);

也许你可以这样做：

 parser.setInput(...); parser.defineEntityReplacementText("middot", "•");

因为这不适用于您的实现：

从apache commons-lang使用HTML转换，因为它似乎是HTML命名实体：

 String xml = "Hello · World!"; xml = StringEscapeUtils.unescapeHtml(xml);

评论的问题：

取代所有不分青红皂白的：

 String xml = "<..."; // Place all entities like "·" in square brackets: "[middot]": xml = xml.replaceAll("\\&(\\w+);", "[$1]"); // But not for the xml entities: xml = xml.replaceAll("\\[(lt|gt|amp|quot|apos)\\]", "&$1;");

XMLPullParser解析器无法解析“（??????）＆middot;”xml标记内部

处理Spring Security中的自定义exception

配置Java Socket以在断开连接时快速失败？

如何使用logger打印exception？

在Java中，如何使用JUnitvalidation抛出的exception？

为什么编译？

如何使用Intellij Idea的exception断点

方法最终确定和例外

连接Java-MySql：不允许公钥检索

EOFException – 如何处理？

在Java中尝试/捕获