Tag: html entities

Java JTextPane HTML编辑器UTF-8字符编码

我正在使用JTextPane作为简单的html编辑器。 jtp=new JTextPane(); jtp.setContentType(“text/html;charset=UTF-8”); jtp.setEditorKit(new HTMLEditorKit()); 当我调用jtp.getText()时,我获得了很好的html代码,所有特殊字符都被转义。 但是我不希望逃避国家角色(波兰语),但只有特殊的html字符,如&,当我进入编辑器时 ą ś & 我明白了 <foo>ą ś & 但我想得到 <foo>ą ś & 怎么可能?

ASCII到HTML实体在Java中转义

我发现这个网站有转义码,我只是想知道是否有人已经这样做了所以我不需要花费几个小时来构建这个逻辑: StringBuffer sb = new StringBuffer(); int n = s.length(); for (int i = 0; i < n; i++) { char c = s.charAt(i); switch (c) { case '\u25CF': sb.append("●"); break; case '\u25BA': sb.append("►"); break; /* … the rest of the hex chars literals to HTML entities */ default: sb.append(c); break; } }

Jsoup有特殊HTML符号的问题,&lsquo; &MDASH; 等等

我有一些HTML(字符串),我通过Jsoup,所以我可以添加一些东西到所有href和src属性,这很好。 但是,我注意到对于一些特殊的HTML字符,Jsoup正在将它们转换为“ 对于实际的人物“ 。 我输出前后的值,我看到了这个变化。 之前: THIS — IS A “TEST”. 5 > 4. trademark: ™ 后: THIS — IS A “TEST”. 5 > 4. trademark: ? 到底他妈发生了什么? 我特意将这些特殊字符转换为HTML实体,然后才能避免这种情况。 引号更改为实际引号字符,大于保持不变,商标变为问号。 AAAAAAA。 仅供参考,我的Jsoup代码正在做: Document document = Jsoup.parse(fileHtmlStr); //some stuff String modifiedFileHtmlStr = document.html(); 谢谢你的帮助!