Tag: utf 8

即使使用UTF-8，为什么在Windows与Linux中显示不同？: 为什么以下在Linux与Windows中显示不同？ System.out.println(new String(“¿”.getBytes(“UTF-8”), “UTF-8”)); 在Windows中： ¿ 在Linux中：一个

使用XSLT转换XML并保留Unicode字符: 我的XSLT转换已成功几个月，直到我遇到带有Unicode字符的XML文件（很可能是表情符号）。我需要保留Unicode，但XSLT将其转换为HTML实体。我认为将编码设置为UTF-8可以解决我的问题，但我仍然遇到问题。任何帮助赞赏。码： private byte[] transform(InputStream stream) throws Exception{ System.setProperty(“javax.xml.transform.TransformerFactory”, “org.apache.xalan.processor.TransformerFactoryImpl”); Transformer xmlTransformer; xmlTransformer = (TransformerImpl) TransformerFactory.newInstance().newTransformer(new StreamSource(createXsltStylesheet())); xmlTransformer.setOutputProperty(OutputKeys.ENCODING, “UTF-8″); XMLStreamReader reader = XMLInputFactory.newInstance().createXMLStreamReader(stream,”UTF-8”); Source staxSource = new StAXSource(reader, true); ByteArrayOutputStream outputStream = new ByteArrayOutputStream(); Writer writer = new OutputStreamWriter(outputStream, “UTF-8”); xmlTransformer.transform(staxSource, new StreamResult(writer)); return outputStream.toByteArray(); } 如果我加 xmlTransformer.setOutputProperty(OutputKeys.METHOD, “text”); 保留Unicode但不保留XML。

Java JTextPane HTML编辑器UTF-8字符编码: 我正在使用JTextPane作为简单的html编辑器。 jtp=new JTextPane(); jtp.setContentType(“text/html;charset=UTF-8”); jtp.setEditorKit(new HTMLEditorKit()); 当我调用jtp.getText（）时，我获得了很好的html代码，所有特殊字符都被转义。但是我不希望逃避国家角色（波兰语），但只有特殊的html字符，如＆，当我进入编辑器时 ą ś & 我明白了 <foo>ą ś & 但我想得到 <foo>ą ś & 怎么可能？

将字节数组转换为字符串然后再转换回字节数组时，为什么长度不同？: 我有以下Java代码： byte[] signatureBytes = getSignature(); String signatureString = new String(signatureBytes, “UTF8”); byte[] signatureStringBytes = signatureString.getBytes(“UTF8”); System.out.println(signatureBytes.length == signatureStringBytes.length); // prints false 问：我可能误解了这一点，但我认为new String(byte[] bytes, String charset)和String.getBytes(charset)是反向操作？问：作为后续工作，将byte []数组作为String传输的安全方法是什么？

Java字符串中的字符数: 可能重复： Java：使用unicode上线显示平方根时的字符串长度？如何获取String中的Unicode字符数？鉴于泰国字符的char[] ： [อ, ภ, ิ, ช, า, ต, ิ] 这在String中出现：อภิชาติ String.length()返回7.我知道（技术上）有7个字符，但是我需要一个能够返回5的方法。这就是屏幕上显示的字符空间的确切数量。

通过HttpURLConnection发送UTF-8字符失败: 我现在已经花了一半星期天，我需要帮助：我想使用Java HttpURLConnection将包含特殊字符UTF-8编码的字符串发送到服务器。字符的正确编码失败。例： strToSend：äù€ strUrlEncoded：％C3％A4 +％C3％B9 +％E2％82％AC strReceived：Ã¢â¬ 我的代码： urlConnection = (HttpURLConnection) new URL(“http://localhost:8080/NetworkingServer/ServerServlet”).openConnection(); urlConnection.setUseCaches(false); urlConnection.setDoOutput(true); // Triggers POST. urlConnection.setRequestProperty(“accept-charset”, “UTF-8”); urlConnection.setRequestProperty(“content-type”, “application/x-www-form-urlencoded”); String strToSend = “ä ù €”; System.out.println(“strToSend: ” + strToSend); String strUrlEncoded = URLEncoder.encode(strToSend, “UTF-8”); System.out.println(“strUrlEncoded: ” + strUrlEncoded); OutputStreamWriter writer = new OutputStreamWriter(urlConnection.getOutputStream(), “UTF-8”); writer.write(String.format(“content=%s”, strUrlEncoded)); writer.close(); 有任何想法吗？

与Thymeleaf的utf8 charset: 当使用Spring和Thymeleaf时，我所有的西里尔字符都显示为????? 在页面上。运用 @RequestMapping(value = “/login”, method = RequestMethod.GET, produces = “text/html; charset=utf-8”) 正如在此建议的那样： https ： //stackoverflow.com/a/11866822/1479414 ，这里： https ： //stackoverflow.com/a/12023816/1479414没有帮助。如何解决这个问题？

Maven项目源编码不起作用: 我有一个使用以下属性配置的Maven-Project： 1.7 1.7 UTF-8 UTF-8 在我的机器上，这些设置一切正常。但是，在另一台机器上，当我检查它并尝试使用mvn install构建它时编译器错误unmappable character for encoding ASCII ： [ERROR] Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:2.0.2:compile (default-compile) on project scuttle: Compilation failure: Compilation failure: [ERROR] /export/local-1/julian-downloads/scuttle/src/main/java/de/fu/mi/scuttle/handlers/sakai/SakaiVV.java:[99,39] error: unmappable character for encoding ASCII [ERROR] [ERROR] /export/local-1/julian-downloads/scuttle/src/main/java/de/fu/mi/scuttle/handlers/sakai/SakaiVV.java:[99,40] error: unmappable character for encoding ASCII [ERROR] [ERROR] /export/local-1/julian-downloads/scuttle/src/main/java/de/fu/mi/scuttle/domain/sakai/SakvvTermin.java:[66,30] error: unmappable character for encoding ASCII [ERROR] [ERROR] […]

为什么Java生态系统在其软件堆栈中使用不同的字符编码？: 例如，类文件使用CESU-8（有时也称为MUTF-8），但内部Java首先使用UCS-2，现在它使用UTF-16。有关有效Java源文件的规范说，最小符合标准的Java编译器只需要接受ASCII字符。这些选择的原因是什么？在整个Java生态系统中使用相同的编码会不会更有意义？

如何在Netbeans中使用UTF-8字符: 我正在使用Netbeans6.9.1 IDE，并希望使用java在输出控制台中显示中文字符。我从网页上复制了中文字符并在“”之间复制。但它不受支持。 String char1 =“世界你好”; 的System.out.println（CHAR1）; 我是否需要在IDE中进行一些设置或在我的Java代码中使用某些设置？