Tag: utf 8

即使使用UTF-8,为什么在Windows与Linux中显示不同?

为什么以下在Linux与Windows中显示不同? System.out.println(new String(“¿”.getBytes(“UTF-8”), “UTF-8”)); 在Windows中: ¿ 在Linux中: 一个

使用XSLT转换XML并保留Unicode字符

我的XSLT转换已成功几个月,直到我遇到带有Unicode字符的XML文件(很可能是表情符号)。 我需要保留Unicode,但XSLT将其转换为HTML实体。 我认为将编码设置为UTF-8可以解决我的问题,但我仍然遇到问题。 任何帮助赞赏。 码: private byte[] transform(InputStream stream) throws Exception{ System.setProperty(“javax.xml.transform.TransformerFactory”, “org.apache.xalan.processor.TransformerFactoryImpl”); Transformer xmlTransformer; xmlTransformer = (TransformerImpl) TransformerFactory.newInstance().newTransformer(new StreamSource(createXsltStylesheet())); xmlTransformer.setOutputProperty(OutputKeys.ENCODING, “UTF-8″); XMLStreamReader reader = XMLInputFactory.newInstance().createXMLStreamReader(stream,”UTF-8”); Source staxSource = new StAXSource(reader, true); ByteArrayOutputStream outputStream = new ByteArrayOutputStream(); Writer writer = new OutputStreamWriter(outputStream, “UTF-8”); xmlTransformer.transform(staxSource, new StreamResult(writer)); return outputStream.toByteArray(); } 如果我加 xmlTransformer.setOutputProperty(OutputKeys.METHOD, “text”); 保留Unicode但不保留XML。

Java JTextPane HTML编辑器UTF-8字符编码

我正在使用JTextPane作为简单的html编辑器。 jtp=new JTextPane(); jtp.setContentType(“text/html;charset=UTF-8”); jtp.setEditorKit(new HTMLEditorKit()); 当我调用jtp.getText()时,我获得了很好的html代码,所有特殊字符都被转义。 但是我不希望逃避国家角色(波兰语),但只有特殊的html字符,如&,当我进入编辑器时 ą ś & 我明白了 <foo>ą ś & 但我想得到 <foo>ą ś & 怎么可能?

将字节数组转换为字符串然后再转换回字节数组时,为什么长度不同?

我有以下Java代码: byte[] signatureBytes = getSignature(); String signatureString = new String(signatureBytes, “UTF8”); byte[] signatureStringBytes = signatureString.getBytes(“UTF8”); System.out.println(signatureBytes.length == signatureStringBytes.length); // prints false 问:我可能误解了这一点,但我认为new String(byte[] bytes, String charset)和String.getBytes(charset)是反向操作? 问:作为后续工作,将byte []数组作为String传输的安全方法是什么?

Java字符串中的字符数

可能重复: Java:使用unicode上线显示平方根时的字符串长度? 如何获取String中的Unicode字符数? 鉴于泰国字符的char[] : [อ, ภ, ิ, ช, า, ต, ิ] 这在String中出现:อภิชาติ String.length()返回7.我知道(技术上)有7个字符,但是我需要一个能够返回5的方法。这就是屏幕上显示的字符空间的确切数量。

通过HttpURLConnection发送UTF-8字符失败

我现在已经花了一半星期天,我需要帮助: 我想使用Java HttpURLConnection将包含特殊字符UTF-8编码的字符串发送到服务器。 字符的正确编码失败。 例: strToSend:äù€ strUrlEncoded:%C3%A4 +%C3%B9 +%E2%82%AC strReceived:â⬠我的代码: urlConnection = (HttpURLConnection) new URL(“http://localhost:8080/NetworkingServer/ServerServlet”).openConnection(); urlConnection.setUseCaches(false); urlConnection.setDoOutput(true); // Triggers POST. urlConnection.setRequestProperty(“accept-charset”, “UTF-8”); urlConnection.setRequestProperty(“content-type”, “application/x-www-form-urlencoded”); String strToSend = “ä ù €”; System.out.println(“strToSend: ” + strToSend); String strUrlEncoded = URLEncoder.encode(strToSend, “UTF-8”); System.out.println(“strUrlEncoded: ” + strUrlEncoded); OutputStreamWriter writer = new OutputStreamWriter(urlConnection.getOutputStream(), “UTF-8”); writer.write(String.format(“content=%s”, strUrlEncoded)); writer.close(); 有任何想法吗?

与Thymeleaf的utf8 charset

当使用Spring和Thymeleaf时,我所有的西里尔字符都显示为????? 在页面上。 运用 @RequestMapping(value = “/login”, method = RequestMethod.GET, produces = “text/html; charset=utf-8”) 正如在此建议的那样: https : //stackoverflow.com/a/11866822/1479414 ,这里: https : //stackoverflow.com/a/12023816/1479414没有帮助。 如何解决这个问题?

Maven项目源编码不起作用

我有一个使用以下属性配置的Maven-Project: 1.7 1.7 UTF-8 UTF-8 在我的机器上,这些设置一切正常。 但是,在另一台机器上,当我检查它并尝试使用mvn install构建它时编译器错误unmappable character for encoding ASCII : [ERROR] Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:2.0.2:compile (default-compile) on project scuttle: Compilation failure: Compilation failure: [ERROR] /export/local-1/julian-downloads/scuttle/src/main/java/de/fu/mi/scuttle/handlers/sakai/SakaiVV.java:[99,39] error: unmappable character for encoding ASCII [ERROR] [ERROR] /export/local-1/julian-downloads/scuttle/src/main/java/de/fu/mi/scuttle/handlers/sakai/SakaiVV.java:[99,40] error: unmappable character for encoding ASCII [ERROR] [ERROR] /export/local-1/julian-downloads/scuttle/src/main/java/de/fu/mi/scuttle/domain/sakai/SakvvTermin.java:[66,30] error: unmappable character for encoding ASCII [ERROR] [ERROR] […]

为什么Java生态系统在其软件堆栈中使用不同的字符编码?

例如,类文件使用CESU-8(有时也称为MUTF-8),但内部Java首先使用UCS-2,现在它使用UTF-16。 有关有效Java源文件的规范说,最小符合标准的Java编译器只需要接受ASCII字符。 这些选择的原因是什么? 在整个Java生态系统中使用相同的编码会不会更有意义?

如何在Netbeans中使用UTF-8字符

我正在使用Netbeans6.9.1 IDE,并希望使用java在输出控制台中显示中文字符。 我从网页上复制了中文字符并在“”之间复制。 但它不受支持。 String char1 =“世界你好”; 的System.out.println(CHAR1); 我是否需要在IDE中进行一些设置或在我的Java代码中使用某些设置?