Tag: utf 8

UTF-8 URL解码/编码: 我指示我的URL发送类似的Ajax请求： url += ‘/’ + something + ‘/’ + id; var response; $.ajax({ async : false, type: ‘DELETE’, url: url, … 我的removeId是一个包含UTF-8字符的变量。我将在Java端处理该变量： @RequestMapping(value = “/something/{id}”, method = RequestMethod.DELETE) public void myMethod(HttpServletResponse response, @PathVariable String id) { … 然而，Java端的id变量与原始的不同，因为UTF-8字符变为奇怪的东西。如何从JavaScript端发送UTF-8字符并在我的Java端再次转换它（Spring 3 with REST，我的Web服务器是Tomcat 7）？ PS 1：即使我不使用encodeUriComponent ，我的URL似乎是自己编码的？ PS 2：提出更清楚的问题： ie my id variable is araç […]

如何在Java中将UTF-8转换为unicode？: 例如，在Emoji Char集中， U+1F601是“GRINNING FACE WITH SMILING EYES”的unicode值， \xF0\x9F\x98\x81是该字符的UTF-8字节值。 \xE2\x9D\xA4用于沉重的黑心，unicode是U+2764 。所以我的问题是，如果我有一个带有值的字节数组(0xF0, 0x9F, 0x98, 0x81, 0xE2, 0x9D, 0xA4) ，那我怎么能把它转换成Unicode值呢？对于上面的结果，我想要的是一个值为”1F601″和”2764″的String数组。我知道我可以编写一个复杂的方法来完成这项工作，但我希望已经有一个库来完成这项工作。

检查String是否包含编码字符: 您好我正在寻找一种方法来检测字符串是否被编码例如 String name = “Hellä world”; String encoded = new String(name.getBytes(“utf-8”), “iso8859-1”); 这个encoded变量的输出是： HellÃ¤ world 如你所见，有一个带有坟墓的A和另一个符号。有没有办法检查输出是否包含编码字符？

从Java中的字符串中删除BOM: 我有文件中的字符串，其中包含BOM（来自UTF-8）。我想将此字符串转换为win-1251并将其放入文件中。我试图以这种方式从字符串中删除BOM： out.write(l.replace(‘\uFEFF’,’\0′) + “\n”); 但它不起作用。为什么？在win-1251文件中输出此字符串： ?1,…SOME_TEXT_HERE 第一个“？” 标志是非法的。

如何使用RandomAccessFile读取UTF8编码的文件？: 我有用UTF8编码的文本文件（用于特定于语言的字符）。我需要使用RandomAccessFile来寻找特定的位置并从中读取。我想逐行阅读。 String str = myreader.readLine(); //returns wrong text, not decoded String str myreader.readUTF(); //An exception occurred: java.io.EOFException

如何删除不适合MySQL中utf8编码的错误字符？: 我有脏数据。有时它包含这样的字符。我使用这些数据来进行查询 WHERE a.address IN (‘mydatahere’) 对于这个角色，我得到了 org.hibernate.exception.GenericJDBCException：操作’IN’的非法混合排序（utf8_bin，IMPLICIT），（utf8mb4_general_ci，COERCIBLE），（utf8mb4_general_ci，COERCIBLE）如何过滤掉这样的字符？我用的是Java。谢谢。

在JSP中使用资源包属性进行国际化，非拉丁文本成为Mojibake: 我有以下index.jsp：和属性文件messages_ru_RU.properties： login = Логин 问题是我在输出中得到了垃圾unicode字符： Ëîãèí 更新将.properies文件编码更改为UTF-8。最新产品：ÐÐ¾Ð³Ð¸Ð½ 请帮助我，将其更改为正常的西里尔字母。属性文件： messages_ru_RU.properties

Java，Ant错误：编码Cp1252的不可映射字符: 我在我的项目中使用Java，Eclipse和Ant。我有一些我需要编辑的Java代码，并在其中添加一些UTF-8字符。以前我的build.xml有：它工作正常。在我尝试运行时添加那些UTF-8字符后，它会抛出“错误：编码Cp1252的不可映射的字符” 有谁能告诉我这是什么修复？我尝试在xml中将编码更改为UTF-8和Cp1252，但没有运气。我正在使用JRE7，Eclipse Kepler和Ant 4.11。

实现一个函数来检查字符串/字节数组是否遵循utf-8格式: 我正在努力解决这个面试问题。在明确定义了UTF-8格式之后。例如：1字节：0b0xxxxxxx 2字节：….要求编写一个函数来validation输入是否有效UTF-8。输入将是字符串/字节数组，输出应为是/否。我有两种可能的方法。首先，如果输入是一个字符串，因为UTF-8最多是4个字节，在我们删除前两个字符“0b”之后，我们可以使用Integer.parseInt（s）来检查字符串的其余部分是否在范围0到10FFFF。此外，最好检查字符串的长度是否为8的倍数，以及输入字符串是否首先包含全0和1。所以我将不得不经历两次字符串，复杂性将是O（n）。其次，如果输入是字节数组（如果输入是字符串，我们也可以使用此方法），我们检查每个1字节元素是否在正确的范围内。如果输入是一个字符串，首先检查字符串的长度是否为8的倍数，然后检查每个8字符的子字符串是否在该范围内。我知道有很多关于如何使用Java库检查字符串的解决方案，但我的问题是我应该如何根据问题实现该function。非常感谢。

java：如何将文件转换为utf8: 我有一个文件有一些非utf8 caracters（如“ISO-8859-1”），所以我想将该文件（或读取）转换为UTF8编码，我该怎么做？它是这样的代码： File file = new File(“some_file_with_non_utf8_characters.txt”); /* some code to convert the file to an utf8 file */ … 编辑：放一个编码示例