Tag: utf 8

UTF-8 URL解码/编码

我指示我的URL发送类似的Ajax请求: url += ‘/’ + something + ‘/’ + id; var response; $.ajax({ async : false, type: ‘DELETE’, url: url, … 我的removeId是一个包含UTF-8字符的变量。 我将在Java端处理该变量: @RequestMapping(value = “/something/{id}”, method = RequestMethod.DELETE) public void myMethod(HttpServletResponse response, @PathVariable String id) { … 然而,Java端的id变量与原始的不同,因为UTF-8字符变为奇怪的东西。 如何从JavaScript端发送UTF-8字符并在我的Java端再次转换它(Spring 3 with REST,我的Web服务器是Tomcat 7)? PS 1:即使我不使用encodeUriComponent ,我的URL似乎是自己编码的? PS 2:提出更清楚的问题: ie my id variable is araç […]

如何在Java中将UTF-8转换为unicode?

例如,在Emoji Char集中, U+1F601是“GRINNING FACE WITH SMILING EYES”的unicode值, \xF0\x9F\x98\x81是该字符的UTF-8字节值。 \xE2\x9D\xA4用于沉重的黑心,unicode是U+2764 。 所以我的问题是,如果我有一个带有值的字节数组(0xF0, 0x9F, 0x98, 0x81, 0xE2, 0x9D, 0xA4) ,那我怎么能把它转换成Unicode值呢? 对于上面的结果,我想要的是一个值为”1F601″和”2764″的String数组。 我知道我可以编写一个复杂的方法来完成这项工作,但我希望已经有一个库来完成这项工作。

检查String是否包含编码字符

您好我正在寻找一种方法来检测字符串是否被编码 例如 String name = “Hellä world”; String encoded = new String(name.getBytes(“utf-8”), “iso8859-1”); 这个encoded变量的输出是: Hellä world 如你所见,有一个带有坟墓的A和另一个符号。 有没有办法检查输出是否包含编码字符?

从Java中的字符串中删除BOM

我有文件中的字符串,其中包含BOM(来自UTF-8)。 我想将此字符串转换为win-1251并将其放入文件中。 我试图以这种方式从字符串中删除BOM: out.write(l.replace(‘\uFEFF’,’\0′) + “\n”); 但它不起作用。 为什么? 在win-1251文件中输出此字符串: ?1,…SOME_TEXT_HERE 第一个“?” 标志是非法的。

如何使用RandomAccessFile读取UTF8编码的文件?

我有用UTF8编码的文本文件(用于特定于语言的字符)。 我需要使用RandomAccessFile来寻找特定的位置并从中读取。 我想逐行阅读。 String str = myreader.readLine(); //returns wrong text, not decoded String str myreader.readUTF(); //An exception occurred: java.io.EOFException

如何删除不适合MySQL中utf8编码的错误字符?

我有脏数据。 有时它包含这样的字符。 我使用这些数据来进行查询 WHERE a.address IN (‘mydatahere’) 对于这个角色,我得到了 org.hibernate.exception.GenericJDBCException:操作’IN’的非法混合排序(utf8_bin,IMPLICIT),(utf8mb4_general_ci,COERCIBLE),(utf8mb4_general_ci,COERCIBLE) 如何过滤掉这样的字符? 我用的是Java。 谢谢。

在JSP中使用资源包属性进行国际化,非拉丁文本成为Mojibake

我有以下index.jsp: 和属性文件messages_ru_RU.properties: login = Логин 问题是我在输出中得到了垃圾unicode字符: Ëîãèí 更新 将.properies文件编码更改为UTF-8。 最新产品:Ðогин 请帮助我,将其更改为正常的西里尔字母。 属性文件: messages_ru_RU.properties

Java,Ant错误:编码Cp1252的不可映射字符

我在我的项目中使用Java,Eclipse和Ant。 我有一些我需要编辑的Java代码,并在其中添加一些UTF-8字符。 以前我的build.xml有:它工作正常。 在我尝试运行时添加那些UTF-8字符后,它会抛出“错误:编码Cp1252的不可映射的字符” 有谁能告诉我这是什么修复? 我尝试在xml中将编码更改为UTF-8和Cp1252,但没有运气。 我正在使用JRE7,Eclipse Kepler和Ant 4.11。

实现一个函数来检查字符串/字节数组是否遵循utf-8格式

我正在努力解决这个面试问题。 在明确定义了UTF-8格式之后。 例如:1字节:0b0xxxxxxx 2字节:….要求编写一个函数来validation输入是否有效UTF-8。 输入将是字符串/字节数组,输出应为是/否。 我有两种可能的方法。 首先,如果输入是一个字符串,因为UTF-8最多是4个字节,在我们删除前两个字符“0b”之后,我们可以使用Integer.parseInt(s)来检查字符串的其余部分是否在范围0到10FFFF。 此外,最好检查字符串的长度是否为8的倍数,以及输入字符串是否首先包含全0和1。 所以我将不得不经历两次字符串,复杂性将是O(n)。 其次,如果输入是字节数组(如果输入是字符串,我们也可以使用此方法),我们检查每个1字节元素是否在正确的范围内。 如果输入是一个字符串,首先检查字符串的长度是否为8的倍数,然后检查每个8字符的子字符串是否在该范围内。 我知道有很多关于如何使用Java库检查字符串的解决方案,但我的问题是我应该如何根据问题实现该function。 非常感谢。

java:如何将文件转换为utf8

我有一个文件有一些非utf8 caracters(如“ISO-8859-1”),所以我想将该文件(或读取)转换为UTF8编码,我该怎么做? 它是这样的代码: File file = new File(“some_file_with_non_utf8_characters.txt”); /* some code to convert the file to an utf8 file */ … 编辑:放一个编码示例