Tag: utf 8

将具有已知编码的文件转换为UTF-8

我需要将文本文件转换为String,最后,我应该将其作为输入参数(类型InputStream)放到IFile.create(Eclipse)中。 寻找示例或如何做但仍然无法弄清楚……需要你的帮助! 只是为了测试,我尝试将原始文本文件转换为使用此代码编码的UTF-8 FileInputStream fis = new FileInputStream(FilePath); InputStreamReader isr = new InputStreamReader(fis); Reader in = new BufferedReader(isr); StringBuffer buffer = new StringBuffer(); int ch; while ((ch = in.read()) > -1) { buffer.append((char)ch); } in.close(); FileOutputStream fos = new FileOutputStream(FilePath+”.test.txt”); Writer out = new OutputStreamWriter(fos, “UTF8”); out.write(buffer.toString()); out.close(); 但即使最后的* .test.txt文件有UTF-8编码,里面的字符也会被破坏。

在使用Oracle的Java 7时,File.list()在Mac OS X上错误地检索具有NON-ASCII字符的文件名

我在使用File.list()时遇到问题,当使用Oracle的Java 7时,文件名在Mac OS X上错误地检索到了非ASCII字符。 我使用以下示例: import java.io.*; import java.util.*; public class ListFiles { public static void main(String[] args) { try { File folder = new File(“.”); String[] listOfFiles = folder.list(); for (int i = 0; i < listOfFiles.length; i++) { System.out.println(listOfFiles[i]); } Map env = System.getenv(); for (String envName : env.keySet()) { System.out.format(“%s=%s%n”, envName, env.get(envName)); […]

什么是文本文件中“行尾”的UTF-8表示

什么是UTF-8中“行尾”的二进制表示。

有没有理由比UTF-8更喜欢UTF-16?

检查UTF-16和UTF-8的属性,我找不到任何理由更喜欢UTF-16。 但是,检查Java和C#,它看起来像字符串和字符默认为UTF-16。 我认为这可能是出于历史原因,或者出于性能原因,但无法找到任何信息。 有谁知道为什么这些语言选择UTF-16? 还有什么理由让我这样做吗? 编辑:同时我也找到了这个答案 ,这似乎是相关的,并有一些有趣的链接。

一旦UTF-8编码,我如何截断一个java字符串以适应给定的字节数?

如何截断java String以便我知道一旦UTF-8编码它将适合给定数量的字节存储?

jsp没有以适当的格式传递UTF-8数据

我希望JSP页面支持UTF8数据我能够使用struts2和jsp进行本地化但是当我用本地语言从jsp上的用户获取数据时,信息不能以正确的格式运行,而是传递一些grabled数据。 这是我的jsp代码:—— : : : : :  (mmm/dd/yyyy): : : : : : :

恢复错误编码的字符(Java)

我们在Linux中使用cron运行了一些java代码,以便在生产数据库中保存数千条记录。 该框中的locale charmap是“ANSI_X3.4-1968”。 现在,我们采取了以下步骤,然后将它们保存到数据库中。 1.在文本上使用StringEscapeUtils.unescapeHtml4 2.以UTF-8格式写入字符串并在数据库中保留 现在问题是在这些步骤之后,特殊字符显示为“?”。 是否有可能将其恢复为原始角色? 我已通过以下步骤模拟了问题。 将Eclipse编码更改为“ANSI_X3.4-1968” 写下面的代码行 String insertSpecial = StringEscapeUtils.unescapeHtml4(“×”); System.out.println(insertSpecial); String uni = new String(insertSpecial.getBytes(), “UTF-8”);// This value is currently in DB System.out.println(uni); 现在我想从字符串“uni”中取回“×”。 任何帮助将不胜感激。

查询字符串中的字符编码,希伯来语

我正在尝试使用希伯来语中的查询字符串参数发送GET请求。 当控制器获得请求时,参数是乱码。 我添加了“org.springframework.web.filter.CharacterEncodingFilter”,但它没有改变一件事。 请告知如何解决它。 更新:这是请求。 GET /myapp/specialties?query=%D7%92%D7%99%D7%A0%D7%A0%D7%A0%D7%A0 HTTP/1.1 Host: localhost:8080 Connection: keep-alive Accept: * Cache-Control: no-cache User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.117 Safari/537.36 Content-Type: application/json;charsert=utf-8 Accept-Encoding: gzip,deflate,sdch Accept-Language: en-US,en;q=0.8,he;q=0.6 Query String Parametersview sourceview URL encoded query:גיננננ Response Headersview source Content-Type:application/json;charset=UTF-8 Date:Mon, 03 Mar 2014 20:45:17 GMT Server:Apache-Coyote/1.1 Transfer-Encoding:chunked […]

在java中将字符串从一种编码解释为另一种编码

我四处寻找答案(我确定他们在那里),我不确定这是可能的。 所以,我收到了一个包含“för”字样的巨大文件。 我正在使用RandomAccessFile,因为我知道它的位置(种类),因此可以使用seek()函数来实现。 要知道我已经找到它,我的程序中有一个字符串“för”,我检查是否相等。 这是问题,我运行调试器,当我得到“för”时,我得到的比较是“för”。 所以我的程序终止而没有找到任何“för”。 这是我用来获取单词的代码: private static String getWord(RandomAccessFile file) throws IOException { StringBuilder stb = new StringBuilder(); String word; char c; c = (char)file.read(); int end; do { stb.append(c); end = file.read(); if(end==-1) return “-1″; c = (char)end; } while (c != ‘ ‘); word = stb.toString(); word.trim(); return word; } 所以基本上我将所有字符从文件中的当前点返回到第一个”字符。 […]

使用Java在控制台中显示印地语

StringBuffer contents=new StringBuffer(); BufferedReader input = new BufferedReader(new FileReader(“/home/xyz/abc.txt”)); String line = null; //not declared within while loop while (( line = input.readLine()) != null){ contents.append(line); } System.out.println(contents.toString()); 文件abc.txt包含 \u0905\u092d\u0940 \u0938\u092e\u092f \u0939\u0948 \u091c\u0928\u0924\u093e \u091c\u094b \u091a\u093e\u0939\u0924\u0940 \u0939\u0948 \u092 我想在使用Java的控制台中用印地语显示它。 如果我只是打印像这样的字符串str =“\ u0905 \ u092d \ u0940 \ u0938 \ u092e \ u092f \ u0939 \ u0948 […]