Tag: 字符编码

java.nio.charset.MalformedInputException:输入长度= 1

我有这个(剥离代码示例的HTML标签)函数,用CSV构建HTML表格,但每次我尝试运行它时都会遇到运行时错误,我不知道为什么。 谷歌表示可能有一些编码错误,但我不知道如何改变它。 我的CSV以ANSI编码,包含ä,Ä,Ü,Ö等字符,但我无法控制编码或将来会发生变化。 错误发生在这里: Caused by: java.io.UncheckedIOException: java.nio.charset.MalformedInputException: Input length = 1 at java.io.BufferedReader$1.hasNext(Unknown Source) at java.util.Iterator.forEachRemaining(Unknown Source) at java.util.Spliterators$IteratorSpliterator.forEachRemaining(Unknown Source) at java.util.stream.ReferencePipeline$Head.forEach(Unknown Source) at testgui.Csv2Html.start(Csv2Html.java:121) 121号线是 lines.forEach(line -> { 源代码: protected void start() throws Exception { Path path = Paths.get(inputFile); FileOutputStream fos = new FileOutputStream(outputFile, true); PrintStream ps = new PrintStream(fos); boolean withTableHeader = […]

Java App:无法正确读取iso-8859-1编码文件

我有一个编码为iso-8859-1的文件,包含ô等字符。 我正在使用java代码读取此文件,例如: File in = new File(“myfile.csv”); InputStream fr = new FileInputStream(in); byte[] buffer = new byte[4096]; while (true) { int byteCount = fr.read(buffer, 0, buffer.length); if (byteCount <= 0) { break; } String s = new String(buffer, 0, byteCount,"ISO-8859-1"); System.out.println(s); } 然而,ô字符总是乱码,通常打印为? 。 我已经阅读了这个主题(并且在路上学到了一点),例如 http://www.joelonsoftware.com/articles/Unicode.html http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=4508058 http://www.ingrid.org/java/i18n/utf-16/ 但仍然无法使这个工作 有趣的是,这适用于我的本地电脑(xp),但不适用于我的Linux机箱。 我已经检查过我的jdk支持所需的字符集(它们是标准的,所以这并不奇怪)使用: System.out.println(java.nio.charset.Charset.availableCharsets());

如何确定区域设置的字母表是什么?

我想确定给定语言环境的字母表是什么,最好是基于浏览器Accept-Language标头值。 任何人都知道怎么做,必要时使用图书馆?

Windows上的Ant编码问题 – UTF-8文件但在变音符号上吐出垃圾

不知何故,我无法让我的UTF-8资源与Ant合作。 我得到了很多“警告:编码ascii的不可映射的字符”。 我真的很疯狂。 小时,小时和小时。 顺便说一句,我注意到有5个人已经疯狂地使用了标签。 🙂 是的,我已经读过这个 , 这个和其他人。 谷歌也(至少3个或4个不同搜索的前5页结果,至少)。 有javac选项。 我试过了。 还有一些预设或东西(对不起,凌晨3点)。 也没用。 我正在使用Ant生成Android apk文件。 我不能使用Eclipse,所以没有。 顺便说一句,ant文档对我来说是胡言乱语。 这些例子完全没用。 我已经不记得我尝试了多少。 我尝试使用Dfile.encoding选项,尝试将其与CHCP 65001 Windows命令混合使用。 做了所有的组合,它甚至让Ant(Javac我猜)停止吐痰错误,但它仍然没关系。 我的代码仍然以垃圾carachters(一堆??而不是á,í等)结束。

如何用java保存中文字符到文件?

我使用以下代码将中文字符保存为.txt文件,但是当我用Wordpad打开它时,我无法读取它。 StringBuffer Shanghai_StrBuf = new StringBuffer(“\u4E0A\u6D77”); boolean Append = true; FileOutputStream fos; fos = new FileOutputStream(FileName, Append); for (int i = 0;i < Shanghai_StrBuf.length(); i++) { fos.write(Shanghai_StrBuf.charAt(i)); } fos.close(); 我能做什么 ? 我知道如果我将中文字符剪切并粘贴到Wordpad中,我可以将其保存为.txt文件。 我如何用Java做到这一点?

为什么我的加密字符串看起来只包含问号?

我在Java中加密字符串,当我打印加密数据时,我只看到问号。 举个例子: 纯文本: jjkkjlkljkj 加密文字: ??????????? 在再次解密此文本后,我再次获得jjkkjlkljkj 。 所以看起来加密工作正常。 但为什么我只能看到问号呢?

Spring MVC响应编码问题

在过去几个小时里,我已经阅读了很多关于这个主题的内容,到目前为止还没有任何工作。 我正在尝试返回包含“奇数”某些字符的响应。 这是一个例子,非常简单: @ResponseBody @RequestMapping(value=”test”) public String test(){ String test = “čćžđš”; System.out.println(test); logger.info(test); return test; } 这是我的web.xml ,因为我找到了一些CharacterEncodingFilter帮助的答案(虽然不是我的情况)。 我使用POST方法,因为我读到这适用于POST。 也找到了这个答案 (相关)。 也没有帮助。 当我调试它时会出现正确的值,但是当我打印时它没有,因为它可以在下面看到: 当我从jmeter测试时,响应似乎没问题, Content-Type是text/html;charset=UTF-8 这是一个截图。 http://i56.tinypic.com/14lt653.jpg 我认为正确的方法是返回UTF-8,也许我错了。

如何将UTF8转换为Unicode

我尝试将UTF8字符串转换为Java Unicode字符串。 String question = request.getParameter(“searchWord”); byte[] bytes = question.getBytes(); question = new String(bytes, “UTF-8”); 输入是中文字符,当我比较每个字符的hex代码时,它是相同的中文字符。 所以我很确定charset是UTF8。 我哪里出错了?

UTF-8编码和http参数

我正在使用YahooUI Javascript库进行简单的ajax调用,如下所示: YAHOO.util.Connect.setForm(‘myform’); YAHOO.util.Connect.asyncRequest(‘POST’, url, …); 以下是我的应用程序中的设置:Tomcat版本:6.0.18 Tomcat服务器连接器:URIEncoding =“UTF-8”webapp页面: 在YahooUI连接器库文档中也有说明: setForm将使用encodeURIComponent对每个HTML表单字段的名称和值进行编码。 这会产生一串UTF-8编码的名称 – 值对。 注意:使用不同的字符集值设置“Content-Type”的HTTP标头不会更改序列化数据的编码。序列化数据的编码。 我可以看到作为参数发送的法语字符被编码(在ie7中使用iehttpheader工具): name=%C3%88%C3%A0%C3%B4 testParam=%C3%B4%C3%B4 对于数据:名称:Èàô和testParam:ôô 但在服务器端,我看到的价值如下:ÃÂÃÂà即使我将字符串转换为字节,然后使用如下定义的字符集创建新字符串:String val = new String(oo.getBytes(“UTF-8”)); 我无法按预期获得准确的数据。 注意:我已经引用了下面的问题,但无法解决此问题: 如何让UTF-8在Java webapps中运行? 请指导。 更新:调用W3.org网站http://www.w3.org/International/O-URL-code.html上给出的解码UTF-8function给我预期的结果。 我希望Tomcat能解码吗?

非法字符 – CTRL-CHAR

我从webservices获得以下exceptopn: com.ctc.wstx.exc.WstxUnexpectedCharException:非法字符((CTRL-CHAR,代码15)) 我知道背后的原因,我想要返回的数据中有“控制字符”。 并且在xml中不允许使用CTRL-CHAR。 我搜索了解决方案,很多地方我找到了删除CTRL-CHAR的代码。 如果我从数据中删除控制字符,我最终会担心数据丢失吗? 我希望清洁解决方案可以编码。 而不是删除控制字符。