Tag: unicode

Java中的Unicode符号(箭头)

我想在我的应用程序中使用以下符号作为按钮: 箭头http://img402.imageshack.us/img402/3176/arrowso.jpg 我的代码: Button goToFirstButton = new Button(“\uE318”); Button prevPageButton = new Button(“\uE312”); Button nextPageButton = new Button(“\uE313”); Button goToLastButton = new Button(“\uE319”); 结果是 结果http://img693.imageshack.us/img693/9063/resultbu.jpg 看来,\ uE318和\ uE313是错误的。 我该怎么用? 对于goToLastButton和goToFirstButton,我更喜欢使用这个图像 alt text http://img3.imageshack.us/img3/5724/singlearrow.jpg 但我找不到,我应该使用哪个代码。

为什么Java生态系统在其软件堆栈中使用不同的字符编码?

例如,类文件使用CESU-8(有时也称为MUTF-8),但内部Java首先使用UCS-2,现在它使用UTF-16。 有关有效Java源文件的规范说,最小符合标准的Java编译器只需要接受ASCII字符。 这些选择的原因是什么? 在整个Java生态系统中使用相同的编码会不会更有意义?

在Java中对多语言环境字符串进行排序

我正在尝试按字符串字段“country”对对象列表进行排序。 每个国家都使用其母语 阿根廷 澳大利亚 Österreich Ελλάδα България… 我想做的是让“България”例如出现在“A *”国家之后,因为字母’Б’对应于拉丁’B’。 我正在尝试使用默认的Collat​​er,但非拉丁名称仍然在列表中排在最后。 到目前为止,这是我的代码: private static final Comparator DOMAIN_COUNTRY_COMPARATOR = new Comparator() { @Override public int compare(DomainTO t, DomainTO t1) { Collator defaultCollator = Collator.getInstance(); return defaultCollator.compare(t.getCountry(), t1.getCountry()); } };

Wingdings / Symbol字符之间的映射及其Unicode等价物

MsWord使用Wingdings和Symbol字符作为项目符号,默认情况下它们的hex值为F0A7和F0B7。 我想将子弹转换为它们的Unicode等价物。 当然,这取决于所使用的实际字体,因此F0A7 Wingding将成为Unicode 25AA(●)。 我发现了从Wingdings到Unicode以及从Symbol到Unicode的部分映射。 是否有一般的库(最好是Java)或这些映射的数据库?

当从Java Applet传递到Java Script时,为什么我的Unicode String会被破坏?

我很新,所以不要太苛刻:) 问(TL; DR) 我遇到一个问题,将unicode String从网页中的嵌入式javax.swing.JApplet传递到Java Script部分。 我不确定这是对相关技术的错误还是误解: 问题 我想将一个unicode字符串从Java Applet传递给Java Script,但是String搞砸了。 奇怪的是,问题不会发生在Internet Explorer 10中,而是发生在Chrome(v26)和Firefox(v20)中 。 我没有测试过其他浏览器。 返回的String似乎没问题,除了最后一个unicode字符。 Java Script Debugger和Web Page中的结果将是: abc→abc 表示→表 ま→ま ウォッチリスト→ウォッチリス アップロード→アップロー ホ→ ホ→ホ(不确定) アップロードabc→アップロードabc 该字符串似乎在最后的字节中被破坏。 如果它以ASCII字符结尾,那么字符串就可以了。 此外,问题不是在每个组合中发生,也不是每次都发生(不确定)。 因此我怀疑是一个错误,我担心我可能会发布一个无效的问题。 测试设置 简约设置包括一个返回一些unicode(UTF-8)字符串的applet: /* TestApplet.java */ import javax.swing.*; public class TestApplet extends JApplet { private String[] testStrings = { “abc”, // OK (because […]

在java中用日语字符发送电子邮件

我正在使用java发送电子邮件。 发送的消息可以使用不同的语言,但是当我用日语发送时,收到的邮件只有“???????” 字符。 代码是这样的: String content = “\u30d5\u30a1\u30a4\u30eb\u540d:”; SMTPMessage message = new SMTPMessage(sess); message.setFrom(new InternetAddress(from)); InternetAddress dests[] = new InternetAddress[]{ new InternetAddress(to) }; message.setRecipients(Message.RecipientType.TO, dests); message.setSubject(subject); message.setContent(content, “text/html”); Transport.send(message); 发送的内容是unicode字符。 我应该如何正确编码消息?

如何在java中将UTF-16转换为UTF-32?

我一直在寻找解决方案,但这个主题似乎并不多。 我找到了建议的解决方案: String unicodeString = new String(“utf8 here”); byte[] bytes = String.getBytes(“UTF8″); String converted = new String(bytes,”UTF16”); 但是,从utf8转换为utf16,java不处理“UTF32”,这使得该解决方案不可行。 有没有人知道如何实现这一目标?

使用iText Java的pdf中的日文/中文文本

我需要在java中使用iText将xml web响应中的日文/中文文本添加到pdf中。 我将KozMinPro-Regular.ttf复制到我的c:\ WINDOWS \ Fonts文件夹后尝试了以下代码但是失败了。 Font font = new Font(BaseFont.createFont(“KozMinPro-Regular”, “UniJIS-UCS2-H”, BaseFont.EMBEDDED), 10); 谁能帮我?

Unicode字符在Java JSON解析中显示为问号

过去几天我一直在搜索这个,但我认为我无法找到正确的指针。 如果发现重复,请将其与相应的问题合并。 我很擅长使用JSON,作为我的一个项目的一部分,我需要解码JSON文件并对其进行进一步处理。 但是,当我尝试使用Json简单库进行解码时,我在解析的对象中得到了一些奇怪的问号而不是实际的字符。 示例代码如下所示: String str = “{\”alias\”: [\”Evr\u00f3pa\”, \”\u05d0\u05d9\u05e8\u05d5\u05e4\”]}”; JSONParser parser = new JSONParser(); JSONObject jsonObject = (JSONObject)parser.parse(str); System.out.println(jsonObject) gives {“alias”:[“Evrópa”,”?????”]} 我尝试使用Json-lib也有相同的结果。 谢谢您的帮助。

ED A0 80 ED B0 80是一个有效的UTF-8字节序列吗?

java.nio.charset.Charset.forName(“utf8”)。decode解码一个字节序列 ED A0 80 ED B0 80 进入Unicode代码点: U+10000 java.nio.charset.Charset.forName(“utf8”)。decode也解码一个字节序列 F0 90 80 80 进入Unicode代码点: U+10000 这由以下代码validation。 现在这似乎告诉我UTF-8编码方案将ED A0 80 ED B0 80和F0 90 80 80解码为相同的unicode代码点。 但是,如果我访问https://www.google.com/search?query=%ED%A0%80%ED%B0%80 , 我可以看到它明显不同于页面https://www.google.com/search?query=%F0%90%80%80 由于谷歌搜索使用的是UTF-8编码方案(如果我错了,请纠正我), 这表明UTF-8不能将ED A0 80 ED B0 80和F0 90 80 80解码为相同的unicode码点。 所以基本上我想知道,按官方标准,UTF-8应该将ED A0 80 ED B0 80字节序列解码为Unicode代码点U + 10000吗? 代码 : public class Test { public static […]