Tag: byte order mark

Java是否有获取各种字节顺序标记的方法？: 我在Java中寻找一个实用程序方法或常量，它将返回与编码的相应字节顺序标记相对应的字节，但我似乎无法找到一个。有吗？我真的想做点什么： byte[] bom = Charset.forName( CharEncoding.UTF8 ).getByteOrderMark(); CharEncoding来自Apache Commons。

如何使用BOM对UTF-16LE字节数组进行编码/解码？: 我需要在java.lang.String编码/解码UTF-16字节数组。字节数组通过字节顺序标记（BOM）提供给我，我需要使用BOM编码字节数组。此外，因为我正在处理Microsoft客户端/服务器，我想以小端（以及LE BOM）发出编码以避免任何误解。我确实意识到使用BOM它应该工作大端，但我不想在Windows世界游泳上游。作为一个例子，这里有一个方法，它使用BOM将java.lang.String编码为带小端的UTF-16 ： public static byte[] encodeString(String message) { byte[] tmp = null; try { tmp = message.getBytes(“UTF-16LE”); } catch(UnsupportedEncodingException e) { // should not possible AssertionError ae = new AssertionError(“Could not encode UTF-16LE”); ae.initCause(e); throw ae; } // use brute force method to add BOM byte[] utf16lemessage = new byte[2 […]

为什么org.apache.xerces.parsers.SAXParser不会跳过utf8编码的xml中的BOM？: 我有一个带utf8编码的xml。此文件包含BOM作为文件的开头。所以在解析过程中我遇到了org.xml.sax.SAXParseException：prolog中不允许使用内容。我无法从文件中删除这3个字节。我无法将文件加载到内存中并在此处删除它们（文件很大）。因此，出于性能原因，我正在使用SAX解析器，如果它们在“”标记之前存在，则只想跳过这3个字节。我应该为此inheritanceInputStreamReader吗？我是java的新手 – 请告诉我正确的方法。

如何在java中添加UTF-8 BOM: 我有一个Java存储过程，它使用Resultset对象从表中获取记录并创建一个csv文件。 BLOB retBLOB = BLOB.createTemporary(conn, true, BLOB.DURATION_SESSION); retBLOB.open(BLOB.MODE_READWRITE); OutputStream bOut = retBLOB.setBinaryStream(0L); ZipOutputStream zipOut = new ZipOutputStream(bOut); PrintStream out = new PrintStream(zipOut,false,”UTF-8″); out.write(‘\ufeff’); out.flush(); zipOut.putNextEntry(new ZipEntry(“filename.csv”)); while (rs.next()){ out.print(“\”” + rs.getString(i) + “\””); out.print(“,”); } out.flush(); zipOut.closeEntry(); zipOut.close(); retBLOB.close(); return retBLOB; 但生成的csv文件未显示正确的德语字符。 Oracle数据库的NLS_CHARACTERSET值也为UTF8。请建议。