Tag: openxml

从docx中提取符号字符

我正在开发一个JAVA程序,它处理docx文件的XML内容并将其转换为特定格式。 它工作得很好,但如果Word文件包含符号字符,例如希腊字母,我会遇到问题。 在这种情况下,我只看到小方块。 我检查了源代码并看到如下内容: ďˇ 或者,如果我将编码设置为UTF-8:  当我查看为Hexa时,似乎希腊字符编码为EF 81 A1 for alpha, EF 81 A2 for beta等等。 我也尝试了val.getBytes(Charset.forName(“utf8”)) ,其中val是标签的值。 结果是例如[-17, -127, -95] 。 负面价值对我来说非常令人惊讶。 所以我的问题是,将这些符号转换为常规UTF-8字符的安全可靠方法是什么?

如何使用Apache POI将HSSFWorkbook转换为XSSFWorkbook?

如何转换 org.apache.poi.hssf.usermodel.HSSFWorkbook 至 org.apache.poi.xssf.usermodel.XSSFWorkbook 在Apache POI? 环境 : JSE1.6 JBossAS 4.3.2 POI 3.7