Tag: 阿拉伯语

我怎么能从java中删除一个字符串的阿拉伯标点符号

我正在写阿拉伯语字典,我得到的句子就像 String original =“’أبنفلانا:عابهورماهبخلةسوء。’”; 从我的数据库,但我无法处理句子而不删除重音和标点符号 我试过用 import java.text.Normalizer; import java.text.Normalizer.Form; import java.util.regex.Pattern; public static String deAccent(String str) { String nfdNormalizedString = Normalizer.normalize(str, Normalizer.Form.NFD); Pattern pattern = Pattern.compile(“\\p{InCombiningDiacriticalMarks}+”); return pattern.matcher(nfdNormalizedString).replaceAll(“”); } 但它没有用

我想要一个Java阿拉伯语词干分析器

我正在寻找阿拉伯语的Java词干分析器。 我发现了一个名为“AraMorph”的lib,但它的输出是无法控制的,它会形成不需要的单词。 阿拉伯语还有其他的词干吗?

无法将阿拉伯字符插入oracle数据库

我在使用JDBC驱动程序从java中读取oracle中的阿拉伯字符时出现问题,主要问题是我找不到正确的字符编码来获取正确的数据,但我使用此方法手动解决了问题: public static String cleanORCLString(String s) throws UnsupportedEncodingException { byte[] bytes = s.getBytes(“UTF16”); String x = new String(bytes, “Cp1256”); String finalS = x.substring(3); StringBuilder sb = new StringBuilder(finalS); for(int k = sb.length() – 1 ; k > 0 ; k–) { if(!isEven(k)) { sb.deleteCharAt(k); } } return sb.toString(); } 这个方法给我正确的字符,就像它在数据库中显示的那样,但是当我尝试更新/插入阿拉伯数据时,它会保存错误的字符。 例如:我的文本在数据库中保存为“?????????” 而不是“مرحبا”。 这是我连接到oracle数据库的方式。 URL = […]

在System.out中打印阿拉伯语或其他字符集

我要打印一个带有阿拉伯字符的字符串: private static void print(String msg, Object… args) { try { PrintStream ps = new PrintStream(System.out, true, “ISO-8859-6”); ps.println(String.format(msg, args)); } catch (UnsupportedEncodingException error) { System.err.println(error); System.exit(0); } } 但是,我从Eclipse日志控制台看到,阿拉伯字符显示为这些字符系列èååêÒÉ 我的代码中可能缺少什么?

创建自定义JFileChooser

要创建阿拉伯语JFileChooser(RTL),我使用以下内容: MyFileChooser: import javax.swing.JOptionPane; import javax.swing.UIManager; import javax.swing.JFileChooser; import javax.swing.filechooser.FileNameExtensionFilter; import javax.swing.filechooser.FileView; import java.io.File; import java.awt.ComponentOrientation; import java.awt.Dimension; public class MyFileChooser extends JFileChooser { private String extension; private String title; public MyFileChooser(String extension, String title) { super(); this.extension = extension; this.title = title; addChoosableFileFilter(new FileNameExtensionFilter(String.format(“(*.%1$s) فقط %1$s ملفات”, extension), extension)); applyComponentOrientation(ComponentOrientation.RIGHT_TO_LEFT); //setPreferredSize(new Dimension(450, 350)); } […]

用Java排序阿拉伯语单词

我有一份阿拉伯语单词列表,我想对其进行排序。 我已尝试使用不同语言环境的标准Collat​​or(如英语或法语但没有太多希望),我甚至创建了自己的RuleBasedCollat​​or但无济于事。 显然,默认排序依赖于unicode值顺序,在许多情况下,这种顺序有效,但显然不在这一顺序中。 遵循javadocs的说明,RuleBasedCollat​​or需要一个字符串,按照您希望它们排序的顺序指定字符。 我使用此表中的unicode代码创建了以下字符串: String arabicLetters = “< \u0623=\uFE83=\uFE84 < \u0628=\uFE8F=\uFE90=\uFE92=\uFE91 < \u062A=\uFE95=\uFE96=\uFE98=\uFE97 < \u062B=\uFE99=\uFE9A=\uFE9C=\uFE9B < \u062C=\uFE9D=\uFE9E=\uFEA0=\uFE9F < \u062D=\uFEA1=\uFEA2=\uFEA4=\uFEA3 < \u062E=\uFEA5=\uFEA6=\uFEA8=\uFEA7 < \u062F=\uFEA9=\uFEAA < \u0630=\uFEAB=\uFEAC < \u0631=\uFEAD=\uFEAE < \u0632=\uFEAF=\uFEB0 < \u0633=\uFEB1=\uFEB2=\uFEB4=\uFEB3 < \u0634=\uFEB5=\uFEB6=\uFEB8=\uFEB7 < \u0635=\uFEB9=\uFEBA=\uFEBC=\uFEBB < \u0636=\uFEBD=\uFEBE=\uFEC0=\uFEBF < \u0637=\uFEC1=\uFEC2=\uFEC4=\uFEC3 < \u0638=\uFEC5=\uFEC6=\uFEC8=\uFEC7 < \u0639=\uFEC9=\uFECA=\uFECC=\uFECB < \u063A=\uFECD=\uFECE=\uFED0=\uFECF < \u0641=\uFED1=\uFED2=\uFED4=\uFED3 < \u0642=\uFED5=\uFED6=\uFED8=\uFED7 < \u0643=\uFED9=\uFEDA=\uFEDC=\uFEDB < \u0644=\uFEDD=\uFEDE=\uFED0=\uFEDF < […]

Java日期时间用阿拉伯语

当用户选择的语言是阿拉伯语时如何获得阿拉伯语日期,如果选择的语言是春季申请中的英语,那么英语格式的日期? 我尝试根据请求将默认语言环境设置为英语和阿拉伯语,但这对我在阿拉伯语中获取日历api时间没有帮助(9小时15分钟)。

为什么Java BufferedReader()没有正确读取阿拉伯语和中文字符?

我正在尝试读取每行包含英文和阿拉伯字符的文件以及每行包含英文和中文字符的另一个文件。 然而,阿拉伯文和中文的字符无法正确显示 – 它们只是作为问号出现。 知道怎么解决这个问题吗? 这是我用来阅读的代码: try { String sCurrentLine; BufferedReader br = new BufferedReader(new FileReader(directionOfTargetFile)); int counter = 0; while ((sCurrentLine = br.readLine()) != null) { String lineFixedHolder = converter.fixParsedParagraph(sCurrentLine); System.out.println(“The line number “+ counter + ” contain : ” + sCurrentLine); counter++; } } 第01版 在读完该行并获得阿拉伯语和中文单词后,我使用一个函数来翻译它们,只需在ArrayList中搜索给定的阿拉伯语文本 (包含所有预期的单词)(使用indexOf();方法)。 然后当找到单词的索引时,它用于调用在另一个Arraylist中具有相同索引的英语单词。 但是,此搜索始终返回false,因为它在搜索问号而不是阿拉伯语和中文字符时失败。 所以我的System.out.println打印显示空值,每个转换失败一个。 *我正在使用Netbeans 6.8 Mac版IDE […]

包含阿拉伯语和西方字符的字符串连接

我正在尝试连接几个包含阿拉伯语和西方字符的字符串(混合在同一个字符串中)。 问题是结果是一个字符串,它很可能在语义上正确,但与我想要获得的字符串不同,因为Unicode双向算法改变了字符的顺序。 基本上,我只是想连接好像它们都是LTR一样,忽略了一些事实是RTL,这是一种“不可知”的连接。 我不确定我的解释是否清楚,但我认为我不能做得更好。 希望可以有人帮帮我。 亲切的问候, 卡洛斯费雷拉 顺便说一句,字符串是从数据库中获得的。 编辑 前2个字符串是我要连接的字符串,第三个是结果。 编辑2 实际上,连接的字符串与图像中的字符串略有不同,它在复制+粘贴期间被改变,1在第一个A之后而不是在第二个A之前。