Tag: 解析

Java SimpleDateFormat解析Timezone,如America / Los_Angeles

我想在Java中解析以下字符串并将其转换为日期: DTSTART;TZID=America/Los_Angeles:20140423T120000 我试过这个: SimpleDateFormat sdf = new SimpleDateFormat(“‘DTSTART;TZID=’Z’:’yyyyMMdd’T’hhmmss”); Date start = sdf.parse(“DTSTART;TZID=America/Los_Angeles:20140423T120000”); 和这个: SimpleDateFormat sdf = new SimpleDateFormat(“‘DTSTART;TZID=’z’:’yyyyMMdd’T’hhmmss”); Date start = sdf.parse(“DTSTART;TZID=America/Los_Angeles:20140423T120000”); 但它仍然无效。 我认为问题出在America / Los_Angeles。 你能帮我吗? 谢谢

ANTLR4 Parser,未创建访问者

我是ANTLR的新手,并尝试在ANTLR4中编写语法,而不需要事先刷过以前的版本。 我正在阅读“ The Definitive ANTLR 4 Reference ”一书。 我使用Eclipse并安装了ANTLR4 IDE,如下所示。 我在Expr.g4中写了以下语法: grammar Expr; import Common; options{ language = Java; } prog: stat+; stat: expr NEWLINE | ID ‘=’ expr NEWLINE | NEWLINE; expr: expr (‘/’|’*’) expr | expr (‘+’|’-‘) expr | INT | ID | ‘(‘expr’)’; Common.g4包含以下内容: lexer grammar Common; ID: [A-Za-z]+; INT: [0-9]+; NEWLINE: […]

Java / Groovy中的电子表格解析器

嗨,我想在Groovy中解析电子表格(xls / ods)。 我一直在使用Ruby的Roo库,并且希望在Groovy中尝试相同的任务,因为Java已经安装在我使用的开发服务器上,我想将服务器上的技术数量保持在一个简单的核心。 我知道ods格式是压缩XML,因此可以解析,但我想使用电子表格概念处理文件,而不是XML概念。 处理xls文件的能力并不重要,但可以节省我将多个xls文件保存到ods(因为这是用于解析来自客户端的数据)。 谢谢

如何使用Google Json Parsing API(Gson)解析json中的一些动态字段?

我有一个结构化的Json在某些领域是可变的,我如何使用Gson google json api在Java中正确解析(反序列化)? Json的例子: { type: ‘sometype’, fields: { ‘dynamic-field-1’:[{value: ”, type: ”},…], ‘dynamic-field-2’:[{value: ”, type: ”},…], … } 动态字段将根据发送的结构更改其名称。 有办法吗?

哪个html DOM解析器库最适合Java?

我正在研究爬虫,它将在电子商店中搜索商品。 这是我的论文,所以没什么商业化的.. 我使用Java SE。 我需要某种高级库,对诊断进行一些测试(如果该网页是我正在寻找的),并从正确的数据中提取相关数据。 你有解析器库的个人经验来推荐我最好的吗?

我需要解析非格式良好的xml数据(HTML)

我在JAVA中有一些格式不正确的xml(HTML)数据,我使用了JAXP Dom,但它抱怨道。 问题是:有没有办法使用JAXP来解析这些文件? 我有一个包含以下数据的文件:

从csv生成树结构

我已经暂时解决了这个问题一段时间了。 我基本上试图从一组CSV数据生成树层次结构。 CSV数据不一定是有序的。 这类似于以下内容: Header: Record1,Record2,Value1,Value2 Row: A,XX,22,33 Row: A,XX,777,888 Row: A,YY,33,11 Row: B,XX,12,0 Row: A,YY,13,23 Row: B,YY,44,98 我试图尽可能灵活地进行分组。 最简单的分组是为Record1和Record2做的,Value1和Value2存储在Record2下,这样我们得到以下输出: Record1 Record2 Value1 Value2 这将是: A XX 22,33 777,888 YY 33,11 13,23 B XX 12,0 YY 44,98 我目前正将我的群组设置存储在列表中 – 我不知道这是否会妨碍我的想法。 此列表包含组的层次结构,例如: Record1 (SchemaGroup) .column = Record1 .columns = null .childGroups = Record2 (SchemaGroup) .column = […]

在哪里使用java.nio.file.Path类的resolve()和relativize()方法?

Path p1 = Paths.get(“/Users/jack/Documents/text1.txt”); Path p2 = Paths.get(“/Users/jack/text2.txt”); Path result1 = p1.resolve(p2); Path result2 = p1.relativize(p2); System.out.println(“result1: “+result1); System.out.println(“result2: “+result2); OUTPUT result1: /Users/jack/text2.txt result2: ../../text2.txt 我无法理解resolve()和relativize()是如何工作的? result1和result2的实际用途是什么?

我如何使用Javamultithreading从多个文件中读取?

我想阅读并解析很多文件。 由于有超过10000个文件需要解析,我想通过使用线程来加快这个过程。 例如,如果我有5个线程,我想让它们同时读取一定数量的文件,这样读取和解析的过程就会更快。 这可能吗? 通过将其分成线程,我可以获得任何显着的加速吗? 如果是这样,我该怎么做? PS我不反对使用外部库。 我正在使用jdk 1.6

XStream:在我解析时折叠XML层次结构

我有一个XML文档(由Adobe XFA表单生成),其中包含如下数据: 由于此文件是在其他地方定义的,因此我无权更改我获得的XML格式。 在我的Java代码中,我创建了一个包含Title,Start和End Dates的Position类。 我的问题是,当我使用XStream来解析文件时,它需要一个PositionBorder类来保存标题和日期。 我想基本上忽略边框并将所有字段放入Position类。 我真正想做的是使用像convertAnother方法这样的东西来转换position元素的子元素。 我试图这样做但它失败了,因为我的PositionConverter被调用了PositionBorder(当我调用convertAnother时)。 任何人都有任何线索在解析时如何处理折叠XML的结构?