Tag: acrobat

如何自动将pdf表单字段导出到xml

我有一个包含表单字段的pdf文件,需要将数据导出到一个自动的xml文件中。 这是我为测试创建的示例表单的屏幕: 注意:通过单击Tools > Form > Export Form Data ,最后使用Acrobat Professional 手动导出它,最后选择xml扩展名进行文件输出。 这是我手动导出时得到的结果: John Doe 但是,我需要自动化它,例如使用python脚本 , Java实现或一些命令行工具 。 我可以使用哪些库或工具将表单字段数据导出到xml ? 该工具或库应该是开源的 ,我可以将它集成到我的工作流程中。 我已经尝试过python pdfminer库,它帮助我导出pdf文件的静态部分(如Static form header , First name:和Last name: pdfminer :但是如何导出表单字段数据(在我的例子中是表单字段的内容) first_name和last_name )?? 编辑:随意下载sample.pdf文件。