Tag: debian

Hadoop map-reduce操作在写入输出时失败

我终于能够在Hadoop上启动map-reduce工作(在单个debian机器上运行)。 但是,map reduce作业总是失败,并出现以下错误: hadoopmachine@debian:~$ ./hadoop-1.0.1/bin/hadoop jar hadooptest/main.jar nl.mydomain.hadoop.debian.test.Main /user/hadoopmachine/input /user/hadoopmachine/output Warning: $HADOOP_HOME is deprecated. 12/04/03 07:29:35 WARN mapred.JobClient: Use GenericOptionsParser for parsing the arguments. Applications should implement Tool for the same. ****hdfs://localhost:9000/user/hadoopmachine/input 12/04/03 07:29:35 INFO input.FileInputFormat: Total input paths to process : 1 12/04/03 07:29:35 INFO mapred.JobClient: Running job: job_201204030722_0002 12/04/03 07:29:36 INFO mapred.JobClient: map […]

如何查找所有基于图像的PDF?

我的系统中有很多PDF文档,有时我注意到文档是基于图像的,没有编辑function。 在这种情况下,我在Foxit PhantomPDF中进行OCR以便更好地搜索,您可以在多个文件中进行OCR。 我想找到我的所有基于图像的PDF文档。 我不明白PDF阅读器如何识别文档的OCR不是文本的。 必须有一些这些读者可以访问的字段。 这也可以在终端访问。 这个答案提供了如何在线程中执行此操作的开放式建议。 检查PDF文件是否为扫描文件 : 您最好的选择可能是检查它是否有文本,还可以查看它是否包含大页面图像或覆盖页面的大量平铺图像。 如果您还检查元数据,则应涵盖大多数选项。 我想更好地理解你如何有效地做到这一点,因为如果存在一些元数据,那么它将很容易。 但是,我还没有找到这样的元素。 我认为最可能的方法是查看页面是否包含具有搜索OCR的页面化图像,因为它已经有效并且已经在一些PDF阅读器中使用。 但是,我不知道该怎么做。 边缘检测和休变换的答案 在Hugh变换中,在参数空间的超平方中有特定选择的参数。 它的复杂性$ O(A ^ {m-2})$其中m是你看到的参数数量超过那些参数的问题很难。 A是图像空间的大小。 福昕阅读器在其实现中使用最可能的3个参数。 边缘易于检测,可以确保效率,必须在Hugh变换之前完成。 简单地忽略了损坏的页面。 其他两个参数仍然未知,但我认为它们必须是节点和一些交叉点。 如何计算这些交叉点是未知的? 确切问题的表述是未知的。 测试Deajan的答案 该命令适用于Debian 8.5,但我无法在Ubuntu 16.04中最初使用它 masi@masi:~$ find ./ -name “*.pdf” -print0 | xargs -0 -I {} bash -c ‘export file=”{}”; if [ $(pdffonts “$file” 2> /dev/null | […]

如何在Debian服务器上连续自动运行.jar?

我有一个.jar文件,我想在Debian服务器上一直运行。 目前我已经想出了如何通过Cygwin上的ssh访问服务器并启动.jar 。 但是当我在我的开发机器上关闭Cygwin窗口时,它会杀死服务器上的进程(我认为,因为它不再响应)。 目前我这样开始: java -jar myjar.jar packageName.fileNameOfFileWithMainMethod 我需要让这个文件在服务器上自动运行(它是我正在开发的系统中不可或缺的一部分)。 不幸的是,我对服务器管理或非Windows操作系统一无所知(不是我选择或制造服务器的人),所以我真的不知道该做什么,也不知道要搜索什么(显然,因为我的搜索没有给出有用的结果)。 我已经阅读(并且因为文字很乱而编辑) 这个问题,但是虽然我觉得它可能正在向正确的方向暗示,但我并没有得到很多帮助。 我也尝试了我最好的googlefu,但它让我得到了很多与切向相关的结果。 我想我将不得不制作某种脚本(可能包含上面的代码行),对它做一些事情并把它放在服务器上特定的地方以完成我想做的事情。 有人会如此善意地解释这是如何完成的吗?

Hibernate在EntityTuplizerFactory.constructTuplizer中失败并出现NullPointerException? 为什么?

当我尝试实例化Hibernate并连接MySQL数据库时,我遇到了问题(请参阅下面的错误消息)。 奇怪的是,在运行Junit测试时,使用完全相同的hibernate.cfg.xml文件可以很好地连接,但是当从Tomcat运行时它拒绝工作… 我开始没有想法了。 任何线索或提示在哪里看? 引起:org.hibernate.HibernateException:无法在org.hibernate.tuple的org.hibernate.tuple.entity.EntityTuplizerFactory.constructTuplizer(EntityTuplizerFactory.java:110)中实例化默认tuplizer [org.hibernate.tuple.entity.DynamicMapEntityTuplizer]位于org.hibernate.tuple.entity.EntityEntityModeToTuplizerMapping。(EntityEntityModeToTuplizerMapping.java:69)的.entity.EntityTuplizerFactory.constructDefaultTuplizer(EntityTuplizerFactory.java:135)位于org.hibernate.tuple.entity.EntityMetamodel。(EntityMetamodel.java:323)at at org.hibernate.persister.entity.AbstractEntityPersister。(AbstractEntityPersister.java:456)org.hibernate.persister.ntister.Teartister.Persister.PeristerFactory.javister(PersisterFactory.java)中的org.hibernate.persister.entity.SingleTableEntityPersister。(SingleTableEntityPersister.java:131) 84)atg.hibernate.impl.SessionFactoryImpl。(SessionFactoryImpl.java:267)atg.hibernate.cfg.Configuration.buildSessionFactory(Configuration.java:1341)at se.fmt.atlantism.util.HibernateUt il.buildSessionFactory(HibernateUtil.java:16)… 38更多引起:org.hibernate.tuple.entity.EntityTuplizerFactory.constructTuplizer(EntityTuplizerFactory.java:107)的java.lang.NullPointerException … 47更多

在端口80上尝试https时,tomcat8处于100%cpu

当尝试连接到tomcat 8使用https:// localhost:8080 / tomcat卡在100%cpu与ip – – [12/Jan/2017:12:14:23 +0100] “-” 400 – -在access_log和 Jan 12, 2017 1:23:50 PM org.apache.coyote.http11.AbstractHttp11Processor process INFO: Error parsing HTTP request header Note: further occurrences of HTTP header parsing errors will be logged at DEBUG level. 在catalina.out 在firefox上我得到了 SSL_ERROR_RX_RECORD_TOO_LONG 我尝试使用默认配置tomcat8(debian 8上的全新安装),同样的事情正在发生。 我知道我不应该尝试在端口8080或80上使用https,但是我在服务器上收到了这些请求,我必须重启tomcat才能修复100%的cpu利用率