Tag: cassandra 2.0

为什么Apache Spark在客户端上执行filter

作为新手上的apache引发了一些关于在Spark上获取Cassandra数据的问题。 List dates = Arrays.asList(“2015-01-21″,”2015-01-22”); CassandraJavaRDD aRDD = CassandraJavaUtil.javaFunctions(sc). cassandraTable(“testing”, “cf_text”,CassandraJavaUtil.mapRowTo(A.class, colMap)). where(“Id=? and date IN ?”,”Open”,dates); 此查询不过滤cassandra服务器上的数据。 虽然这个java语句正在执行它的内存并最终抛出spark java.lang.OutOfMemoryErrorexception。 查询应该过滤掉cassandra服务器而不是客户端上的数据,如https://github.com/datastax/spark-cassandra-connector/blob/master/doc/3_selection.md所述 。 虽然我正在使用cassandra cqlsh上的filter执行查询,但它执行正常但执行查询而没有filter(where子句)正在给出预期的超时。 因此很明显,火花并没有在客户端应用filter。 SparkConf conf = new SparkConf(); conf.setAppName(“Test”); conf.setMaster(“local[8]”); conf.set(“spark.cassandra.connection.host”, “192.168.1.15”) 为什么在客户端应用filter以及如何改进它以在服务器端应用filter。 我们如何在Windows平台上的cassandra集群上配置spark集群?

Cassandra如何选择节点发送请求?

想象一下,客户端应用程序需要访问Cassandra集群。 在Java api中,我们创建一个集群实例并通过Session发送读或写请求。 如果我们使用读/写一致性ONE,api如何选择实际节点(协调器节点)以转发请求。 这是随机选择吗? 请帮助解决这个问题。

Spark提交失败,包含java.lang.NoSuchMethodError:scala.Predef $。$ conforms()Lscala / Predef $$ less $ colon $ less;

我正在使用spark 1.3.1 prebuild version spark-1.3.1-bin-hadoop2.6.tgz 线程“main”中的exceptionjava.lang.NoSuchMethodError:scala.Predef $。$ conforms()Lscala / Predef $$ less $ colon $ less; org.apache.spark.util.Utils $ .getSystemProperties(Utils.scala:1418)org.apache.spark.SparkConf。(SparkConf.scala:58)org.apache.spark.SparkConf。(SparkConf.scala: 52)在com.zoho.zbi.Testing.test(Testing.java:43)com.zoho.zbi.Testing.main(Testing.java:39)使用Spark的默认log4j配置文件:org / apache / spark / log4j- defaults.properties 我正在尝试一个简单的演示应用程序来保存到cassandra SparkConf batchConf= new SparkConf() .setSparkHome(sparkHome) .setJars(jars) .setAppName(ZohoBIConstants.getAppName(“cassandra”))//NO I18N .setMaster(master).set(“spark.cassandra.connection.host”, “localhost”); JavaSparkContext sc = new JavaSparkContext(batchConf); // here we are going to save some data to Cassandra… List […]