Tag: datastax enterprise

为什么我的Cassandra准备声明数据采集速度如此之慢?

我有一个包含10万个名字的Java列表,我想将它们摄取到运行带有Cassandra 3.10.0的Datastax Enterprise 5.1的3节点Cassandra集群中 我的代码摄取但需要花费很长时间。 我对集群进行了压力测试,每秒可以进行超过25,000次写入。 使用我的摄取代码,我获得了大约200 /秒的可怕性能。 我的Java列表中有100,000个名称,称为myList。 我使用以下预准备语句和会话执行来提取数据。 PreparedStatement prepared = session.prepare(“insert into names (id, name) values (?, ?)”); int id = 0; for(int i = 0; i < myList.size(); i++) { id += 1; session.execute(prepared.bind(id, myList.get(i))); } 我在代码中添加了一个集群监视器,以查看发生了什么。 这是我的监控代码。 /// Monitoring Status of Cluster final LoadBalancingPolicy loadBalancingPolicy = cluster.getConfiguration().getPolicies().getLoadBalancingPolicy(); ScheduledExecutorService scheduled = […]

如何在不使用Datastax Studio但通过Java创建图形及其模式的情况下?

我试图通过java创建我与DSE Graph的第一个连接.. public static void main(String args[]){ DseCluster dseCluster = null; try { dseCluster = DseCluster.builder() .addContactPoint(“192.168.1.43”) .build(); DseSession dseSession = dseCluster.connect(); GraphTraversalSource g = DseGraph.traversal(dseSession, new GraphOptions().setGraphName(“graph”)); GraphStatement graphStatement = DseGraph.statementFromTraversal(g.addV(“test”)); GraphResultSet grs = dseSession.executeGraph(graphStatement.setGraphName(“graph”)); System.out.println(grs.one().asVertex()); } finally { if (dseCluster != null) dseCluster.close(); } } 起初我得到的“图形”不存在..我必须通过DataStax Studio创建与特定图形的连接,因为它不在那里。 现在我需要在模式中放置标签,属性等。我知道如何在工作室中进行操作( https://docs.datastax.com/en/latest-dse/datastax_enterprise/graph/using/createSchemaStudio.html )但我想在代码中这样做。 如何在Java中访问模式对象,以便我可以进行以下更改: schema.config().option(‘graph.schema_mode’).set(‘Development’) schema.vertexLabel(‘test’).create() […]

无法启动DSE搜索的solr方面

我无法启动DSE搜索的solr方面,当我执行时,我得到以下exception消息,当我执行bin / dse cassandra启动cassandra服务启动但不是solr,是否有人有任何指导提供给我我知道我错过了一些东西: bin / dse cassandra -s 信息: Cannot start node if snitch’s data center (Solr) differs from previous data center (Cassandra). Please fix the snitch configuration, decommission and rebootstrap this node or use the flag -Dcassandra.ignore_dc=true. at org.apache.cassandra.db.SystemKeyspace.checkHealth(SystemKeyspace.java:629) ~[cassandra-all-2.1.12.1046.jar:2.1.12.1046] at org.apache.cassandra.service.CassandraDaemon.setup(CassandraDaemon.java:290) [cassandra-all-2.1.12.1046.jar:2.1.12.1046] at com.datastax.bdp.server.DseDaemon.setup(DseDaemon.java:329) [dse-4.7.7.jar:4.7.7] at org.apache.cassandra.service.CassandraDaemon.activate(CassandraDaemon.java:564) [cassandra-all-2.1.12.1046.jar:2.1.12.1046] at com.datastax.bdp.DseModule.main(DseModule.java:75) [dse-4.7.7.jar:4.7.7]

如何下载dse.jar

我正在尝试使用DataStax Enterprise 4.6在Java中编写Spark应用程序,并在DSE的Spark分析模式下运行它。 使用DSEConfHelper创建Spark上下文的代码: SparkConf conf = DseSparkConfHelper.enrichSparkConf(new SparkConf()) .setAppName( “My application”); 要使用DSEConfHelper我们需要导入位于dse.jar中的dse.jar 。 在我的pom.xml我包含了依赖项: com.datastax bdp 4.6.0 但是Maven无法下载dse.jar 。 请帮帮我。 用于创建Spark上下文的代码的参考来自: http : //www.datastax.com/documentation/datastax_enterprise/4.6/datastax_enterprise/spark/sparkJavaApi.html

如何从gremlin返回子图,它是一种易于使用的Java格式

当我尝试进行单次遍历并使用Gremlin立即从DSE Graph 5.0中获取大量内容时,我对非常简单的事情感到非常沮丧。 在我的简化案例中,我有: 1个具有特定uuid的实体 实体可以为零(参见可选)或更多类型 我需要能够返回entity和types 到目前为止,我的工作非常难看:( List list = gV().hasLabel(“Entity”).has(“uuid”,”6708ec6d-4518-4159-9005-9e9d642f157e”).as(“entity”) .optional(outE(“IsOfType”).as(“types”)) .select(“entity”, “types”).toList(); List typeEdges = new ArrayList(); Vertex entityV = null; for (Object obj : list) { entityV = ((Vertex)((LinkedHashMap) obj).get(“entity”)); Edge typeEdge = ((Edge)((LinkedHashMap) obj).get(“types”)); typeEdges.add(typeEdge); } 列表中的每一行都有实体和其中一种类型:/ 我正在做这一切,因为Vertex没有基于DSE 5.0 Fluent API中的遍历填充edges() 。 所以要么我被困在多个遍历或一个巨大的可怕遍历,这在Java对象中非常难以反序列化,或者我必须将gremlin查询作为String传递但不会返回Gremlin Vertex对象而是DSE而是:( 在我不那么简化的情况下,我想要返回上面的多个实体及其各自的类型,如何做到这一点? 最后,什么是一个好的方法,将导致可重用的代码自定义对象映射具有不同类型的对象的子图? 提前谢谢你的帮助!