Tag: h2o

使用H2OApi Java绑定来检索H2O帧

我使用H2O Java绑定提供的H2O(3.10.4.7)REST Api处理Java项目,我遇到以下问题: 我们需要从现有的H2O框架中检索元数据,例如: 列名称和 这些列的数据类型, 最好使用H2oApi.class。 我们的方法是从H2O框架中获取一行,然后使用它来获取我们需要的元数据。 到目前为止我尝试了以下内容: FramesV3 targetFrame = new FramesV3(); targetFrame.frameId = frameKey; // key provided by import process – works targetFrame.rowCount = 1; // get one row to figure out specs of all cols H2OApi h2oApi = new H2OApi(“http://localhost:54321/”); FramesV3 result = h2oApi.frames(targetFrame); 我得到这个例外: java.lang.IllegalArgumentException: @Field parameters can only be […]

从R调用时,h2o无法连接:Java版本不匹配

h2o之前在我的笔记本电脑上工作,但我暂时没有使用它(并且在此期间安装了新软件包和更新的东西)。 昨天我尝试使用它,但它没有用。 我删除了包装的R h2o ,我从头开始重新安装了h2o install.packages(“h2o”) 我尝试用h2o.init()运行h2o ,但它给了我这个错误 java version “9” Java(TM) SE Runtime Environment (build 9+181) Java HotSpot(TM) 64-Bit Server VM (build 9+181, mixed mode) Starting H2O JVM and connecting: …………………………………………………… [1] “localhost” [1] 54321 [1] TRUE [1] -1 [1] “Failed to connect to localhost port 54321: Connection refused” % Total % Received % […]

R H2O – 内存管理

我试图通过R使用H2O来使用一个大数据集(~10GB)的子集构建多个模型。 数据是一年的数据,我正在尝试建立51个模型(即第1周训练,第2周预测等),每周约有1.5-250万行,有8个变量。 我已经在循环中完成了这个,我知道这并不总是R中最好的方法。我发现的另一个问题是H2O实体会积累先前的对象,所以我创建了一个函数来删除除主数据之外的所有它们组。 h2o.clean <- function(clust = localH2O, verbose = TRUE, vte = c()){ # Find all objects on server keysToKill <- h2o.ls(clust)$Key # Remove items to be excluded, if any keysToKill <- setdiff(keysToKill, vte) # Loop thru and remove items to be removed for(i in keysToKill){ h2o.rm(object = clust, keys = i) if(verbose == […]

在h2o中加载大于内存大小的数据

我正在尝试加载大于h2o内存大小的数据。 H2o 博客提到: A note on Bigger Data and GC: We do a user-mode swap-to-disk when the Java heap gets too full, ie, you’re using more Big Data than physical DRAM. We won’t die with a GC death-spiral, but we will degrade to out-of-core speeds. We’ll go as fast as the disk will allow. I’ve […]