使用TensorFlow for Java进行内存泄漏

以下测试代码泄漏内存：

private static final float[] X = new float[]{1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0,1,2,3,4,5,6,7,8,9,0}; public void testTensorFlowMemory() { // create a graph and session try (Graph g = new Graph(); Session s = new Session(g)) { // create a placeholder x and a const for the dimension to do a cumulative sum along Output x = g.opBuilder("Placeholder", "x").setAttr("dtype", DataType.FLOAT).build().output(0); Output dims = g.opBuilder("Const", "dims").setAttr("dtype", DataType.INT32).setAttr("value", Tensor.create(0)).build().output(0); Output y = g.opBuilder("Cumsum", "y").addInput(x).addInput(dims).build().output(0); // loop a bunch to test memory usage for (int i=0; i<10000000; i++){ // create a tensor from X Tensor tx = Tensor.create(X); // run the graph and fetch the resulting y tensor Tensor ty = s.runner().feed("x", tx).fetch("y").run().get(0); // close the tensors to release their resources tx.close(); ty.close(); } System.out.println("non-threaded test finished"); } }

有什么明显的东西我做错了吗？基本流程是在该图形上创建图形和会话，创建占位符和常量，以便在以x为单位的张量上执行累积和。运行生成的y操作后，我关闭x和y张量以释放其内存资源。

我相信到目前为止帮助的事情：

这不是Java对象内存问题。根据jvisualvm，堆不会增长，JVM中的其他内存不会增长。根据Java的本机内存跟踪，似乎不是JVM内存泄漏。
近距离操作正在帮助，如果他们不在那里，内存会突飞猛进。随着它们到位，它仍然会变得非常快，但几乎与没有它们一样多。
cumsum运算符并不重要，它也适用于sum和其他运算符
它发生在带有TF 1.1的Mac OS和带有TF 1.1和1.2_rc0的CentOS 7上
评论Tensor ty线可以消除泄漏，因此它似乎就在那里。

有任何想法吗？谢谢！此外，这是一个Github项目，通过线程测试（以更快地增长内存）和无线测试（以显示它不是由于线程）来演示此问题。它使用maven，可以简单地运行：

 mvn test

我相信确实存在泄漏（特别是缺少与JNI代码中的分配相对应的TF_DeleteStatus ）（感谢重现的详细说明）

我建议您在http://github.com/tensorflow/tensorflow/issues上提交一个问题，希望它应该在最终的1.2版本之前修复。

（相关地，由于Tensor.create(0)创建的Tensor对象未被关闭，因此循环外部也有泄漏）

更新：这是固定的，1.2.0-rc1应该不再有这个问题。

使用TensorFlow for Java进行内存泄漏

查找类以递归方式扩展或实现的所有类和接口

Spring安全删除用户 – 会话仍处于活动状态

是否需要FileChannel.force和FileDescriptor.sync？

dom4j SAXReader – 停止解析

Wicket：如何以编程方式呈现页面并将结果作为字符串？

无法为连接URL”创建类”的JDBC驱动程序

RMI何时进行TCP连接？

Google Analytics 3.0身份validation流程

Spring：获取FactoryBean对象而不是FactoryBean.getObject（）

在IoC容器中将依赖项设置为NULL并在运行时提供依赖项是不好的做法？