如何为apache drill编写自定义存储插件

我的数据是适当的格式,没有Apache支持的数据。 有没有关于如何编写我自己的存储插件来处理这些数据的教程。

这确实应该在文档中,但目前不是。 界面不是太复杂,但是看一个现有的插件并理解正在发生的一切可能有点多。

编写存储插件有两个主要组件,将信息公开给查询规划器和模式管理系统,然后实际实现从数据源API到钻取记录表示的转换。

最近添加了Kudu插件,这是一个存储系统的合理模型,具有许多可以利用的元素。 我要注意的一件事是,如果您的存储系统没有分发,并且您只是计划进行所有远程读取,则不必在组扫描中对关联性/工作列表/分配进行尽可能多的工作。 如果我有一段时间,我会尝试在界面的不同部分编写一个文档,并可能编写一个关于现有插件的教程。

https://github.com/apache/drill/tree/master/contrib/storage-kudu/src/main/java/org/apache/drill/exec/store/kudu