我们开源啦!一键部署免费使用!Kubernetes上直接运行大数据平台!

导语：市场上首个 K8s 上的大数据平台，开源了！

智领云自主研发的首个完全基于Kubernetes的容器化大数据平台

Kubernetes Data Platform (简称KDP)

开源啦！

开发者只要准备好命令行工具，一键部署

Hadoop，Hive，Spark，Kafka, Flink, MinIO ...

就可以创建以前要花几十万甚至几百万才可以买到的大数据平台

无需再花大量的时间和经费去做重复的研发

高度集成，单机即可体验大数据平台

在高级安装模式下

用户可在现有的K8s集群上集成运行大数据组件

不用额外单独建设大数据集群

项目地址：

https://github.com/linktimecloud/kubernetes-data-platform

辛辛苦苦研究出来的成果，为什么要开源？

这波格局开大，老板有话说

问题1：我们为什么要开源？

我们的产品一直是基于大数据开源生态体系建设的。之前就一直有开源回馈社区的计划，但是因为之前Kubernetes对于大数据组件的支持还不够成熟，我们也一直在迭代与Kubernetes的适配。现在我们的企业版已经在很多头部客户落地并且在生产环境下高效运行，觉得这个版本已经可以达到大部分生产级项目的需求，集成度以及可用性是能够帮到有类似需求的用户的，希望这次开源能够降低在Kubernetes上集成大数据组件的门槛，让更多Kuberenetes和big data社区的同行们可以使用。

问题2：开源版本的KDP，能干啥？

KDP可以很方便的在Kubenetes上安装和管理常用的大数据组件，Hadoop，Hive，Spark，Kafka, Flink, MinIO 等等，不需要自己一个一个去适配，可以直接开始使用。然后KDP也提供集成的运维管理界面，用户可以从界面管理所有组件的安装配置，运行状况，资源使用情况，修改配置。而且KDP会将一个大数据组件的所有负载（容器，pod）作为一个整体管理，用户不需要在Kubernetes的控制平面上去管理单独的负载。

问题3：最大的亮点是？

只要你已经在使用Kubernetes，那么在现有集群上十几分钟就可以启动一个完整的大数据集群，马上开始使用，极大的降低了大数据平台的使用门槛。因为我们这个流程是高度集成的，整个安装过程在一个单机环境下也都能启动（例如使用单机kind虚拟集群都可以），所以在测试和实验环境下都可以高效使用。当然，启动之后Day 2的很多好处，例如资源的高效利用和集成的运维管理，也是KDP提供的重要功能。

KDP，即在Kubernetes上使用原生的分布式功能搭建及管理大数据平台。

将多套大数据组件集成在Kubernetes之上，同时提供一个整体的管理及运维工具体系，形成一个完全基于Kubernetes的大数据平台。企业级KDP更是支持在同一个Kubernetes集群中同时运行多个大数据平台以及多租户管理的能力，充分发挥Kubernetes云原生体系的优势。