分类: 开源

开源话题向开发者和开源爱好者介绍有趣开源项目、工具、框架和开发项目,以及诸多实践等内容。

用作数据湖的代替Hadoop的开源项目

数据湖通常与面向 Hadoop 的对象存储相关联。在这种情况下,组织的数据首先上传到 Hadoop 平台,然后对驻留在 Hadoop 集群节点上的数据应用数据挖掘和分析工具。 我们发现 Hadoop 的核心是它的存储层HDFS(Hadoop…