分类: 数据湖

共5项

记几道L2的题目的内容与分析

题目1 场景: 在回答问题之前,请先阅读这个场景。UT运输是英国大型物流公司。战略市场部经理找到首席架构师发起架构工作请求来设计改进的企业数据仓库系统。UT运输希望利用商务活动收集的客户数据并同步到市场部来给出新鲜数据源供分析,这将增加收入…

数据湖系列(2) – Iceberg 核心功能原理剖析

上一篇文章 数据湖系列(1) – Hudi 核心功能原理剖析 中讲解了关于 Hudi 的基本概念和功能原理,Hudi 利用主键索引的方法来实现了 Upsert 的语义。Apache Iceberg 也是一个广为应用的数据湖框架,虽然两个框架的设计初衷和思路不同,但如今随着需求逐步丰富,两者对于使用者来说,却是越来越趋于一致了。

使用 Flink Hudi 构建流式数据湖平台

摘要:本文整理自阿里巴巴技术专家陈玉兆 (玉兆)、阿里巴巴开发工程师刘大龙 (风离) 在 Flink Forward Asia 2021 的分享。主要内容包括:

Apache Hudi 101
Flink Hudi Integration
Flink Hudi Use Case
Apache Hudi Roadmap