小白大数据学习笔记 ⭐
| 模块 | Blog |
|---|---|
| Zookeeper概述 | Zookeeper是个什么东西? |
| 安装部署 | Zookeeper 分布式安装部署 |
| 如何操作? | Zookeeper 客户端命令行与API操作 |
| 案例实操 | Zookeeper 案例:服务器动态上下线监听 |
| 模块 | Blog |
|---|---|
| Hive概述 | Hive的基本概念 |
| 安装部署 | Hive安装部署并替换derby为MySQL |
| Hive操作数据 | Hive数据类型 |
| HiveSQL DDL数据定义 | |
| Hive 导入与导出数据 | |
| HiveSQL DML数据查询 | |
| Hive 分区表与分桶表 | |
| Hive 常用函数汇总以及练习 | |
| Hive 如何自定义函数 | |
| Hive 压缩和存储 | |
| 调优 | Hive企业级调优 |
| 实战 | Hive 实战!分析视频网站TopN数据 |
| 模块 | Blog |
|---|---|
| Flume概述 | Flume 是什么?都由什么组成? |
| 安装部署以及入门案例 | Flume 分布式安装部署以及入门案例 |
| 内部原理 | Flume中的事务、Agent内部原理、拓扑结构及对应案例 |
| 自定义组件 | Flume自定义Interceptor、Source与Sink |
| 模块 | Blog |
|---|---|
| Kafka极速入门 | Kafka 是个什么东西? |
| Kafka 分布式安装部署 | |
| Kafka 常用命令行操作 | |
| Kafka Producer | Producer 生产者消息发送原理 |
| Producer 异步与同步以及分区API操作 | |
| Producer 生产者的生产经验 | |
| Kafka Broker | Broker 工作流程以及节点服役和退役 |
| Broker 副本机制详解 | |
| Broker 文件存储、清理机制以及高效读写数据 | |
| Kafka Consumer | Consumer 消费者工作原理 |
| Consumer 消费者API操作 | |
| Consumer 消费者组分区的分配以及再平衡 | |
| Offset位移详解 | |
| 大屏监控Kafka | Kafka Eagle(EFAK)监控安装部署 |
| Kafka-Kraft | Kafka-Kraft 模式的安装与部署 |
| Kafka 与外部系统集成 | Kafka集成Flume |
| Kafka集成Spark,留坑 | |
| Kafka集成Flink,留坑 | |
| Kafka集成Spring Boot,留坑 |
| 模块 | Blog |
|---|---|
| 概述 | 关于HBase你应该知道这些! |
| 上手操作HBase | 搭建HBase分布式环境 |
| HBase Shell操作快速入门! | |
| HBase DDL API操作 | |
| HBase DML API操作 | |
| 在更! |
| 模块 | Blog |
|---|---|
| 用户行为数据采集平台 | 项目需求及架构设计 |
| 模拟生成用户行为日志数据 | |
| 打通行为日志采集通道! | |
| 业务数据采集平台 | 模拟生成用户业务数据 |
| 全量同步?增量同步?都是什么? | |
| 数据全量同步工具DataX | |
| 数据增量同步工具Maxwell | |
| 打通全量数据同步通道! |






