随着数字经济高速发展,大数据工程师岗位需求年增长率达47%。本课程紧跟行业趋势,采用模块化教学体系,重点培养数据处理、分布式计算等核心能力。
课程包含金融风控系统、智慧交通平台等六大行业项目,使用真实业务数据进行开发演练
配备32节点Hadoop集群,支持同时进行数据采集、清洗、分析全流程实操
技术阶段 | 能力目标 |
---|---|
分布式计算基础 | 掌握MapReduce编程模型,熟练使用YARN进行资源调度 |
实时计算框架 | 实现基于Flink的实时风控系统,完成毫秒级数据处理 |
从HDFS分布式存储到Hive数据仓库构建,重点讲解数据分区、分桶优化策略,配套电信用户行为分析实战项目。
使用Spark MLlib实现用户画像建模,涵盖特征工程、模型调优全流程,完成电商推荐系统开发。