昵称登录后显示

1000/8小时

6年工作经验

猎户星空

大数据工程师

被预约次数

被收藏次数

被评价次数

擅长技能

大数据处理技能：
1、精通 SparkCore，SparkSql ，SparkStreaming 以及Spark项目开发部署，精通常用算子，熟读Spark核心源码，如
Spark 任务调度和资源调度， Scala开发Spark项目。
2、熟练掌握Spark 调优，如数据倾斜，Shuffle 调优等。
3、熟练使用大数据集成工具CDH和Ambari平台，其中CDH平台有大规模集群搭建和平台维护经验。对集群与数据迁移有实
际操作经验。
4、熟悉数据仓库分层架构，熟练掌握HiveSql，能使用Hive进行清洗预处理和进行海量数据统计分析，构建数仓，能对Hive
进行优化，如Hive join。
5、熟悉 Flume和Kafka ，能够使用它们实现不同业务下的日志收集，并有相关配置调优及flume 二次开发经验。
6、掌握常用Linux 命令，熟练编写Shell脚本，了解Python脚本。
7、了解 Flink，能使用API开发简单 Flink+Kafka 实时流处理框架。
8、熟练使用调度工具 Azkaban,oozie,dolphinscheduler 等，熟练使用Sqoop，datax等，对datax有二次开发经验。
9、了解 Yarn ，能对Yarn资源队列进行合理配置和使用。
10、熟练使用kylin OLAP分析工具，了解models，cube建模。
Java 开发技能：
1、熟练使用 Java语言开发，具备良好的面对象编程思想，了解常用数据结构。
2、熟练使用常见开源框架，如 Mybatis ，SpringBoot 。
3、熟练掌握MySQL数据库，能进行数据库的设计、开发及其优化。

项目经验

猎户大数据平台开发
项目描述：
猎户大数据平台承载数据采集，数据清洗，数据转换，数据落地任务，目的是为AI数据高效应用，数据价值挖掘，精准化业务推荐、
业务现状分析提供稳定可靠的支持。
2020-10 ~ 2021-05 猎户数仓建设（实时/离线数据仓库）设计，开发
2021-10 ~ 2022-04 电站集中监控平台开发
2022-06 ~ 至今大成数据平台开发
项目架构：CDH+Yarn+Spark+HUE+OOZIE+Hive+dataX+Redash+Hue
项目职责：
1. 集群规划与集群搭建，集群维护，数据任务开发与维护
2. 从数据采集到数据落地：通过埋点协议上报至数据接收器，落地log文件
3. 通过flume自定义拦截器将日志采集并分发到不同的kafka topic中，开发spark实时任务消费kafka写入hive parquet 文件存储 &
kudu 中，实现kudu+impala实时数仓输出
4. 开发hive/kudu每日分区维护，实时小文件合并，数据生命周期（历史数据备份cos/删除) 等任务
5. 大数据平台功能搭建与开发，实现oozie,hue的二次开发，集成数据平台，提供监控、告警、数据任务提交等实现，降低使用成本
6. 对dataX实现二次开发，提供parquet文件存储/hive sql /impala sql读取等插件实现，实现高效的数据同步
7. 参与猎户数仓建设，数仓分层，数据指标等
8. 猎户大数据平台搭建与维护，从无到有，版本迭代

0条评论雇主评价

暂无评论~

可兼职时间

自由职业者，时间充裕

可兼职地点

朝阳

垡头

昵称登录后显示

猎户星空 大数据工程师

擅长技能

项目经验

0条评论 雇主评价

猎户星空

大数据工程师

0条评论雇主评价