实现网
浩-74885b9b

昵称登录后显示

1000/8小时
6年工作经验

猎户星空
大数据工程师

1

被预约次数

2

被收藏次数

0

被评价次数

擅长技能

大 数 据 处 理 技 能:
1、 精通 SparkCore,SparkSql ,SparkStreaming 以及Spark项目开发 部署 ,精通常用算子 ,熟读Spark核心源码, 如
Spark 任务调度和资源调度, Scala开发Spark项目 。
2、 熟练掌握Spark 调优 ,如数据倾斜 ,Shuffle 调优等。
3、 熟练使用大数据集成工具CDH和Ambari平台,其中CDH平台有大规模集群搭建和平台维护经验。对集群与数据迁移有实
际操作经验 。
4、 熟悉数据仓库分层架构 ,熟练掌握HiveSql,能使用Hive进行清洗预处理和进行海量数据统计分析, 构建数仓,能对Hive
进行优化,如Hive join。
5、 熟悉 Flume和Kafka ,能够使用它们实现不同业务下的日志收集,并有相关配置调优及flume 二次开发经验。
6、 掌握常用Linux 命令,熟练编写Shell脚本,了解Python脚本 。
7、 了解 Flink,能使用API开发简单 Flink+Kafka 实时流处理框 架。
8、 熟练使用调度工具 Azkaban,oozie,dolphinscheduler 等,熟练使用Sqoop,datax等,对datax有二次开发经验。
9、了解 Yarn ,能对Yarn资源 队列进行合理配置和使用。
10、熟练使用kylin OLAP分析工具,了解models,cube建模。
Java 开 发 技 能 :
1、熟练使用 Java语言开发 ,具备良好的面对象编程思想,了解常用数据结构。
2、熟练使用常见开源框架 ,如 Mybatis ,SpringBoot 。
3、熟练掌握MySQL数据库, 能进行数据库的设计、开发及其优化。

项目经验

猎户大数据平台开发
项目描述:
猎户大数据平台承载数据采集,数据清洗,数据转换,数据落地任务,目的是为AI数据高效应用,数据价值挖掘,精准化业务推荐、
业务现状分析提供稳定可靠的支持。
2020-10 ~ 2021-05 猎户数仓建设(实时/离线数据仓库) 设计,开发
2021-10 ~ 2022-04 电站集中监控平台 开发
2022-06 ~ 至今 大成数据平台 开发
项目架构:CDH+Yarn+Spark+HUE+OOZIE+Hive+dataX+Redash+Hue
项目职责:
1. 集群规划与集群搭建,集群维护,数据任务开发与维护
2. 从数据采集到数据落地:通过埋点协议上报至数据接收器,落地log文件
3. 通过flume自定义拦截器将日志采集并分发到不同的kafka topic中,开发spark实时任务消费kafka写入hive parquet 文件存储 &
kudu 中,实现kudu+impala实时数仓输出
4. 开发hive/kudu每日分区维护,实时小文件合并,数据生命周期(历史数据备份cos/删除) 等任务
5. 大数据平台功能搭建与开发,实现oozie,hue的二次开发,集成数据平台,提供监控、告警、数据任务提交等实现,降低使用成本
6. 对dataX实现二次开发,提供parquet文件存储/hive sql /impala sql读取等插件实现,实现高效的数据同步
7. 参与猎户数仓建设,数仓分层,数据指标等
8. 猎户大数据平台搭建与维护,从无到有,版本迭代

0条评论 雇主评价

暂无评论~

可兼职时间

自由职业者,时间充裕

可兼职地点

朝阳
垡头

被预约

1

被收藏

2

被评价

0

立即预约

可兼职时间

自由职业者,时间充裕

可兼职地点

朝阳
垡头

已通过身份认证