10年 + 大数据领域深耕经验,横跨互联网、制造业、企业服务三大行业,具备从 0 到 1 搭建企业级数据仓库的全流程把控能力。精通 Hive、Hadoop 生态体系,熟练进行 ETL 开发与数据处理,深入理解 Doris 等 MPP 引擎的查询优化逻辑。擅长数仓分层架构设计(ODS/DWD/DWS/DM),主导过多个核心业务的模型重构,熟练运用星型 / 雪花模型适配不同业务场景。在数据治理领域经验丰富,搭建过元数据管理体系、数据质量稽核规则与数据标准规范,实现数据资产化管理。具备跨部门协同能力,能快速拆解业务需求并转化为技术方案,通过技术优化提升数据处理效率、降低存储成本,为业务决策提供精准数据支撑。
主导搭建覆盖招聘、房产、本地生活等业务的全域数据中台,设计 ODS/DWD/DWS/DM 四层架构,基于 Hive 构建统一数据模型,通过 Python 开发自动化 ETL 脚本,实现日均 10TB + 数据的高效同步与处理。搭建元数据管理平台,梳理 2000 + 核心数据资产,制定数据质量稽核规则 150+,数据准确率提升至 99.9%。引入 Doris 优化报表查询性能,核心指标查询 latency 从分钟级降至秒级,支撑 100 + 业务团队的数据分析需求,每年为公司节省存储与人力成本超 300 万元。
可兼职时间
可兼职地点
0条评论 雇主评价