数学方面:
具备良好的数学思维,对微积分、高等代数、概率统计、运筹学等学科内容有比较深刻的了解
热衷于探索和推导传统机器学习、运筹、优化、统计/概率等理论和公式
计算机方面:
算法层面:
熟练使用Pytorch框架在cpu&gpu上进行ml&dl算法模型训练、推理和落地部署
熟练使用OptaPlanner、CPLEX、Gurobi等优化引擎进行运筹优化项目的开发和落地
熟悉常见的知识图谱、LLM、搜索推荐、图元挖掘等场景的算法流程设计和部署落地
数据及后端层面:
熟练使用Java、Python、Scala、SQL进行对应业务场景的开发
熟练使用flink/spark/mapreduce等计算框架进行开发,熟悉相关的数据结构、算子、调度、内存管理和异常容错
熟练使用hive/mysql/clickhouse等进行数据存储、清洗、查询、导入导出、链路溯源、指标监控、异常分析等,熟悉数仓分层理论,能快速开发相关数据模型和指标
熟练使用redis、MongoDB、hbase等NoSQL进行业务数据的增删改查,熟悉设计要点和场景选型
熟悉常见中间件kafka、zookeeper、nginx等设计思想和场景选型,并在实际项目中应用
熟练使用Spring、Mybatis、SpringBoot等框架进行后端接口开发与联调,熟悉其大体设计思想,研读过相关源码
对并发、锁、类加载机制、jvm调优和设计模式有一定的经验
业务方面:
热衷于基于业务全景视角去深入理解需求业务背景,偏向于增收创新场景,热衷挖掘底层运行规律和机制
熟悉常见的痛点分析、漏斗转化、数据仿真、根因分析、效果验证、收益测算等流程,有一定产品及项目意识
其他方面:
具备技术方案、数分报告、汇报材料等文档撰写能力以及跨部门沟通协同能力
熟练使用IDE、dbeaver、postman等开发工具,熟练使用MATLAB、Lingo、SPSS等数据科学软件
熟悉k8s、docker、linux、shell等运维操作
熟悉git等版本控制工具的使用
了解c++、c#、vue.js、go基本语法,能快速上手
智能生产及调度
项目需求及背景:
业务s级项目,旨在仓储拣货复核等出库环节用智能化手段改善由传统人工经验以及现场混乱调度带来的成本浪费,同时提升订单时效和客户满意度
项目职责:
分析现有人工经验下的出库环节的痛点所在,并通过数据仿真的方式进行收益空间的预估
根据仓内接受的批量订单明细按照仓库布局以拣货跑动路径最短为目标函数,动态分配成最优的任务单组合,同时让这一批任务单根据拣货员经验不同进行最优指派,进而规划拣货员拣完的拣货小车与多种特定类型的复核台的最优调度以实现产能平衡与时效优先,完成多目标优化模型的开发构建,并以jar包的形式嵌入wms黄流系统
在基于SSM+zookeepr的wms系统内进行工程开发,包括算法入参出参解析和传入、分布式多实例计算、异常容错、性能优化、参数配置等,已上线,且大促运行稳定
基于Flink和数据流Kafka开发智能调度相关报警信息的消息推送和对应的参数配置环节监控的实时报表
定义收益相关北极星指标,基于传统AB、真A假B等实验方式进行算法上线后的指标效果验证,并开发相关数据模型进行根因分析和离线BI展示,当前pv、uv均万级别以上,出库时长提升率10% 以上
项目结果:
算法上线810+ 个京东中小件仓及B仓,获得公司智能化项目特等奖、人资口径下账面成本节省1个多亿,获得"能工巧匠"称号,获得晋升,并以讲师身份在清华大学工业工程系做技术演讲,成功荣获运筹学奖项
同质化风险内容识别
项目需求及背景:
该项目是"微博管理员"官方账号通报的明星项目,旨在专项治理违法、涉政、恶意营销等站内现象,捕捉抓取大批同质内容和用户进行进一步的审核和处置
项目职责:
采用相关Bert和ResNet模型对近一个周2000w文本和5000w图片进行Embedding化,并以一周为周期进行定时调度
采用基于欧式距离、编辑距离、dbscan等相似算法的向量搜索引擎milvus进行相似度搜索,并调节相应的显存配置和量化手段
采用spark用分布式矩阵乘法等方式对相似度搜索进行性能调优,相应的同质化聚类结果回写入clickhouse,运营侧通过已知的风险用户根据阈值查找同质的内容id和用户id进行处置
项目结果:
完成同质化模型的上线验收,获得"优秀个人"称号,在Milvus官方社区以主讲者身份参与技术沙龙
可兼职时间
可兼职地点
0条评论 雇主评价