从2014年开始写python,处理过一般的数据处理,数据分析任务;使用pyspark构建k均值聚类模型解决DMP场景下的人群分类,寻找高价值人群的任务,获得相当不错roi表现;使用xgboost做pairwise选股模型。规范的代码结构风格与接口设计。用scala写过大规模并行数据处理任务和点击率预测模型。一般规模和大规模的数据库查询技术(mysql和hive);内存键值数据库redis。机器学习算法与数据挖掘技能。
线上广告分配模型 DMP人群聚类分析 协同过滤方法做站外推荐 文本爬虫打标签语义分析 DSP点击率预测 广告数据统计挖掘 数据挖掘产品插件 量化选股策略