实现网
平头哥-1a5e74cd

昵称登录后显示

600/8小时
3年工作经验

中移(杭州)信息技术有限公司
python工程师

python爬虫,spark大数据,
数据分析、AI人工智能

0

被预约次数

0

被收藏次数

0

被评价次数

擅长技能

1、 善于思考,会不断的研究业务的痛点,主动从业务中寻找机器学习,深度学习的切入场景模式,以提高业务的效率;
2、善于主动学习,管理过若干小项目,具有一定的发散思维,并能够主动去落地自己的想法;
3、有一定的NLP经验,并落地过NLP模型,效果良好;
4、、 熟练掌握机器学习技术,如决策树、Logistic Regression、XGboost、GBDT。熟悉机器学习的workflow。使用PMML,做过线上模型部署,使用jpmml、jpmml-sparkml进行过大型机器学习项目的上线。有落地模型经验;
5、了解使用一些常用的深度学习模型,NNLM模型如word2vec;
6、熟练使用大数据计算平台组件应用spark,spark-sql上,sparkmllib,hive,hive的实际项目经验,有mysql数据库的实战经验,做过基于hive,spark的大型项目;
7、掌握一些基本的网页解析,如bs4,lxml,requests,jsoup;
8、熟练使用python,会进行python的工程开发;使用numpy,pandas,matplotlib,sklearn;
9、熟练使用脚本语言shell,熟悉linux 基本操作,熟悉基本的工程管理命令crontab、nohup;熟练使用awk、sed等文本处理命令;
10、具备IntelliJ IDEA, Pycharm上的经验;
11、证书资质:1、国家计算机三级 –数据库工程师,2、英语六级

项目经验

1、网页防篡改项目
项目简介:
项目内容是监控各大网站是否有网页内容的篡改,或者是否被入侵添加反动、暴力、辱骂等的不良内容。
职责:
基于NLP技术,负责项目中网页内容的审核,监控网页多达上千个,模型吞吐200tps;
项目工具:
sparkml、jieba分词工具、opencc繁间转换工具、jpmml模型上线工具

2、业务风控项目
项目简介:
负责互联网公司,掌厅等业务风控体系的建立,涉及用户量高达2亿,业务上百个,支撑各大业务的安全,并参与研发风控产品。
职责:
1、 主导构建风控模型平台、风控情报库的设计;
2、 参与数据业务接入文档的规范设计、策略的设计与数据验证;
3、 参与上亿数据的研究分析,数据价值挖掘;
4、 参与业务事件的分析报告与事后追踪;
5、 参与设计模型,提高风控的识别能力;
6、 构建用户画像、业务模型,用户标签;
项目工具:
spark、hive、Python、pandas、shell等

3、反欺诈网页项目
项目简介:Scikit-learn+Mysql+Xgboost+Jieba+Tfidf
福建提供dns解析数据,需求是开发反欺诈网页识别系统,负责产品的需求解读,对接福建数据,福建提供gn_http,lte_http数据,基于相似度算法,分词,爬虫,中文特征提取,xgboost模型等技术,实现欺诈网页的有效识别。
职责:
1、jieba分词应用,优化
2、开发文本提取算法,使用到了tf-idf
3、完成爬虫的工作
4、构建机器学习模型
5、写项目技术文档
6、写专利

0条评论 雇主评价

暂无评论~

可兼职时间

周六全天
周日全天
周六半天
周日半天

可兼职地点

江干
九堡镇

被预约

0

被收藏

0

被评价

0

立即预约

可兼职时间

周六全天
周日全天
周六半天
周日半天

可兼职地点

江干
九堡镇

已通过身份认证