实现网
ChuanShuo

昵称登录后显示

800/8小时
5年工作经验

360
软件开发工程师

Hadoop
Spark
Python
ETL
机器学习

0

被预约次数

2

被收藏次数

0

被评价次数

擅长技能

毕业于武汉大学计算机专业,现就职奇虎360,担任大数据软件开发工程师,主要从事ETL/WareHouse、Datamining、ML相关开发工作。曾支援其他团队,获得最佳合作奖;参加专利项目,并获得公司专利评审一等奖兼最佳人气奖。
早期有2年从事C++ Chromium开发,有着扎实的开发基础;现从事Linux服务端大数据及平台相关开发,主要使用Python,Hadoop,Spark,Php,Java等;WareHouse每天落地5TB+原始日志,经过清洗、合并、分离、转换等自动化流程,输出给其他部门和同事使用;360的基因是安全,我们同时也需要做一些安全方面的研究,目前研究的方向是安全方面的机器学习,如URL安全,样本安全等;
数据不应该只是安全、金融、购物、出行等割裂的片断,还有更多的维度和深度要去挖掘;希望在大数据方向开阔视野,也希望能和其他高手、大牛分享经验。

项目经验

一、poseidon项目
poseidon项目是百万亿级日志搜索项目,主要使用了搜索引擎技术,对日志不同字段分词,建倒排索引,日志存放于HDFS,meta存储在NoSqlDB中,提供UI查询及REST接口;在项目中主要负责日志管理,索引构建及存储;目前维护有10+业务,每天2TB+日志;
开源版本:
https://github.com/Qihoo360/poseidon

二、开机小助手新闻天气接口
卫士的开机小助手在电脑开机后会提示本地天气和新闻,本接口用于获取本地区或给定地区的新闻数据接口和天气代码;接口用golang实现,nginx后端30+节点;

三、北京时间热点新闻
《北京时间》是和中央电视台合作的视频新闻网站,除传统门户新闻外,还有当前的热点新闻;热点新闻挖掘采用三个时间维度,15分钟、1小时、1天,主要使用url数据、搜索数据、weibo数据,经过归一、聚合、回归,站点差异推荐算法,将数据推送给对方接口;

四、apt样本预测
主要两个方向:URL安全,样本安全;
URL安全,当下的安全已经不单是单机,离线的安全,而是要更多的考虑网络安全;不同的恶意软件,木马,后门都会采用http协议做数据传输,URL安全是一种通用的安全检测和识别方案,目前基于URL分析和用户访问行为做的机器学习已经可以识别非友好的站点及用户;
样本安全,每天有大量新样本的产生,样本安全主要用于对QVM检测后未知样本的识别预判,依赖于样本静态分析和HIPS分析,目前对游戏类恶意软件有着非常高的识别率;

0条评论 雇主评价

暂无评论~

可兼职时间

周六全天
周日全天
工作日下班后
周六半天
周日半天

可兼职地点

朝阳
*

被预约

0

被收藏

2

被评价

0

立即预约

可兼职时间

周六全天
周日全天
工作日下班后
周六半天
周日半天

可兼职地点

朝阳
*