1,大数据架构设计:擅长精通storm,spark,mapreduce,hive,hbase,kafka,qbus,等Hadoop生态
2,搜索架构,推荐服务,文本分类,语音识别,spam 识别 ,eslarsearch日志监控
3,大型分布式爬虫全网抓取,直接对接360,百度,阿里巴巴,今日头条的大型数据量级,千万级别及其亿万级别结构化抽取解析解决方案,日产出量级至少2亿条以上适合BAT及其国内前十的大型公司结构化抽取架构,具体爬取与抓取可谈
360 集团 搜索事业线
1,可以针对全网分布式实现实时抓取,日产出30亿,日调度10-20亿,
2,提供大型数据量级结构化数据抽取与解决方案,可以实现数据标注平台抽取与大数据抽取
3,可实现索引建库,反作弊站点识别
4,推荐系统,文本分类,es 集群等
可兼职时间
可兼职地点
0条评论 雇主评价