1. 国内top10高校毕业,多年爬虫从业经验
2. 具备从单机爬虫到大规模集群爬虫的设计架构经验
3. 多年反爬虫经验
4. 熟悉scrapy等开源爬虫项目,提交过源码
5. 掌握python、java等开发语言、良好的代码风格
爬虫经验非常丰富,所需要的数据基本都能自由抓取:
1、现有的各大电商网站的商品信息,商家信息抓取,包括但不限于淘宝、京东、唯品会等
2、各大知识平台的知识数据抓取
3、各类影视信息抓取,包括但不限于优酷、爱奇艺、b站、华数、乐视、芒果、豆瓣等......
4、各类小说数据抓取,包括但不限于起点中文网、各类小说app等
5、各类知识问答等内容抓取
6、不限于以上几类,视抓取难度各有不同