“CSDN博客专家”、“Python中文社区专栏作者”
擅长R语言、SAS语言数据处理。
擅长python爬虫研发、分布式多爬虫系统架构设计、优化等。擅长爬虫领域的网站攻破、验证码处理、账号批量注册等各种反防爬手段。目前负责网络安全方向的数据抓取,日抓取量在500~700万个页面之间,个人抓取经验在10亿+个页面。抓取过QQ空间、新浪微博、Facebook、Twitter、Instagram、微信公众号、天猫、唯品会、天眼查、Github、CSDN、博客园、POI数据、资讯数据、域名与IP数据、证券投资数据、中国土地数据、某些政府网站等等。更多请见我的博客,谢谢!
我的CSDN:http://blog.csdn.net/bone_ace
开源过微博爬虫、QQ空间爬虫、天猫爬虫等,目前是Github中相应爬虫中均属最活跃的。
平常也有接各种爬虫外包,收费不高,但是数据质量和爬虫速度都可以调到最优。我自己也买了几台服务器,平常喜欢钻研各种反防爬手段,在公司维护三十几台机,主要负责爬虫系统的设计和优化。能力上尽管放心,另外我建了一个全国全职爬虫工程师的群,目前一百多人,里面各种网站都有人爬过,需要数据的也可以直接购买。
我的Github地址:https://github.com/liuxingming
可兼职时间
可兼职地点
梁晨Allen 2017-06-19 09:27
技术很不错,速度很快,沟通也很高效。