Python微博爬虫 远程全职
一般月薪24000元- 项目类型:不用选择
- 每月工作: 20天
- 工作方式:全程坐班
职位详情
需求描述:
利用Python爬取微博的数据,实时存入现有的大数据平台,微博爬取时效性在3分钟内。
功能需求:
1、 爬取微博账号的基本信息(最好能爬取重要关注账号的隐私信息,比如手机号码),认证与非认证,微博等级;
2、 爬取微博账号的社交关系网络(比如关注、粉丝、特别关注、好友圈等);
3、 爬取大V或重点关注账号的天然分类和粉丝的关注分类;
4、 爬取微博的内容,转载数,评论数,点赞数,热门评论内容,发布时间,微博链接,并做初步的情感倾向分类;
5、 爬取微博及热门话题的参与账号,最终微博传播路径,保证能够回溯;
6、 爬取最新热门微博信息;
需要提供爬虫源代码及说明文档
需要提供代理IP解决方案
需要提供爬虫系统部署文档,或者提供部署服务与支持
需要保证爬虫持续稳定