实现网

根据提供的目标内容在搜索引擎上进行搜索结果爬取 远程兼职

一般月薪10000元
项目类型:数据挖掘/爬虫
每月工作: 10天
工作方式:远程
爬虫
数据挖掘
搜索
图片搜索
python

职位详情

需求概述:根据提供的目标内容在搜索引擎(搜索API)上进行搜索结果爬取,提供爬取结果的链接及排名接口。

爬取内容:
1、文章:包含标题、内容、作者
2、图片:包含图片源文件

搜索引擎:百度/搜狗/google/必应/新浪微博

主要功能:
1、接收爬取任务,支持立即和定期爬取两种爬取方式
2、将定期爬取的结果进行存储,新增或有调整的内容进行标记
针对图片:输出爬取的图片URL、引用页面URL、访问量(如有)、标注作者(如有)、页面所属单位或公司(如有)
针对文章:输出爬取的页面URL、访问量(如有)、标注作者(如有)、域名、页面所属单位或公司(如有)

接口方式:
任务输入:提供爬取任务列表、含目标种类、内容、爬取方式、爬取周期
结果输出:RESTful API,结果列表、日期

因需求实现效果与算法和方式有比较紧密的关系,预算可以进一步交流

已有10人投递
Small 0456c2b925063c4d88a9689db06ae715
Small 24bcca2f92a5d6086b24a6ada0e75245
Small 945a20b76ce6b891d8dad2107c5a13ab
Small 327265c27ce87bc668610823cea78053
Small 6bc067eb6cbfb6829476b6df1fdff904
Small 21a781f352f0c0e5d90342a7735a9545
Small 070d2379133c0ffcb67b273e3838b4b2
Small 1c4b4ecb498cf6250632bf6679aa08be
Small 11cd633f80fbe75b3fe91e61ce4b3438
Small bd46a6d1c9e66f824a0e0cc60a554a08
58b740882a6d8e2d1e049dc9d2ce340c
昵称登录后显示 6 年多前
公司地址 天津 南开区卫津路92号
团队人数未填写
融资情况未透露
产品介绍

暂无介绍

团队介绍

暂无介绍