实现网

资讯类网站内容采集 远程兼职

一般月薪3000元
项目类型:数据挖掘/爬虫
每月工作: 5天
工作方式:远程
Python
PHP
采集程序
爬虫
Java

职位详情

资讯类、社交媒体网站内容采集程序开发。
一、项目需求:
(1)采集内容:文章标题、正文、作者、发布时间、文章来源(如果有)、正文中的图片、音频、视频媒体资源等。
(2)支持采集内容自动去重。
(3)支持将采集的文章相关内容保存到MySQL数据库。
(4)支持将采集的图片、音频、视频保存到文件,支持在原文正文中对应的位置有替换内容。
(5)支持方便添加采集源 及 定义采集规则等(有简易界面 或 工具)。
(6)支持多线程采集。
(7)支持使用代理采集。
(8)平稳运行后,需要1个月的技术支持
二、技术需求
基础采集程序开发语言使用Python、PHP、Java优先考虑。
三、产品需求
采集程序应是一个比较完整的系统,且便于二次开发。

已有14人投递
Small c870c1f0467a79ae005812df6e4a5cc1
Small b23e8aa303dd68f1fa721544279a38f6
Small f8073a7ee99240db6a89d8f007f4af18
Small 89e265dbb5249b2c22a6ebf878365c47
Small 9c1fe99c9775d72d1ecca9724b7bcc1e
Small 9ef86a4d8a06ef365aac411cd33ef553
Small 004f03b8552158308a9da4571cdb7219
Small bf2041a32533517773db76d3d99bd185
Small b9a08cd23578d30dd2a9e292ee3b796c
Small d9ef3571a5ce50f0e0077da2e5f48c29
Small sample user
Small 822e42bf12de31d85ebc0c2a118c93d4
Small e6a27960fce69d04b7ad652fd0165c28
Small 0a30776a69f8cad0d8d0968bb768e102
E4b959d3bdbe5b7a4da734c5d906cfcf
昵称登录后显示 大约 4 年前
公司地址 北京 海淀
团队人数未填写
融资情况未透露
产品介绍

暂无介绍

团队介绍

暂无介绍