资讯类网站内容采集 远程兼职
一般月薪3000元- 项目类型:数据挖掘/爬虫
- 每月工作: 5天
- 工作方式:远程
职位详情
资讯类、社交媒体网站内容采集程序开发。
一、项目需求:
(1)采集内容:文章标题、正文、作者、发布时间、文章来源(如果有)、正文中的图片、音频、视频媒体资源等。
(2)支持采集内容自动去重。
(3)支持将采集的文章相关内容保存到MySQL数据库。
(4)支持将采集的图片、音频、视频保存到文件,支持在原文正文中对应的位置有替换内容。
(5)支持方便添加采集源 及 定义采集规则等(有简易界面 或 工具)。
(6)支持多线程采集。
(7)支持使用代理采集。
(8)平稳运行后,需要1个月的技术支持
二、技术需求
基础采集程序开发语言使用Python、PHP、Java优先考虑。
三、产品需求
采集程序应是一个比较完整的系统,且便于二次开发。