1、熟练运用 Python、Javascript 进行爬虫开发及常用库。
2、熟练使用 CSS 选择器、XPath、正则表达式高效提取结构化与非结构化数据。
3、熟悉 DrissionPage、Playwright 等自动化库,了解浏览器指纹修改和特征隐藏实战能力。
4、熟练使用 Scrapy 框架的完整开发流程,包括中间件、管道等核心组件定制。
5、具备网站参数加密、响应解密等 JS 逆向分析能力,熟悉各类登录机制(Cookie/Session、
Token、JWT),验证码(滑块、点选、空间推理、语序还原)处理与绕过。
6、了解 TLS/HTTP2 请求指纹原理及浏览器指纹规避方案。
7、熟练使用 Git 进行代码版本管理及协作开发,熟悉 Linux 常用命令及服务器环境下的爬虫部署运
维。
8、了解 Vibe Coding 在爬虫开发与逆向分析中的实际应用。
1、实现基于 FastAPI 的风控绕过平台,统一抽象滑块、点选、九宫格、图标、语义等验证码与风
控策略,覆盖瑞数(4-6)、加速乐、极验(v3/v4)、数美、长亭雷池(v1/v2)、腾讯滑块等主
流体系,作为多源数据采集体系的核心支撑模块。
2、深入逆向 JS 加密逻辑,结合真人行为轨迹建模与模拟,构建高通过率验证绕过能力,保障复杂
反爬场景下的采集成功率与稳定性。
3、构建视觉识别能力(YOLOv8 + 孪生网络 + ResNet),实现滑块缺口定位、点选目标识别及语
义类验证码解析,提升复杂验证码识别准确率与泛化能力。
4、基于 Cronet 封装 Chrome 90–130 TLS/HTTP2 指纹,实现高并发请求与浏览器级指纹拟态,
增强请求侧风控对抗能力。
5、提供标准化接口服务(API 化输出),支持采集系统按需调用,实现验证码处理与风控绕过能力
的平台化复用,降低多项目接入成本。
6、构建异常监控与预警机制(连续失败阈值触发告警),实现风控策略变化的快速感知与动态调
整,提升系统鲁棒性与运维效率。
可兼职时间
可兼职地点
0条评论 雇主评价