实现网
强化学习研究员 远程兼职
PyTorch
强化学习
深度学习
Python
英语

职位详情 预算:16000 RMB(固定价格) | 截止日期:10天 项目概述 将一个学术论文中的深度强化学习(DRL)加密货币投资组合管理系统改造为仅买入的模拟交易系统,并接入 Alpaca 进行模拟交易。原模型中的做空/杠杆操作必须完全禁用。 该系统使用自定义 Transformer 编码器-解码器架构,包含以下创新模块: • Sequential Attention — 上下文感知注意力层,捕捉价格序列的局部模式 • Relation Attention — 跨资产注意力层,捕捉资产间的相关性 • Leverage Decision Layer — 多头 softmax 决策层(需禁用,改为单头 softmax 仅买入) 您的任务是:修复代码使其在现代 Python 环境中运行,移除做空/杠杆机制(转为仅买入),在加密货币数据上训练,并接入 Alpaca 进行实时模拟交易,每30分钟自动调仓。 论文 PDF、源代码仓库链接将在筛选通过后提供给合格候选人。 重要说明:代码需要现代化 原始代码存在以下已知的弃用和兼容性问题,需要修复: • 使用了已弃用的 pd.Panel • 全代码硬编码 .cuda() • 使用了已弃用的 PyTorch 初始化 API • 使用了已弃用的 pandas API 具体的技术解决方案由您决定。 我们提供 • 学术论文(PDF) • 源代码仓库 • Alpaca 模拟交易 API key 和 secret • 目标加密货币列表 技术栈 • Python、PyTorch • Alpaca Market Data API(30分钟 OHLCV 数据) • alpaca-py SDK(下单执行) • Docker(最终交付必须包含 Dockerfile,确保环境可复现) 交付内容 只有所有里程碑均达标,项目才视为成功完成。 里程碑 1 — 代码现代化 + 仅买入回测 修复代码并将模型转为仅买入。完成后我们期望看到: • 代码在现代 Python 环境中正常运行 • 所有弃用依赖已修复 • 杠杆决策层已移除,改为单头 softmax(仅买入) • 损失函数中的做空相关计算已移除 • 在加密货币数据上训练完成的模型 • 回测结果包含:累计投资组合价值(APV)、夏普比率(SR)、卡尔玛比率(CR) • 回测结果需与论文中报告的性能水平一致或合理接近 里程碑 2 — Alpaca 实时模拟交易 将训练好的系统接入 Alpaca,实现自动投资组合调仓。完成后我们期望看到: • 系统每30分钟运行,获取最新价格数据并在 Alpaca 上执行模拟交易 • 完整管道运行:获取K线窗口 → 模型推理 → 输出投资组合权重 → 计算权重差异 → 下单 • 现金仓位正确处理 • 多资产调仓逻辑正常运作 • 所有交易记录包含时间戳、权重变化和运行中的投资组合价值 • 模拟交易结果须表现出模型的核心优势,产出合理且稳健的交易表现。不接受以"市场环境不同"为由解释表现不佳。 里程碑 3 — Docker 化、文档和交付 • Dockerfile:完整的容器化部署,确保即使未来 Python 版本或依赖发生变化,系统仍可复现运行 • 清晰的文档:从零安装、重新训练、启停系统 • 代码整洁、有注释 技能要求 • PyTorch 深度学习(必须熟悉 Transformer 架构、自定义注意力机制) • 强化学习(策略梯度、投资组合优化) • Python 数据处理(pandas、numpy、3D 数组操作) • REST API 集成(Alpaca 或类似交易平台) • Docker • 能阅读英文学术论文和代码 补充说明 • 模型训练需要 GPU(Transformer 架构,80K步,batch size 128)。如果您没有 GPU,可使用 Google Colab 或类似服务。 • 原始代码为单文件约900行,建议在修复过程中适当模块化。 • 表现优秀者有后续付费工作机会。 • 本系统仅用于研究和模拟交易目的。

预估 16000 元

已有1人投递
强化学习研究员 远程兼职
TensorFlow
Python
强化学习经验(PPO、DDQN)

职位详情 预算:10000 RMB(固定价格) | 截止日期:6天 项目概述 将一个现有的、完整可运行的深度强化学习(DRL)加密货币交易系统改造为仅买入的模拟交易系统,并接入 Alpaca 进行模拟交易。做空/卖出侧必须完全禁用。现有代码库完整且可运行——这是一个改造项目,不是从零开始。 该系统使用 PPO(近端策略优化)算法,包含3个集成模块: • TraderNet — 主DRL智能体,使用"Round-Trip Strategy"奖励函数 • N-Consecutive — 基于规则的安全过滤器,防止不确定的交易执行 • Smurfing — 更保守的第二智能体,用于避免高风险交易时段 您的任务是将其转换为仅买入系统,在 BTC、ETH 和 XRP 上重新训练,并接入 Alpaca 进行实时模拟交易。 我们提供 • BTC、ETH 和 XRP 的历史小时级 OHLCV CSV 数据 • Alpaca 模拟交易 API key 和 secret • 学术论文 PDF 技术栈(仓库中已有) • Python 3.6+、TensorFlow / TF-Agents、Gym • TA 库(12个技术指标)、PyTrends、scikit-learn • 如果 Google Trends 数据获取不稳定,可以禁用该特征——请自行判断 交付内容 里程碑 1 — 买入侧回测,显示正收益 将系统转换为仅买入并在提供的数据上重新训练。完成后我们期望看到: • BTC、ETH 和 XRP 的训练完成的仅买入模型 • 在留出测试数据上的回测结果,证明系统盈利 • 绩效指标:累计PNL、夏普比率、索提诺比率、最大回撤、投资风险 • 清晰的对比,展示仅买入系统可以正常工作 里程碑 2 — Alpaca 实时模拟交易 将训练好的系统接入 Alpaca,实现自动交易。完成后我们期望看到: • 系统每小时运行,获取实时加密货币数据并在 Alpaca 上执行真实的模拟交易 • 所有交易记录包含时间戳、价格、指标值和运行中的PNL • 持仓管理正常运作(入场、持有、退出) • 完整管道运行:Smurf → TraderNet → N-Consecutive → Alpaca 执行 技能要求 • Python + TensorFlow / TF-Agents,强化学习经验(PPO、DDQN) • REST API 集成(Alpaca 或类似平台) • 能阅读英文学术论文和代码 补充说明 • 模型很小(Conv1D + Dense 层),在 CPU 上几小时即可完成训练,无需GPU。 • 表现优秀者有后续付费工作机会。 • 本系统仅用于研究和模拟交易目的。

预估 10000 元

已有2人投递
产品开发 远程全职

一、整体框架 / 语言 • C# + .NET (WPF):继续作为上位机 UI 和业务逻辑的主框架 • Python(子进程或服务):负责训练、复杂算法(如深度学习、PatchCore、复杂图像处理) • 通信方式:CLI + StdOut、TCP/Socket、或 gRPC/REST(WPF ↔ Python) --- 二、相机采集系统(工业相机 SDK 抽象) • 工业相机 SDK: • 海康:MVS / MVSDK(C/C++/C#),或 HikRobot 官方 .NET SDK • Basler:pylon SDK(有 .NET 组件) • 大恒:Galaxy SDK • C# 技术栈: • 抽象接口:ICamera, ICameraControl(采集 / 触发 / 参数读写) • Task/async 模式 + 生产者/消费者队列(采集线程与处理线程解耦) • 图像格式:System.Drawing.Bitmap 或 WriteableBitmap / System.Windows.Media.Imaging 统一封装 • 图像基础处理(非 AI): • OpenCvSharp4(C# 封装的 OpenCV,用于预处理、ROI 裁剪、格式转换) --- 三、开源标注软件集成(如 X-AnyLabeling / LabelMe) • 外部工具集成: • System.Diagnostics.Process 启动外部标注软件,带图片目录参数 • 通过配置保存标注软件路径、数据目录 • 标注数据格式: • LabelMe JSON / COCO JSON / YOLO txt 等 • C# 反序列化:System.Text.Json 或 Newtonsoft.Json • 数据转换模块: • AnnotationConverter:将推理结果(框、标签、置信度)↔ 标注 JSON • 目录结构约定:dataset/images, dataset/labels 等 • 训练触发(闭环): • 从 WPF 调 Python 脚本:ProcessStartInfo 调用 python train.py ... • 进度回调:Python 通过 stdout 输出或通过 TCP/Socket 返回给 WPF --- 四、AI 拍摄 / 光学自动对焦(Auto Exposure / Auto Focus) 1. 图像评价算法(清晰度/亮度/对比度) • C#: • OpenCvSharp 实现:Laplacian 方差(清晰度)、直方图 / 均值(亮度)、对比度等 • Python 备选(如后续要用更复杂评价指标): • OpenCV (cv2) + NumPy 2. 参数搜索 / 优化算法 • 简易爬山算法 / 网格搜索 / 模拟退火: • C# 自己实现即可(算法很轻量) • 对接相机 SDK 参数: • 曝光、增益、gamma、光圈、焦距(若镜头可控) 3. 硬件控制 • 使用各家 SDK 中的: • SetExposureTime, SetGain, SetFocus, SetAperture 等属性 • 统一封装到 ICameraControl.AutoOptimizeAsync() 中,隐藏厂商差异 六、通讯系统 / 工业互联(PLC / MES 等) • 工业协议库(C#): • NModbus4:Modbus TCP/RTU • S7.Net:西门子 S7 PLC • 若有自定义 TCP 协议:System.Net.Sockets • 架构设计: • ICommunicationProvider / IIndustrialProtocol 抽象接口 • 插件化实现:ModbusProvider, S7Provider, TcpJsonProvider 等 • 抽象触发源与结果输出: • ITriggerSource(软触发 / PLC 位变化触发) • IResultOutput(写寄存器、发 JSON、写文件等)

Small 962b3490f5109ef806411c5392290867
昵称登录后显示 2 个月前发布

预估 700元 / 8小时

已有3人投递

我是技术人才
我在寻找远程工作

技术人才入驻

我是创业者
我在寻找技术人才

发布用人需求