- 设计三层推理架构(应用层/模型层/硬件抽象层),统一20+类模型接口,支持6+异构芯片。硬件抽象层通过预分配内存、stream/context管理,实现不同平台(ACL、BMRuntime、NNIE等)的内存与执行流统一调度。新平台接入仅需适配硬件后端,结合CI/CD自动构建与回归测试,接入周期缩短约50%。
- 开发模型加密模块(zs_crypto_sdk),基于Crypto++ AES实现,NVIDIA平台离线加密TensorRT引擎,其他平台运行时内存解密,不影响推理性能。
- 优化SuperPoint+SuperGlue特征匹配(TensorRT 8.4 + 少量CUDA后处理),在RTX 3080上实现117 FPS实时推理。
- 交付大货车右转预警AI相机、智能安防分析盒等产品,累计部署千路级,系统运行稳定超12个月。
大货车右转预警AI相机 | 算法负责人 | 2025.01-2025.09
针对右转盲区预警,开发Hi3516嵌入式AI相机(检测+分类+测距)。
采集现场+北京三环数据构建训练集,针对性优化提升车型分类准确率从94%至99%。
多线程并行处理YOLOv5s检测与ResNet分类,线程间传递目标,预分配内存池,NPU利用率<80%。
开发音柱仿真平台,模拟路口播报场景,支持快速测试验证。
技术栈:Hi3516 NNIE、YOLOv5s、ResNet、多线程、RTSP/WebSocket。
雷视融合全天候检测系统 | 算法负责人 | 2024.01-2024.12
解决雨雾/夜间/逆光等复杂天气下单一视觉漏检问题,实现雷达+可见光+红外融合。
时间对齐采用最近邻算法;双光融合使用IoU+匈牙利匹配。
雷达-相机标定:透视矩阵(角点预标定)实现3D点云到2D图像映射,支持BEV坐标系;探索基于轨迹的ICP自动标定。
辐射测温:轨迹预测补偿热成像低帧率,通过打火机实验验证精度±2℃。
核心成果:相关专利多篇(标定算法为主),全天候漏检率降低40%+,支持三传感器灵活配置。
技术栈:C++、透视/BEV变换、DeepSort、畸变矫正、联合标定。
跨平台视觉推理架构与智能安防产品线 | 架构负责人 | 2022.07-2023.12
针对“一平台一实现”导致的开发低效与bug难以合并问题,重构边缘推理代码。
将原万行耦合代码重构为三层架构,统一模型接口与硬件抽象,新增需求可快速合并主干。
引入CI/CD与单元测试,消除内存泄漏等稳定性问题,算法准确率98%+、召回90%+。
支撑口罩佩戴、烟火检测、电动车入梯等20+异常行为监控,部署于多个社区,稳定运行超18个月。
技术栈:C++/TensorRT/昇腾ACL/算能BMRuntime、INT8量化、Docker。
可兼职时间
可兼职地点
0条评论 雇主评价