8
被预约次数
19
被收藏次数
4
被评价次数
中科院自动化所高级工程师,曾任北大计算机所高级工程师,从事多媒体(文本/图像/音频/视频)内容理解、多媒体内容安全和多媒体信息检索等领域的研究工作,熟练掌握机器学习、模式识别常见算法的设计与运用,在图像/视频内容检索,人脸检测/矫正/识别/验证,网络音视频内容安全领域有多年的关键技术和应用系统研发经验。
擅长算法技术如下:
基于内容的图像/视频检索,利用深度学习技术挖掘图像/视频内容特征,建立图像/视频特征库及分布式索引结构,可支持在海量资源中快速定位相似或相同的图片和视频,可以参考Google或百度的以图搜图应用;
人脸检测/识别/验证/五官定位/年龄估计/表情识别/性别识别,目前人脸检测,五官定位(人脸轮廓检测),人脸验证,人脸识别,性别识别算法具有较好的性能(准确率,召回率,速度),支持大规模人脸库的构建和检索,支持基于摄像头的实时人脸验证,可用于实际应用。年龄估计,表情识别应用的约束条件比较多,可用于对准确度要求不高的互动娱乐场景中。
文本检测/文本识别(OCR),检测语言方面可支持常见语种(英文,中文,日文,韩文,拉丁文等),检测文件(包含文本内容)类型支持PDF,长微博图片,验证码图片等。算法对于印刷体文本具有非常好的检测识别效果,对于文本角度、清晰度、大小等具有较好的鲁棒性,可直接应用。算法对于手写体文本的检测识别,需要根据手写体的样本特点再进行针对性的训练,才可达到较好的效果。
违规图像/视频识别,算法采用深度学习技术训练模型,可有效识别涉黄淫秽,涉恐涉暴等图像/视频,支持本地部署和云端部署,支持多路并发,支持直播视频流的实时检测,节省大量人工成本。
擅长工程技术如下:
擅长C++语言,擅长底层程序设计,熟悉C/S架构系统设计研发,熟悉云服务设计研发,具有多年的程序设计与研发开发经验。
2013.01~2014.09:国家863课题(涉密),参与项目申请工作(项目书/答辩PPT撰写),负责算法系统整体架构(算法程序设计、数据库设计等),承担其中基于内容的文本/图像/视频的相似性搜索技术研发。并负责系统的部署运维工作;
2014.03~2014.06:方正电子多媒体信息检索平台,负责项目申请立项工作,领导算法平台的技术研发团队,研发内容包括文本/图像/视频检索,人脸识别等,并将算法封装作为底层服务,为上层各类应用系统提供支持。本人在其中承担基于内容的文本/图像/视频搜索技术研发;
2014.07~2014.09:方正国际人脸验证系统,负责项目申请立项工作,并负责项目算法系统的整体设计;
2014.09~2014.10:全国特定音视频检索识别挑战赛,负责其中视频识别子任务,即在海量视频中识别内容涉恐涉暴的视频文件。所研发算法采用多线索融合及场景识别技术,具有较好的识别率和速度,取得第三名的好成绩,并基于该成绩获得腾讯的视频识别项目合作;
2014.10~2015.01:图像/视频采集系统,负责采集系统架构设计,主要包括网络爬虫设计研发(超链嗅探,网络深度/广度漫游,定向监控等)和网页解析技术研发(超链接分析、视频地址解析、图像/视频下载,视频描述信息解析采集等);
2015.01~2016.03:腾讯视频识别项目(企业项目),负责项目申请立项工作,并全权负责项目的方案制定和核心算法研发,以及技术团队的管理工作;
2016.04~2016.10:智能直播审核系统(企业项目),负责与企业的需求沟通和立项工作,负责审核系统的云结构设计和研发,并针对企业客户的特定数据进行算法优化重构。该系统采用云服务模式,在阿里云部署审核服务系统,并通过开放的API提供给用户使用,同时系统提供用户管理和计费系统。
2016.06~至今 :智能教育机器人项目(高校合作项目),参与某高校智能机器人项目,负责其中机器视觉系统的整体研发工作,主要包括人脸检测,人脸识别,行人测距等基础算法研发。
聚相投资 2017-05-26 15:33
可以
可兼职时间
可兼职地点
刘呈辉 2024-09-14 20:47
很不错