-
华为
-
全栈工程师
-
5年
擅长技能
概况:
我们科研组由很多数据专家组成,他们能做出关于概率论及决定论的数据模型的严格的数学解。包括数字信号处理,音频/语音识别和合成,增强,说话者验证,旋律转录,异常检测,传感器阵列处理,图像处理,对象检测和跟踪,以及由适当特征提取而进行分类。 将MTS类比应用于说话者验证,独立分量分析以及多假设对象跟踪和检测的信号处理。
一. 机器学习和深度学习
主要是用TensorFlow、Keras、Caffe、Theano、PyTorch来实现的,具有这方面的尖锐理论分析能力和宝贵实践经验。
软件原型设计包括连续变化点检测,声学MIMO识别,扬声器分类,车牌号码识别和乘客计数。还有数字信号处理,识别算法,传感器融合,机器学习和深度学习,信息理论,通信系统,统计检测理论和模式识别。
将其应用于AI和预测算法,大词汇量语音识别,人体检测,模型模拟,人脸识别,声音分类,生物医学特征表征,时间序列分析,自适应噪声消除,对象检测和计数,文本读取,图像,口语情感分析,潜在语义分析,自然语言处理,单词嵌入和机器翻译等方面。
还会写出各种科技方案和文章。
精通于各种程序语言:C/C++, C#, Python, Java, Object-C等
3. 开发网络和移动软件
1) 开发网络
•Responsive and Dynamic Frontend Development with AngularJS, React.js, Bootstrap, CSS3, SCSS, HTML5.
•Backend Development with MVC frameworks including CodeIgniter, Laravel, Yii, WordPress.
•Social API Integration such as Google API, Paypal/Card Payment.
•Audio/Video/Chat Web app with Websocket and WebRTC technique.
2) 开发移动软件
•Native app with Java, object-c, swift, kotlin langauge.
•Hybrid app with ionic, cordova, phonegap, flutter framework and so on.
二、核心技术:人工智能
1、音频处理(10年以上)
(1)语音识别(hybrid HMM-DNN (Deep RMB) 模型)
利用1500小时的公用Libri 数据库构建DNN(深度神经网络)模型
Libri 语音库的识别精度: 5.2% WER
已实现为商业性Web服务器API
(2)TTS (deep RNN 模型)
利用公用CMU Arctic数据库(1312个句子)构建DNN模型
MCD (Mel-Cepstrum Distortion): 5.1
已实现为商业性Web服务器API
(3)语音验证 (3D-CNN)
利用公用TIMIT数据库构建DNN模型
精度:98.7 %
已实现为商业性Web服务器API
(4)语音转换 (deep GRU-RNN 模型)
利用公用CMU Arctic数据库(1312个句子)构建DNN模型
MCD (Mel-Cepstrum Distortion): 4.9
已实现为商业性Web服务器API
2、图像处理 (7年以上)
(1)人脸检测/识别 (deep VGGFace network)
利用公用LFW数据库和TensorFlow库构建DNN模型
识别精度:97.5%
已实现为商业性Web服务器API
(2)人脸特征点检测 (Caffe)
利用公用AFLW数据库和Theano库构建DNN模型
已实现为商业性Web服务器API
(3)人脸特征点检测的应用
虚拟人脸识别,年龄识别等
对象检测与跟踪(deep CNN- Inceptionv2, mobilenet v2 )
在GPU机器上的处理速度:25 FPS
DSS (数码监控系统) http://www.ilinkpro.com
VMS (视频管理系统) (能支持ONVIF, non-ONVIF IP 相机, NVR)
64 通道, 播放,录制, IVS (智能视频监控)
3、数据挖掘与数据分析 (5年以上)
数据挖掘- 算法: SVM, k-mean, CURE, Tools: Rapid Miner
数据分析 – 工具: SPSS, CAQDAS, R, Python
4、Web开发
(1)后端
PHP (Laravel, CodeIgniter, CAKEPHP, WordPress, Ecommerce, EC-CUBE ...)
Node.js
WebRTC (video/audio/text conference)
MySQL, MSSQL, NoSQL (MongoDB)
(2)前端
Language – HTML5, JAVASCRIPT (jQuery, AngularJs, ...), Typescript (Angular ~7, React)