毕业于美本美硕,均为US前50高校,硕士毕业时,有多篇深度学习顶会论文一作。
毕业后,在公司中负责大型算法类服务端项目的整体技术设计和落地,主要是用golang开发对应算法服务,提供线上实时服务。使用Python Pytorch进行模型训练,有处理经典Stable Diffusion和大语言模型等算法的经验。相关技术实践已经服务于企业亿级别DAU并且能够承受百万级QPS。
工作项目:
1. 大语言模型推理引擎。基于公司自有数据集,对大语言模型进行训练,采用多卡分布式训练,完成7B/13B级别的参数训练。用于和用户交互根据上下文推测用户意图,调用下游系统。
2. Stable Diffusion on Control: 基于Latent Diffusion Model(Stable Diffusion)采用的模型,优化算法,调整网络结构,适配该模型并且和强化学习结合解决路径优化问题,实现机器人在模拟环境的最优路径的问题 。
可兼职时间
可兼职地点
0条评论 雇主评价