1. 二手车搜索服务和suggest 算法开发。 实现二手车的搜索检索和搜索提示服务,再利用自然语言处理
流程优化搜索结果。后期将搜索提示重构为纯js 模块,用于web 端的搜索。
2. 政治敏感,色情,广告内容的过滤服务(文本类型,图片类型)。基于一元模型和自动学习规则,用于文本中
的敏感内容识别。利用图像识别技术对图片进行训练而后生成二分类模型识别出广告图片(主要是评论中的
横幅文字图片,二维码,名片图等)
3. 微信公共号资讯抓取和抽取流程。利用在搜狗和上述的技术成果,实现一套资讯抓取流程获取新闻内容供用
户阅读(这部分主要优化了去广告分析)。后期实现了简单的微信公共号发掘工具,用于发掘汽车领域较好的
微信帐号,为内容扩充服务。