技术经验: 毕业于哈尔滨工业大学,在校时间参与ACM并获奖。WI输入法安卓版本第一代开发者,主要负责引擎部分。面霸网(www.51mx.org) 创始人。先手就职于腾讯、奇虎360公司。擅长搜索研发,数据挖掘,NLP等相关领域。 360搜索二级引擎模糊化系统,2012年11月-2014年4月,团队规模:2人 在这个项目中,我主要是负责term-weight点击权重的研发,以及模糊化规则的研发。最后实现了random forest的版本。 360搜索二级引擎同义词替换系统,2014年5月至今,团队规模:1人 同义词替换策略系统采用co-click来挖掘同义词,以及从网页title挖掘同义词,采用寻找最优替换路径的方法找到最优的替换路径。 WI输入法android平台核心开发人员,2011年11月-2012年7月,团队规模:3人 在这个项目中,我主要负责将输入法的内核部分开发,2012年7月16日发布第一个版本,一个月用户突破50万。 中文情感倾向性分析系统,2011年10月-2012年3月,团队规模:1人 采用方法是先通过最大熵模型预测候选项的极性和所属极性的概率,并建立一个基于候选项的网络,然后通过最小割模型和集合相似合并模型优化候选项的极性结果。其中在第三届中文情感分析评测中任务一准确率评测最高值。
项目经验: 12年加入奇虎360,从事好搜产品研发至今。先后负责了好搜引擎的同义词挖掘以及线上策略的开发,query扩展等研发。 360搜索二级引擎模糊化系统,2012年11月-2014年4月,团队规模:2人 在这个项目中,我主要是负责term-weight点击权重的研发,以及模糊化规则的研发。最后实现了random forest的版本。 360搜索二级引擎同义词替换系统,2014年5月至今,团队规模:1人 同义词替换策略系统采用co-click来挖掘同义词,以及从网页title挖掘同义词,采用寻找最优替换路径的方法找到最优的替换路径。 WI输入法android平台核心开发人员,2011年11月-2012年7月,团队规模:3人 在这个项目中,我主要负责将输入法的内核部分开发,2012年7月16日发布第一个版本,一个月用户突破50万。 中文情感倾向性分析系统,2011年10月-2012年3月,团队规模:1人 采用方法是先通过最大熵模型预测候选项的极性和所属极性的概率,并建立一个基于候选项的网络,然后通过最小割模型和集合相似合并模型优化候选项的极性结果。其中在第三届中文情感分析评测中任务一准确率评测最高值。
被预约: 2 次
可兼职时间: 周六、周日
可兼职地点: 朝阳 望京
技术经验: 毕业于中科大,本科是数学,研究生是计算机。在校获得优秀软件设计奖。 毕业后就职于新浪,阿里高德,所在的部门是搜索技术中心,负责的业务是搜索架构系统开发,性能稳定性工作。每天处理的服务最多流量几十亿次,搜索的流量有几千万次。 目前是创业公司的创始人,主要从事的方向是位置搜索大数据分析,带公司的技术团队。 擅长的技术方向: 搜索,爬虫,地图领域的搜索,地理编码,逆地理编码,空间查询等LBS相关技术。 视频压缩算法,开源的相关技术 语音聊天机器人,做过相关产品,精确需求做的很好,泛需求依赖于对话语料。 搜索的相关技术及开源: C++了解阿里的kingso java 了解lucene, solr, elasticsearch 精通的语言:C,C++,java,Python
项目经验: 工作项目: 1) 高德POI搜索引擎的开发,维护,算法优化。并带领团队支持搜索服务的架构性能稳定性工作。 2) 地理编码,又称地址解析。开发及服务维护,优化。 3) 逆地理编码,通过经纬度返回位置信息(所在城市,区县,道路,商圈,门址等)。 4) 导航和实时交通也做过项目。 5) 金融大数据(创业带领团队做的项目),主要使用的爬虫,大数据技术,机器学习相关技术。 6) 直播产品,带领团队使用开源相关的技术做直播产品,也做了阿里云和腾讯云的直播解决方案。 7) 聊天机器人 业余项目: 1)给创业公司做过基于位置的空间查询引擎,基于全世界的范围的。 2)全世界范围的逆地理编码。 3) 政府的相关项目 4) 微信聊天机器人 5) 解析通讯协议的相关项目 6) 交通大数据
被预约: 10 次
可兼职时间: 周六、周日、工作日
可兼职地点: 朝阳
技术经验: 清华大学新闻与传播学院硕士; 百度移动搜索部门 负责过除移动资源业务外的移动搜索产品业务内容,包括移动搜索内容展现、结果排序、移动领域数据的分析与利用。促进了移动搜索PM团队的稳定成型。 获得过百度有价值员工股票额外嘉奖。 多次经历了在基础薄弱时期搭建团队,有能力快速组建一支有战斗力的产品团队。 培养了多位资深产品经理,在业界各种产品领域独当一面。 经历过大公司稳定期、挑战期、创业公司的各种历练,对不同环境下的团队管理有深刻理解
被预约: 4 次
可兼职时间: 周六、周日、工作日
可兼职地点: 海淀 五道口
技术经验: 大数据算法专家,熟悉自然语言处理、数学挖掘机、机器学习、搜索引擎等算法,熟悉创业公司技术架构,有高并发处理经验,深悟周鸿祎的产品经理思维、大数据思维。 毕业于985高校,8年工作经验,5年搜索引擎研发经验,2年大数据管理经验。 有多年技术开发和管理经验,熟悉互联网技术人员管理,熟悉互联网产品开发流程,深谙互联网思维和大数据思维,认同小步迭代、快速试错的理念; 熟悉C/C++、java、php、python等开发语言,熟悉mysql、nginx、redis、ssdb等开发,有大数据量、高并发服务开发经验; 熟悉大数据、自然语言处理、搜素引擎、数据挖掘和机器学习等领域; 熟悉大数据平台搭建,熟悉Hadoop、hbase、flume、Kafka、Storm、Spark、Hive等技术; 熟悉自然语言处理,对自然语言处理中的分词、新词发现、同义词挖掘、HMM、语言模型、词性标注、人名和机构名等命名实体识别、关键词提取、知识图谱等有开发经验; 熟悉搜索引擎中相关性排序,熟悉搜索引擎开发的整体流程,从爬虫、存储、索引、相关性排序、query和网页分析等整体工作流程,熟悉机器学习和数据挖掘应用; 熟悉大数据应用,在搜索、文本处理、信息标签化、金融建模领域有一定经验;
项目经验: 主要工作职责: 负责自然语言处理和query分析模块的相关研发工作,以及搜索中NLP相关的其他项目开发工作、NLP基础性算法开发和NLP资源建设等; 主要项目情况: ①.中文分词模块: 项目介绍: 分词模块主要包括:中文分词、词性标注、人名和机构名等命名实体识别、实体词识别、新词发现、关键词提取等。中文分词采用的是trie树结构和最大正向匹配的方法,词性标注采用的是隐马尔科夫(HMM)模型,人名识别和机构名识别主要是采用基于规则的方法,实体词识别主要涉及实体词挖掘、实体词去噪和实体词识别,新词发现主要是利用query日志,通过统计高频串和规则的方法进行识别新词。关键词提取主要是通过统计和规则的方法实现的。 项目中主要工作: 在分词项目中,我主要负责算法设计和代码开发工作,以及后续检索的case分析和效果优化等。 ②. Query分析模块 项目介绍: Query分析,主要是分析理解query,方便相关性打分。Query分析中主要包括:query纠错、query分类、query 核心词识别、同义词识别、query句式挖掘、query改写等。Query纠错主要是对用户输出的有误的query进行自动纠错,query纠错主要是通过拼音词典、编辑距离等方法。Query分类,主要是对query意图进行理解分类,方便最终检索结果的混排和整合等,query分类主要是通过规则和模型结合的方法进行的。Query核心词识别,主要是分析query中term的重要性,对term的重要性就行赋权,query核心词识别主要通过语义的理解,用规则的方法实现的。同义词识别,主要是挖掘上下文环境下的同义词,然后根据上下文环境进行同义词识别。Query句式挖掘,主要是挖掘query中的高频句式,以便对query就行分析。Query改写,主要是同义词改写和句式改写。 项目中主要工作: 在query分析项目中,我主要负责算法设计和代码开发工作,以及后续检索的case分析和效果优化等。 ③.检索效果快速优化 项目介绍: 检索效果快速优化,主要是在新架构上线不久,基础检索效果不是很理想,需要快速提高效果;主要是由相关性、NLP和混排的人员组成的封闭开发小组,进行快速的检索case分析,模块算法优化,快速评测上线。 项目中主要工作: 在该项目中,我的主要工作首先是case分析和分解:对检索的case进行分析,将case的原因合理的分配到相关性、NLP或者混排等不同的模块中;其次是对分解到NLP模块的case进行分析,优化算法,快速上线解决case。 ④.知识图谱项目 项目介绍: 知识图谱是一种语义网络,其结点代表实体或者概念,边代表实体/概念之间的各种语义关系。知识图谱搜索是现在搜索引擎都在积极推出的一个新项目,宜搜知识图谱主要目前支持人物、电视剧、电影、音乐、专辑、书籍等知识类别。 项目中主要工作: 知识图谱项目主要涉及知识的挖掘、解析和知识检索的过程,我主要负责知识检索这块。 ⑤.新闻聚合项目 项目介绍: 新闻聚合项目主要是检索中对新闻相关query出新闻聚合框,提供用户的检索满意度,新闻聚合项目主要涉及实时新闻索引库的建立和更新、query热度计算、新闻聚合框中新闻数据的相关性排序等。 项目中主要工作: 在该项目中,我主要负责Query新闻热度计算,主要是对每条query计算一下是否是最热新闻的热度值,热度值最高说明是最热新闻,新闻聚合框应该放在首条,热度最低说明不是新闻,不应该出新闻聚合。 ①.网页关键词、地址和电话号码、真实标题等抽取 负责网页中新闻关键词、新闻tag、地址信息和电话号码、真实标题等抽取工作,以提供后续使用 ②.智能摘要 360搜索中智能摘要的信息抽取,智能摘要主要是将摘要信息结构化,优化摘要展示,以满足缩短用户使用路径的目的。 ③.网页转码 负责网页转码中预转码流程、离线捞取流程等流程调度,满足网页实时转码需求。
被预约: 3 次
可兼职时间: 周六、周日
可兼职地点: 海淀
技术经验: 1、熟知搜索与信息流的推荐展现策略 2、有APP,H5与平台产品相关经验 3、有创业团队核心成员经历,伴随着App产品从0到1,期间独立负责产品(需求、交互)、运营等工作; 4、曾经的码农,有技术背景,对前后端都有一定的了解; 5、有GIS行业(LBS)和专业背景,对数据敏感,有空间分析能力。
项目经验: 1、负责PV千万,UA百万的搜索类(PC与无线); 2、设计搭建语音搜索播报数据后台管理体系 3、生活方式与内容推荐类App,熟知国内外相关产品;
被预约: 3 次
可兼职时间: 周六、周日、工作日
可兼职地点: 海淀
技术经验: 7年工作经验:包括机器翻译,自然语言处理,语义搜索、兑价广告、大规模数据处理、WEB开发,等到相关工作经验。熟练掌握自然语言处理中的分词、词性标注、文本分类、聚类、命名实体识别、关键字自动抽取,网络爬虫等技术。能够独立搭建统计机器翻译系统,熟悉概念语义搜索的核心模块概念抽取、搜索排序算法。熟悉兑价广告,比如关键字匹配方式,竞价机制,广告相关性方面的知识。熟悉hadoop、hive数据处理平台。熟悉基本的web技术,如SSH,JSP等。3年机器翻译研究经验。并发表多篇学术论文,已申请或正在申请多个专利。
被预约: 1 次
可兼职时间: 工作日、周六、周日
可兼职地点: 朝阳
技术经验: 3年搜索引擎开发工作经验,熟悉lucene,sorll,elasticsearch,翻译过elasticsearch官方文档,对于电商系统的搜索有丰富的实操经验 熟悉elk框架,可以快速使用elk + storm + redis + mongo + spark搭建 搜索 + 数据统计系统,结合一些数据可视化工具将数据进行各个维度的展示帮助公司决策
项目经验: http://www.che.com/sch/%E5%A5%A5%E8%BF%AA http://www.fengqu.com/other/search.html?_spm=0.sear1.0.0&keyword=%E5%A5%B6%E7%B2%89
被预约: 6 次
可兼职时间: 周六、周日、工作日
可兼职地点: 浦东
技术经验: 职业经历: 09-13年,任职于腾讯成都分公司,腾讯旗下搜索引擎soso的产品评测和数据分析; 13至今,任职于奇虎360,旗下搜索引擎360搜索的产品评测和数据分析。 个人评价: 1、七年搜索引擎产品评测,数据分析工作经验 2、尤其对反垃圾反作弊、用户行为分析方面有较深刻理解 3、熟悉相关数理统计方法,熟悉excel/spss分析统计工具的使用;熟悉搜索评测体系和相关评测指标;善于评测报告等文档撰写; 4、有一定的跨地域、跨团队项目管理经验,作为项目负责人,曾管理过10+人团队; 5、有一定的人才培养能力,作为导师,共培养了多名新员工; 6、熟悉Axure原型设计,能实现产品原型Demo的演示和相关产品文档的撰写; 7、了解众包的概念,接触过内部众包平台的搭建过程和人员招募流程; 对搜索引擎流程非常了解,能为网站优化提供有效建议。 对用户需求,用户行为的分析有一定见解,属于策略型产品。
项目经验: 定义、梳理作弊行为的特征。 推动评测平台的建设。 通过样本分析制定策略,推动上线并对策略效果负责。
可兼职时间: 周六、周日、工作日
可兼职地点: 高新 天府软件园附近,华阳范围皆可