吃猫粮的小黑

  • 教育信息:西安交通大学
  • 擅长技能:熟悉 Python/Java,了解 C/C++ 擅长网络爬虫开发,熟悉常用机器学习和数据挖掘方法
hiho统计
擅长技能
熟悉 Python/Java,了解 C/C++ 擅长网络爬虫开发,熟悉常用机器学习和数据挖掘方法
教育经历
  • 西安交通大学 — 硕士

    电子与信息工程学院

    2015 — 2018


  • 西北农林科技大学 — 本科

    信息工程学院

    2011 — 2015


工作经历
  • 百度 - 机器学习/数据挖掘工程师

    参与 Feed 流中内容质量组的低质方向项目,根据文本特性和图片特征挖掘低俗类新闻特征并分类,产出相应策略过滤此类新闻,并基于 hadoop 集群结合低质图片库挖掘低质文账号。

    2017.6 - 2017.9


项目经历
  • 基于神经网络的主题社团发现方法研究

    项目描述:主题社团发现旨在挖掘社交网络中用户所属的社团,社团中包含的话题,进而获知社团中的参与 者所感兴趣或正在讨论的话题,为社团赋予语义信息。 工作简述:基于主题模型的思想建模用户、社团、主题三者之间的关系,建立从用户-社团层到社团-主题层 再到主题-词层的神经网络结构,通过已知的用户文本信息反向优化整个网络模型。

    2017.7 — 现在


  • 社交网络中用户隐含表示学习方法研究

    项目描述: 结合社交网络中用户的文本、社交关系等异构的信息源,基于神经网络的方法学习用户在低维空 间的隐含表示,并用其作为用户特征,进行下游的分类或预测任务。 工作简述: (1)基于用户的社交关系和发布的文本信息两方面构建用户特征,利用用户的社交关系,借助 skipgram 语言模型思想建模学习用户的 embedding;利用用户发布的文本,借助 Paragraph Vector 模 型思想学习用户的 embedding;结合社交关系和文本两部分学习用户最终的隐含表示。 (2)将学习的用户隐含表示作为用户的特征,进行相应的分类或预测任务(如用户性别预测)

    2016.8 - 2017.2


  • 舆情监控与分析系统开发

    项目描述:该系统主要用于教育部全国各类考试及交大舆情信息实时监控与分析,功能包括多源舆情数据实 时获取、话题发现、事件发现等,为及时感知社会舆论提供有效的解决方案和技术手段。 工作简述:(1)参与多源舆情数据实时获取模块。采用基于 python 的 Scrapy 爬虫框架 + Selenium + Redis, 从微博类/新闻类/论坛类/贴吧类/百度实时新闻搜索等站点实时获取数据并设置分布式爬取机制, 爬虫数据更新机制。 (2)参与后台开发。为保证 web 与数据库的隔离式交互,创建基于 Django 框架的 Restful API, 为前台与后台模块交互数据提供 API 接口。

    2015.9 - 2016.7


获奖情况
  • 研究生新生一等奖学金 -

    推免保研成绩优异

    2015.9


  • 国家奖学金 - 专业排名第一

    排名专业第一

    2014.11


  • 国家奖学金 - 专业排名第一

    排名专业第一

    2013.11


  • 国家励志奖学金 - 班级第三

    排名专业前10%,班级排名第三

    2012.11