爬取豆瓣,获取电影评论信息形成词云,了解大家最多的评论 -> 为了分析《xxx》电影的观众反馈,使用Python爬虫从豆瓣网站抓取了1000条评论数据,并利用jieba分词和wordcloud库生成了词云图,发现大家最关注的是电影的剧情、演员和音乐等方面。
获得B站弹幕,生成折线图,知道哪一个时间大家互动最多 -> 为了探索B站视频的用户互动特征,使用Python爬虫从B站API获取了《xxx》视频的弹幕数据,并利用pandas和matplotlib库对弹幕数量进行了时间序列分析,绘制了折线图,发现用户在视频中某些精彩或者搞笑的片段会有高峰值。
爬取招聘网站,获取职位信息,知道城市的工资水平 -> 为了比较不同城市的数据分析师岗位需求和薪资水平,使用Python爬虫从拉勾网、智联招聘等网站抓取了全国各地区的数据分析师职位信息,并利用pandas和seaborn库对数据进行了清洗、统计和可视化处理,绘制了柱状图、箱线图等图表。
爬取商品网站,获取商品评论,了解大家对一个商品的评论 -> 为了评估《xxx》商品在京东商城上的销售情况和用户满意度,使用Python爬虫从京东网站抓取了该商品的销量、价格、评分和评论数据,并利用pandas和sklearn库对数据进行了预处理、情感分析和分类模型构建等操作。
批量发送邮件,提高办公效率 -> 为了提高办公效率和减少人工错误,在负责每周向客户发送报告时,使用Python编写了一个批量发送邮件的脚本,并利用smtplib库实现了邮件发送功能。