基于python的抖音短视频数据分析与可视化
抖音是一个非常流行的短视频平台,每天都有大量的用户在抖音上分享和观看视频。为了更好地了解抖音用户的行为和兴趣,我们可以使用Python进行数据分析与可视化。
在本文中,我们将介绍如何使用Python进行抖音数据分析与可视化。首先,我们将使用Python获取抖音的数据,然后使用pandas和matplotlib等库对数据进行可视化。
1.数据获取
抖音的数据可以通过API接口获取。我们可以使用Python的requests库来发送HTTP请求,获取抖音的数据。
2..数据可视化
处理完数据后,我们可以使用matplotlib等库对数据进行可视化。例如,可以使用matplotlib绘制条形图、饼图、折线图等。
3.可视化结果分析
通过可视化结果,我们可以分析抖音用户的行为和兴趣。例如,可以分析用户关注的人的类型、观看的视频类型等。
数据来自于第三方监测,一共是有5000+抖音大V的数据信息。
主要包含博主们的昵称、性别、地点、类型、点赞数、粉丝数、视频数、评论数、分享数、关注数、毕业学校、认证、简介等信息。
其中粉丝最多的是人民日报,接近1.2亿。其次是央视新闻,也破亿了。
首先导入相关库,然后读取数据【如何导入 看最后】
1.性别分布情况
可视化代码如下:
整体上看,男女比例差别不大,除去未知的数据,基本是1:1。
2.点赞数 、点赞分布情况
可视化代码如下:
可视化代码如下:
3. 粉丝数、粉丝分布情况
可视化代码如下:
「人民日报」和「央视新闻」粉丝都破亿了。
可视化代码如下:
5000万以上56个,妥妥的大佬。200w~500w的人数最多,好多一时爆火的博主,一段时间后也基本不怎么涨粉了
4. 评论数
可视化代码如下:
抖音视频的评论区也是比较有意思的地方。比如刷剧催更的,「赶紧去更新,都过了十几分钟了,生产队的驴都不敢休息这么久」,总的来说,媒体类的视频评论较多。
5.分享数
可视化代码如下:
抖音的分享是视频对外传播的一个方法,可以让更多的人看到视频。从数据上看,大家还是比较喜欢分享新闻类以及美食类的视频。
6.各类型点赞数/粉丝数汇总分布图
可视化代码如下:
抖音这个产品是消磨你时间的,而不是节约时间,技术稍微深一点的视频基本上生存不下去。由上面的矩形树图可以知道,大家都喜欢「美女」类型的视频,毕竟谁不喜欢漂亮妹子呢~
7.平均视频点赞数/粉丝数
可视化代码如下:
8. 抖音大V分布情况
可视化代码如下:
北京遥遥领先,大V的聚集地。杭州盛产网红的城市,位列第二。
广东、浙江、四川位列前三。
美国居第一,不少在美国的华人会分享他们在美国生活的一些事情。国内也有人感兴趣这方面的东西,看看国外的月亮究竟圆不圆。
9.抖音大V毕业学校
北影、中传、浙传、中戏、上戏、央美,妥妥的演艺圈大佬。
这里 通过代码查询一下大V们的认证情况:
得到结果如下:
10. 抖音大V简介词云
可视化代码如下:
1.所有的代码放到同一个py文件中
2.在数据可视化过程中,难免会需要导入不同的库,这里建议使用WIN+R打开命令提示符,并使用国内镜像安装库(下载快),比如安装wordcloud库是,使用下列代码:
这里用的是清华的镜像,其他镜像:
企业贡献:
(1).网易开源镜像站:
(2).华为开源镜像站:
(3).阿里开源镜像站:
大学教学:
(1).清华大学开源镜像站:
(2).浙江大学开源镜像站:
(3).东北大学开源镜像站:
安装库的时候,建议更新一下你的pip库,命令:
3.最后运行成功后会自动生成.html文件,如果你想要看到图,这时你就需要把.html文件拉到桌面上,用浏览器打开
如果需要源码,可在评论区说。
版权声明
本文系作者发表,未经许可,不得转载