生活工作中,很多人都喜欢起个英文名字,比如东哥也曾经凑过热闹,人称葛朗台。
不过你别觉得起了个英文名就感觉很潮,其实有些名字,人家美国人也不爱叫了。就好像以前很多大妈大婶都叫翠花秀娥的,现在你要再给自己的孩子起这种名,孩子长大了以后会跟你断绝父子关系的。
闲言少叙,今天东哥专门从Kaggle上下载了美国的一个婴儿名字的数据,给你看看美国自1880至2014年的一百多年间,最受欢迎的名字有哪些。
数据准备
1、导入数据集
这份数据从1880年开始记录,记录了每年有5个人以上使用的名字情况。各字段的含义:
“Name”:名字
“Gender”:性别
"Count":名字数量
"Year":年份
导入结果显示,这份数据一共有182万条记录。这么多数据用excel无法操作。
2、查看每个字段的类型
数据分析
1、美国最受欢迎的10大男性名字
大家熟悉的James、John、Robert榜上有名,大概类似于中国的张伟张涛。
2、美国最受欢迎的10大女性名字
美国有400多万Mary,就问你服不服。来一张大家喜闻乐见的可视化词云图看得更加清楚:
3、查看某个名字在美国最受欢迎的年份
比如Dorothy这个女生名字,你会发现上世纪20年代的美国人叫的比较多。
4、查看某个年份在美国最受欢迎的名字
1992年,最受欢迎的10大男性名字。那要是按时代划分呢?其实也很容易:
比如,美国80后男性最常用的名字是:
比如,美国90后女性最常用的名字是:
再来看看美国00后,10后的小朋友一般喜欢啥名字呢?也就是美国80和90后的年轻人会怎么给自己的子女起名字呢?
来看看00后女孩名字:
类似的美国00后男孩名字是这些:
5、美国史上最受欢迎的10大名字在每一年有多少人
当然每一年的人数会有变化,那么做动态图的话,我觉得tableau比Python应该更合适一点,下面这个小视频就是我用Tableau做的:
https://www.zhihu.com/video/1148953239130193920
今天的数据分析分享就到这里。
当然,根据这份数据,我们还可以做一些其他的分析,每个人的分析角度不一样,思维不一样,分析出的结果也就不一样,同时根据个人喜好,分析结果的展示方式也不一样。
好了,每周数据分析分享,下周继续。