之前在巴哈姆特上看到了一位大神(ID:祈雨),这哥们独自一人整理了一份已汉化的GALGAME集+汉化组,总共约1500部,遂大惊。(os:以后终于不用去弟弟官网上找资源了)
原地址:
之后爬取了他整理的原数据集的表格,可惜格式比较乱,(因为所有的文字都是他手工打出来的),而且导出后的日文标题中有些符号也有问题。
所以我就对他原表格里的数据进行了一些清洗,同时将他整理的数据与VNDB数据库的评分做了一个连接,拼出了一个还算整齐的csv表(连接大概是95%的准确率)。
有兴趣的同学可以直接导入这个csv文件做自己喜欢的统计。
当然我也会在本文中做一些简单的统计展示。
巴哈姆特上的整理(视觉效果比较好)result(utf-8).csv(导入pandas效果)result(gbk).csv(excel打开效果)
链接: https://pan.baidu.com/s/1TYfyCEfBAsQnVILa3rJGBg 提取码: dpax
zip中包含三个文件:
1.汉化游戏总数:1494
2.评分人数分布
评分人数 游戏数量
0~100 802
100~200 225
200~300 80
300~400 58
400~500 18
500~600 20
600~700 21
700~800 12
800~900 15
900~1000 14
1000+ 114
<< · Back Index ·>>
上一篇
Chapter 1 梵蒂岡為何被稱為「最小的大國」?1943年12月27日,英國首相「丘吉爾」同蘇聯領導人「斯大林同志」在伊朗德黑蘭舉行...
农村的深山、荒地、田埂上生长了很多的野花、野果,其中大部分都可以食用,这些东西也成了农村孩子的零食水果,有一种叫“刺 ...