一、分析背景
房子一直作為老生常談的話題,貼近民心。隨著社會的發展,政策的開放,貴陽市的房價也水漲船高,從2017年下半年的5000元均價漲到瞭2018年的10000元左右。當年沒有咬咬牙、勒緊褲腰帶買房的小夥伴們可以說是腸子都悔青瞭。由於土地資源減少,新建樓盤逐漸偏遠化的,考慮教育、醫療、交通等多方面因素,有時候二手房不失為一種更好的選擇。本案從戶型、面積、所在區域、價格等多個維度來分析貴陽市二手房的情況。
二、數據獲取
使用爬蟲爬取58同城貴陽二手房的全部70頁房源信息,包含房源標題、戶型、面積、朝向、售價、所在區域、樓盤等字段,共3518條數據(不含列名)。
三、數據預處理(清洗)
1、 使用Excel定位功能查找,確定不存在缺失值。
2、 所在區域觀山湖區和金陽新區實質上同為一個行政區域,使用Excel替換功能統一為觀山湖區。“其它”區域查看後均為雙龍新區,進行更名。
3、 使用Excel分裂功能將面積字段進行分裂,去掉單位“㎡”,同時轉換為數字型格式。
4、 數據要排除同一套房源被不同經紀公司重復發佈的情況,不能單純以房源標題進行重復值查詢處理。添加一列輔助列,使用Excel的“&”函數聯結戶型、面積、朝向、樓層、樓盤、所在區域幾個字段,然後進行重復值查詢,刪除重復值,剩餘2536條數據(不含列名)。
5、 將文本格式的總價轉換為數字格式。
6、 將位置屬性一列進行分裂處理,保留周邊是否具有地鐵站一條信息。
然後以1表示周邊具有地鐵站,0表示沒有。(IF函數)
7、 異常值處理,查找名稱中帶有商鋪的數據,進行刪除,按銷售總價降序排序。
8、 最後將列名轉換為字母格式,便於後期在MYSQL環境下的命令編寫。
房源標題,name
戶型,house type
面積,area
朝向,orientation
樓層,floor
小區樓盤,building
區域,district
地址,address
經紀公司,agency
經紀人,agent
總價,total price
單價,unit price
交通屬性(是否靠近地鐵站),subway station
四、分析過程
1、 將數據轉換為CSV格式,導入MYSQL中,共2528條數據。
2、 哪個行政區的二手房源最多,各個行政區二手房的均價分別是多少?
房源最多的區域前三名依次是:南明區(707套)、雲巖區(594套)、觀山湖區(469套)。
貴陽市二手房整體均價在9599元/㎡,雙龍區雖然以12714元/㎡高居榜首,但雙龍區僅14套房源且均為高端別墅,不在日常老百姓參考范圍內。
近年來觀山湖區發展強勁,二手房價已躍居為貴陽市第一,而老城區雲巖和南明位列二三位。由此也可以看出貴陽市發展規劃形成的結構是雙核發展,多組團並進。
此圖來自知乎網友大胡子說房
值得一提的是南明區房源共707套,其中貴陽市最大的棚戶區改造項目-花果園僅一個樓盤就有369套,均價為8386元/㎡,低於南明區均價,不考慮其他因素看似性價比較高,可謂一個樓盤牽動著一個區域甚至一個城市的樓市發展。
3、 主力戶型及戶型面積占比分佈情況如何?
房源戶型最多的是3室2廳2衛,占比高達33%。不難理解,隨著二胎的開放,老百姓對房屋的需求已不再是一個安傢的窩而已。尤其是80後一代,正面臨著下有2小,上有4老的局面,對房間數量的需求可能會越來越多。
房源數量最多的面積為110至130平,其次是70至90平,再次是90至110平。符合客觀事實,過大或過小的房源都是比較難以銷售的。
770ca1c74942e7010b063bc646167c8f
主力銷售面積的房源數量(70-130㎡)占該區域總銷售房源數量比:雲巖區58%、南明區57%、觀山湖區55%。
排除雙龍新區主要在售別墅外,大於150平的房源主要集中在觀山湖,花溪以及烏當這三個地理位置較為偏遠地區,畢竟老城區周邊土地資源匱乏。而小於90平的房源主要集中在南明區,不用想也知道,主打小戶型以吸引各縣、地州市老百姓前往省會城市安傢的花果園“勞苦功高”,其在售369套房源中,面積小於90平的有233套,占比超過6成。
4、 是否靠近地鐵站口對二手房售價的影響?
546411153974e160e8f0e32d995480a6945e89c2c301554d6b2a4eb76565aa77
各區二手房源周邊具有地鐵站相比沒有地鐵站的房源銷售均價高8%,符合實際情況,如果有投資想法的朋友可以考慮購置在建或籌建地鐵站周邊的房產,額,這句好像是廢話,反正也沒錢。
5、以我個人為例,想要在蓮花坡附近(文昌北路、文昌南路、富水北路、富水南路、友誼路、護國路)購置一套至少2個衛生間的二手房,面積不低於100平方米。有多少房源適合我呢,該去找誰咨詢呢?
好瞭,我先去買彩票瞭,明天準備聯系中介去。