服裝是我們生活中必不可少的一種物品,而服裝產業本身也是一個占有很重要地位的產業。在這其中,女裝,尤其是少淑女裝在整體服裝銷售當中所占的比重相當大,我們可以看到在商場服裝區域所占最多位置最廣的就是少淑女裝區域,隨著電商產業的發展,越來越多的人選擇在網上來購買服裝,我們就以此為契機,來使用My SQL數據庫簡單分析一下淘寶少淑女裝銷售的情況。
介紹一下數據來源,數據源自集搜客(GooSeeker)爬取,內容為淘寶網少女裝默認排行前100頁數據,導出CSV格式,如下:
提出問題,我們此次分析的目的:
1、最暢銷的產品品牌(品名)是什麼?
2、哪個商傢的總銷量最大?
3、哪個價位的賣的最好一些?
4、哪個地區的商傢最多,以及銷售占比最大!
先對數據進行整理,這裡我們在EXCEL中進行,刪除不必要的列(在副本中操作),這裡我們僅保留品名,售價,銷量,商傢,地區這幾個字段列,並對數據進行適當清洗(銷量列)以便於分析,之後將數據導入MySQL,使用Navicat工具,代碼如下:
刷新後點開girl_wear1205表,然後導入數據:
找到需要處理的CSV文件,進行導入。這裡要註意導入時的編碼類型必須是UTF-8,為瞭避免出錯,最好提前對原始CSV文件編碼進行確認,方法為用記事本打開原始CSV格式保存,確保編碼選擇UTF-8。然後導入:
fb5d0d0f58b367b5145152cbacbee291
導入後查看,因為數據過長,我們限定查詢前20行數據,代碼如下所示:
顯示結果:
問題一:最暢銷的產品是什麼?
我們找出銷量SALES最多的商品列表,這裡限定5個,編寫代碼:
結果如下:
最暢銷的產品是一款名為黑牛奶品牌的韓版毛衣,另外銷量前五個全是來自廣東廣州的商傢,同時當中第一和第四都是來自同一個商傢(STORE)。
問題二:哪個商傢的總銷量最大?
這裡需要對商傢(STORE)及其銷量進行合並處理,然後對其銷量進行排序,同上我們限定前5個,編寫代碼:
結果如下:
從結果來看,名為鄭明忠2008的商傢銷量最大,並且其銷量遠大於第二位之後的商傢。
問題三:哪個價位的賣的好一點?
這裡我們對價位進行分類,將價位按每100元一個區間進行分類,大於0小於100元一組,100元至小於200元一組,200元至小於300元一組,300元至小於400元一組,400元至小於500元一級,500元及以上的分為一類,我們以此對銷量進行分類:
得出的結果如下:
bdc20064e9b5a66f05b73eaea7f0bd16
可以看到,100元內的銷售量最大,並且隨著價格的增加,銷量呈現一個遞減的趨勢,500元以上銷量很少。這一方面跟本身的客觀定律有關,越貴的東西買的人越多,但因為絕大多數銷售的價位在200元以下也從另一個角度說明瞭淘寶購物的群體上主要還是以選擇價格低的人群為主,如果想在淘寶上面做少女裝生意,還是應該把重點放在物美價廉的一類商品上,同時,買衣服 想“省錢”,淘寶仍然是一個比較好的選擇。
問題四之一:哪個地區的商傢最多?
編寫代碼:
在前面已經看到,商鋪有重復的情況,所以我們使用瞭DISTINCT來排除重復項,另外這裡我們隻取店鋪數量排名前十的數據,結果如下:
d696a94c3f89a734eda9fc38b6ac9d50
可以看到,地區店鋪數量排名前四當中,屬於廣東省的就占瞭三個,這說明瞭廣東服裝(少女裝)電商產業的整體發展在全國處於前列,其中廣州遙遙領先,這與廣東本身服裝產業的繁榮密不可分,另外杭州這方面也很亮眼,可能是因為淘寶總部位於杭州的原因,帶動瞭當地相關電商業務的發展,整體來看,前十地區有廣東 ,浙江,上海,江蘇,湖北,河南等省份,內地,尤其是西部地區這方面還相對落後。
問題四之二:哪個地區銷售占比最大?
從上面直觀感覺應該是廣州占比最大,實際上呢?還是通過查詢得出,我們同時將銷售金額列出,代碼如下:
我們將返回值限制為15行,於是得出結果:
沒錯,依然是廣州,貢獻瞭1612萬多的銷售額,銷售份額占比達到31.47%,同時看到從銷售額占比來看,杭州以1444萬多的銷售額,以及28.20%的銷售占比排名次席,結合上面杭州店鋪數量大大小於廣州的查詢結果,可以得出杭州單店的銷售額要遠大於廣州的,說明瞭杭州此類電商的綜合實力最強,總的來看,數據跟店鋪數量查詢結果相當,即廣東省淘寶少女裝銷售占比最大,超過瞭銷售額的半數,依然是當之無愧的龍頭!
上一篇
如果你不註意防范,患上類風濕性關節炎的風險就會增加。傢裡衣物總是晾不幹,被子濕漉漉的,地板和墻面滿是水跡,空氣中還有...