更新時(shí)間:2023-01-07 15:06:07作者:佚名
一直存在一個(gè)理解誤區(qū),單純的以為從事數(shù)據(jù)分析,學(xué)會(huì)Python,SQL就行了,認(rèn)為數(shù)據(jù)分析和編程一樣,盡可能的熟練使用這些語(yǔ)言就足夠了,直到真正上手開始分析時(shí),我懵圈了,拿到數(shù)據(jù)之后完全不知道要做什么,再好的編程技能也用不上。所以我不得不從頭開始,了解數(shù)據(jù)分析的流程。
分析方法之于數(shù)據(jù)分析,就如設(shè)計(jì)圖對(duì)于蓋房子一樣重要。分析方法能將零散的想法轉(zhuǎn)化為有條理的思路。那么常見的分析方法有哪些呢?
1 邏輯樹分析法,分析目的:將復(fù)雜的問題簡(jiǎn)單化。
圖1 邏輯樹分析方法的思路
最具代表性的就是費(fèi)米問題,這類問題的特點(diǎn)是初次聽到時(shí),會(huì)覺得已知條件太少,離答案太遠(yuǎn),但是當(dāng)變通分析對(duì)象之后,所有問題都會(huì)迎刃而解。具體解釋參見百度百科,里面還補(bǔ)充了具體案例加深理解。
2 PEST分析法,分析目的:行業(yè)分析。
有些業(yè)務(wù)可以從以下4個(gè)角度為切入點(diǎn)進(jìn)行分析。
圖2 PEST字母代指3 多維度拆解分析法,分析目的:多個(gè)角度思考。
該方法將業(yè)務(wù)分為不同的維度,比如七大姑介紹了相親對(duì)象給你,據(jù)說(shuō)男方個(gè)子高(維度1),家庭背景好(維度2),長(zhǎng)得帥(維度3)。這樣就把一個(gè)未曾謀面的人從不用維度“拆解”,方便了解。
那么業(yè)務(wù)究竟該從哪些維度去拆解呢?
從指標(biāo)構(gòu)成和業(yè)務(wù)流程。比如:
圖3 線上店鋪查看推廣效果如何的維度拆解
注意:多維度拆解分析法有一個(gè)獨(dú)特之處,叫做辛普森悖論,如從整體和部分考察數(shù)據(jù)可能會(huì)有完全相反的結(jié)論,具體解釋參考百科。
圖4 多維度拆解分析方法總結(jié)4 對(duì)比分析法,分析目的:對(duì)比。
俗話說(shuō),沒有對(duì)比就沒有傷害,對(duì)比要有比較的對(duì)象。對(duì)比問題本質(zhì)上是指現(xiàn)狀與理想狀態(tài)之前的差距,如果理想的狀態(tài)未知,就無(wú)法比較,進(jìn)而無(wú)法確定問題。
圖5 對(duì)比找對(duì)象定基準(zhǔn)
圖6 對(duì)比分析思路總結(jié)5 假設(shè)檢驗(yàn)分析法,分析目的:如何解決業(yè)務(wù)問題。
圖7 假設(shè)檢驗(yàn)分析步驟
假設(shè)分析的參考方向:
其中:
圖8 4p營(yíng)銷理論
圖9 業(yè)務(wù)流程方向
注意事項(xiàng):
圖10 假設(shè)檢驗(yàn)分析思路圖6 相關(guān)關(guān)系分析法,分析目的:數(shù)據(jù)之間的關(guān)系。
相關(guān)關(guān)系是研究2種或2種以上數(shù)據(jù)之間存在什么關(guān)系的方法,用相關(guān)系數(shù)( r )表示, r 的大小表示相關(guān)程度,正負(fù)表示變量的相關(guān)方向, \left| r\right|\leq1 , \left| r \right|=1 時(shí)相關(guān)性最大。
圖11 相關(guān)分析解決問題的模式
相關(guān)分析如何用?
相關(guān)系數(shù);散點(diǎn)圖;哪些因素和分析目標(biāo)相關(guān);結(jié)合其他分析方法深入分析;比如,假設(shè)檢驗(yàn)分析法最后找出幾條原因,但是一般公司資源有限,一個(gè)階段中只能集中解決一個(gè)問題,這時(shí)候就可以通過(guò)相關(guān)分析法來(lái)確定優(yōu)先解決哪些影響大的因素。
但是,要區(qū)分因果關(guān)系和相關(guān)關(guān)系。有的問題直接應(yīng)用相關(guān)關(guān)系解釋,有些問題需要找到事件背后的原因(因果關(guān)系),因?yàn)橛袝r(shí)會(huì)存在第3方因素或純屬巧合。
如何區(qū)分呢?單變量控制法。
7 群組分析法,分析目的:對(duì)數(shù)據(jù)分組,分析留存(流失)問題
按照某個(gè)特征,將數(shù)據(jù)分為不同的組,然后比較各組的數(shù)據(jù)。
群組分析解決問題的模式:
群組分析找到留存率高(低)的組;假設(shè)檢驗(yàn),相關(guān)分析等分析方法分析為什么留存率高(低);
要根據(jù)業(yè)務(wù)靈活分組,比如視頻類會(huì)員按月分組分析留存率,微博、推特類APP按某月使用產(chǎn)品的天數(shù)分組等等。
8 RFM分析方法
RFM三個(gè)指標(biāo)含義
把3個(gè)指標(biāo)按價(jià)值從低到高排序,3個(gè)指標(biāo)分別作為三維坐標(biāo)系的XYZ軸,把空間分為8部分,對(duì)應(yīng)下圖。
3指標(biāo)對(duì)應(yīng)3維圖
如果覺得上面的圖看起來(lái)不直觀,可直接看下面的用戶分類規(guī)則表。RFM分析法把用戶分為8類,可以對(duì)不同價(jià)值用戶使用不同的營(yíng)銷策略,最大化發(fā)揮有限的資源,也就是所謂的“精細(xì)化運(yùn)營(yíng)”。
用戶分類規(guī)則表
那么如何用RFM對(duì)用戶分類呢?
1)計(jì)算R、F、M值;
要得到這3個(gè)指標(biāo),一般需要數(shù)據(jù)的3個(gè)字段:用戶ID或者用戶名稱、消費(fèi)時(shí)間和消費(fèi)金額。
根據(jù)原始數(shù)據(jù)計(jì)算出的R、F、M值示例
2)給R、F、M按價(jià)值打分;
注意!這里的打分是按指標(biāo)的價(jià)值打分,而不是按指標(biāo)數(shù)值大小打分,R越小,F(xiàn)越大,M越大,相對(duì)應(yīng)的用戶價(jià)值越高。具體實(shí)際業(yè)務(wù)中,如何定義打分的范圍,要根據(jù)具體的業(yè)務(wù)靈活制定,沒有統(tǒng)一的標(biāo)準(zhǔn)。
打分規(guī)則舉例
3)計(jì)算價(jià)值平均值;
分別計(jì)算出R值打分、F值打分、M值打分這3列的平均值。
價(jià)值平均值
4)用戶分類;
在表格中增加3列案例分析報(bào)告,分別記錄R、F、M值是高于平均值還是低于平均值。如果低于平均值,記為“高”,否則記為“低”。最后和用戶分類表里定義的規(guī)則進(jìn)行比較,就可以得出用戶屬于哪種類別。
用RFM分析法對(duì)用戶分類步驟總結(jié):
回頭看前面的分類圖,在坐標(biāo)軸的中心,可以理解為某個(gè)指標(biāo)價(jià)值的平均值。
用戶分類后,如何精細(xì)化運(yùn)營(yíng)呢?
對(duì)用戶分類就是針對(duì)每類用戶指定不同的運(yùn)營(yíng)策略,具體公司業(yè)務(wù)不同,方法也不一樣。這里舉例說(shuō)明前4類用戶:
使用RFM分析法的注意事項(xiàng):
不同業(yè)務(wù)的R、F、M指標(biāo)定義不同,要根據(jù)具體業(yè)務(wù)靈活應(yīng)用;好比開車的車速控制在哪個(gè)范圍是根據(jù)路況靈活把握的。同樣的,RFM打分規(guī)則可與業(yè)務(wù)部門溝通,或者使用聚類方法對(duì)R、F、M值進(jìn)行分類,再給每個(gè)類別打分;9 漏斗分析方法
從業(yè)務(wù)流程起點(diǎn)開始到最后目標(biāo)完成,中間的每個(gè)環(huán)節(jié)都會(huì)有用戶流失,因此需要一種分析方法來(lái)衡量業(yè)務(wù)流程每一步的轉(zhuǎn)化效率。比如,淘寶用戶從瀏覽到最后下單經(jīng)歷的業(yè)務(wù)流程是:一款商品瀏覽量1000、點(diǎn)擊量500、訂單量200、支付量50。
某業(yè)務(wù)環(huán)節(jié)轉(zhuǎn)化率=本業(yè)務(wù)環(huán)節(jié)用戶數(shù)/上一業(yè)務(wù)環(huán)節(jié)用戶數(shù),可以衡量相鄰業(yè)務(wù)環(huán)節(jié)的轉(zhuǎn)化情況。比如業(yè)務(wù)第1環(huán)節(jié)是瀏覽,第2環(huán)節(jié)是點(diǎn)擊,則點(diǎn)擊量環(huán)節(jié)轉(zhuǎn)化率為:點(diǎn)擊量(500)/瀏覽量(1000)=50%。
某業(yè)務(wù)環(huán)節(jié)整體轉(zhuǎn)化率=某業(yè)務(wù)環(huán)節(jié)用戶數(shù)/第1業(yè)務(wù)環(huán)節(jié)數(shù)量,衡量從第1步到該環(huán)節(jié)為止,總體的轉(zhuǎn)化情況。如第1環(huán)節(jié)是瀏覽量1000,支付環(huán)節(jié)的整天轉(zhuǎn)化率=支付量(50)/瀏覽量(1000)=5%。
漏斗分析圖,來(lái)源于它的形狀像漏斗,所以叫“漏斗圖”。
漏斗分析的作用是:定位問題節(jié)點(diǎn),找出存在問題的業(yè)務(wù)環(huán)節(jié)。漏斗分析常用于用戶轉(zhuǎn)化分析或者用戶流失分析,所以有兩個(gè)需關(guān)注的指標(biāo):用戶轉(zhuǎn)化和用戶流失。
使用漏斗分析的注意事項(xiàng):
可以用漏斗分析方法分析用戶轉(zhuǎn)化問題,不同行業(yè)的業(yè)務(wù)流程不一樣,所以漏斗分析圖也不一樣。如果把漏斗分析方法原封不動(dòng)地帶入某個(gè)行業(yè),不去結(jié)合所在行業(yè)的業(yè)務(wù)特點(diǎn),那么分析出的結(jié)果很難具有業(yè)務(wù)指導(dǎo)性。
比如,傳統(tǒng)的漏斗圖以AARRR模型為基礎(chǔ),即:獲客--留存--活躍--變現(xiàn)--推薦,這是以用戶增長(zhǎng)為核心的漏斗圖,但是對(duì)于非社區(qū)類產(chǎn)品,比如低頻且成交周期長(zhǎng)的購(gòu)車場(chǎng)景而言,傳統(tǒng)的AARRR模型無(wú)法真正表達(dá)出汽車行業(yè)的業(yè)務(wù)需求。需將漏斗分析法和購(gòu)車的業(yè)務(wù)流程結(jié)合起來(lái),形成:線索--進(jìn)件--過(guò)審--簽約--交車的漏斗圖。所以,行業(yè)發(fā)生變化的過(guò)程中,漏斗分析需要從用戶增長(zhǎng)轉(zhuǎn)移到汽車行業(yè),這樣的漏斗分析才可以產(chǎn)生指導(dǎo)作用。
10 杜邦分析方法
杜邦分析法將各種財(cái)務(wù)指標(biāo)綜合在一起,評(píng)價(jià)公司財(cái)務(wù)管理效果,通常用于公司財(cái)務(wù)方面的分析。
結(jié)合案例應(yīng)用理解:
假如你想開家面館,自己出資10萬(wàn),找親戚借了10萬(wàn),那么面館的總資產(chǎn)是20萬(wàn):其他投入10萬(wàn)(自己的錢)+面館負(fù)債10萬(wàn)(找親戚借的)。
1)銷售凈利潤(rùn):面館是否賺錢?
銷售凈利潤(rùn)=凈利潤(rùn)/銷售額。假如面館第一個(gè)月銷售額5萬(wàn),刨除其他成本后凈利潤(rùn)1萬(wàn),那么銷售凈利潤(rùn)=1/5=20%,就是每賣出100塊的面,能賺20元。
2)總資產(chǎn)周轉(zhuǎn)率:面館資產(chǎn)運(yùn)營(yíng)效率如何?
資產(chǎn)周轉(zhuǎn)率=銷售額總資產(chǎn),面館總資產(chǎn)20萬(wàn),第一個(gè)月銷售額5萬(wàn),資產(chǎn)周轉(zhuǎn)率=5/20=25%。
3)權(quán)益乘數(shù):面館債務(wù)負(fù)擔(dān)有沒有風(fēng)險(xiǎn)?
權(quán)益乘數(shù)=總資產(chǎn)/凈資產(chǎn),也叫做杠桿率,衡量公司負(fù)債經(jīng)營(yíng)情況。面館總資產(chǎn)20萬(wàn),自己出資10萬(wàn),則面館的權(quán)益乘數(shù)=20/10=2。
帶入杜邦分析公式:凈資產(chǎn)收益率=銷售利潤(rùn)率*資產(chǎn)周轉(zhuǎn)率*權(quán)益乘數(shù),所以,面館的凈資產(chǎn)收益率=20%*25%*2=10%。
當(dāng)要分析企業(yè)為什么利潤(rùn)下降了類似財(cái)務(wù)問題,可以用杜邦分析法逐個(gè)分解指標(biāo)來(lái)分析,下圖為萬(wàn)科2018年9月份的杜邦分析。
總結(jié)完分析方法,來(lái)捋一下數(shù)據(jù)分析解決問題的過(guò)程。
圖12 數(shù)據(jù)分析解決問題的過(guò)程
(1)明確問題。
通過(guò)觀察把問題定義清楚,這一步需要明確數(shù)據(jù)來(lái)源和準(zhǔn)確性,并對(duì)業(yè)務(wù)指標(biāo)進(jìn)行理解。
確認(rèn)偏誤:定義問題時(shí)已經(jīng)包括了“原因”,根據(jù)經(jīng)驗(yàn)主觀的把思考局限在“我覺得”的范圍內(nèi)。人們總傾向于尋找證據(jù)來(lái)支持自己已經(jīng)相信的事情,從而抵制不同的看法。要時(shí)刻清晰地提醒自己:數(shù)據(jù)分析不是主觀的臆斷,而是客觀的分析,一切靠數(shù)據(jù)說(shuō)話。
圖13 明確問題流程
(2)分析原因。
影響問題的原因有很多種,若把所有原因都分析一遍,工作量很大。根據(jù)“計(jì)算的平方律”,當(dāng)一個(gè)問題要考慮的因素復(fù)雜度變?yōu)樵瓉?lái)的2倍,對(duì)應(yīng)解決問題需要的時(shí)間會(huì)變成原來(lái)的4倍。所以分析原因時(shí),要優(yōu)先分析關(guān)鍵的因素(分主次)。
3步分析法:
①使用“多維度拆解分析法”對(duì)問題進(jìn)行拆解,將一個(gè)復(fù)雜問題細(xì)化為各個(gè)子問題,可以按照用戶、產(chǎn)品、競(jìng)品3個(gè)維度拆解;
圖14 可參考拆解維度
②對(duì)拆解的每個(gè)部分,使用“假設(shè)檢驗(yàn)分析法”找出問題,分析過(guò)程中可使用“對(duì)比分析法”等多個(gè)分析法輔助完成;
③找到問題以后,多問自己“為什么出現(xiàn)了這個(gè)問題”,然后使用“相關(guān)分析方法”進(jìn)行深入分析;
(3)決策。
分析出原因并不是終點(diǎn),還要提出建議,盡善盡美。
小試牛刀,列出自己的分析思路,嘗試對(duì)淘寶嬰兒用品的銷售情況進(jìn)行分析。
簡(jiǎn)要介紹一下數(shù)據(jù)集,數(shù)據(jù)集中有兩個(gè)表格,分別為表1購(gòu)買商品,表2嬰兒信息,圖15是表中各列的含義。
圖15 表字段理解
具體的數(shù)據(jù)清洗操作可查閱下面的文章。
下面的文章是對(duì)嬰兒商品銷售情況的簡(jiǎn)單可視化分析,僅供參考。
一、明確問題
①明確數(shù)據(jù)來(lái)源和準(zhǔn)確性
②業(yè)務(wù)指標(biāo)理解
產(chǎn)品角度
a 總銷量波動(dòng)情況
b 熱銷產(chǎn)品是哪個(gè)
用戶角度
a 不同性別對(duì)商品類別的需求
b 不同年齡段對(duì)商品類別的需求
圖16 分析思路腦圖二、分析原因
(一) 產(chǎn)品角度
1 總銷量波動(dòng)情況
圖17 不同年份月銷量統(tǒng)計(jì)圖
在圖17中,紅色代表銷量最高的月份,分別是12年11月,13年5月,11月,14年5月,11月。黃色代表銷量最低的月份,分別是13年2月,14年1月,15年2月。
5月,11月銷量高,1月,2月銷量低,四年都是這種情況,這是為什么呢?
先使用多維度拆解分析法,對(duì)總銷量進(jìn)行拆解,總銷量=平均單次購(gòu)買量*購(gòu)買次數(shù),再用假設(shè)檢驗(yàn)分析法逐個(gè)驗(yàn)證是平均單次購(gòu)買量還是購(gòu)買次數(shù)影響了總銷量。
假設(shè)1:用戶單次購(gòu)買量影響總銷量,即用戶在5月和11月單次購(gòu)買量增多,在1月,2月反而下降。
圖18 月平均購(gòu)買量趨勢(shì)圖
如圖18,月平均購(gòu)買量波動(dòng)很小,基本在1.5-2之間,所以總銷量的波動(dòng)不是單次購(gòu)買量引起的,假設(shè)1不成立。
假設(shè)2:購(gòu)買次數(shù)影響總銷量。
圖19 購(gòu)買數(shù)量和次數(shù)的趨勢(shì)圖
圖20 購(gòu)買數(shù)量和次數(shù)的散點(diǎn)圖
圖19中購(gòu)買數(shù)量和購(gòu)買次數(shù)的趨勢(shì)一致,圖20中的散點(diǎn)圖更進(jìn)一步證明購(gòu)買數(shù)量和次數(shù)的正相關(guān)關(guān)系,而且相關(guān)系數(shù)接近1,為強(qiáng)相關(guān)。假設(shè)2成立。
圖21 假設(shè)檢驗(yàn)方法流程
由圖19可以看出,購(gòu)買次數(shù)的峰值在5月和11月,2月最低,因?yàn)榧僭O(shè)2成立,總銷量的波動(dòng)和購(gòu)買次數(shù)有關(guān),所以可以直接分析購(gòu)買次數(shù)的波動(dòng)原因。
分析11月份購(gòu)買次數(shù)增加的原因。
圖22 2012-2014年11月份購(gòu)買次數(shù)折線圖
圖22顯示,每年的11月11日購(gòu)買次數(shù)激增,當(dāng)天的購(gòu)買次數(shù)遠(yuǎn)超當(dāng)月其他天,并且2012-2014年雙十一當(dāng)天的購(gòu)買次數(shù)一直在漲幅狀態(tài)。聯(lián)想到著名的雙十一大戰(zhàn),11月份銷量高峰合乎情理。
同樣將2013-2014年5月份每天的購(gòu)買次數(shù)可視化,得到圖23。
圖23 2013年,2014年5月份購(gòu)買次數(shù)折線圖
圖23中,兩個(gè)年份5月的購(gòu)買次數(shù)趨勢(shì)基本一致,5月份節(jié)日較多,包括5月11日和5月12日的母親節(jié)促銷,5月20日網(wǎng)絡(luò)情人節(jié),以及兒童節(jié)的提前預(yù)熱。
接下來(lái)分析每年1,2月份購(gòu)買次數(shù)下降的原因。
圖24 2013年,2014年,2015年1,2月份購(gòu)買次數(shù)折線圖
查閱日歷得知,2013年春節(jié)是2月10日,2014年春節(jié)是1月31日,春節(jié)期間,物流停運(yùn),公司放假,購(gòu)買次數(shù)減少。2015年春節(jié)是2月19日,數(shù)據(jù)集中2015年不完整,可以合理預(yù)計(jì)2月19日的購(gòu)買次數(shù)也是最低點(diǎn)。
對(duì)購(gòu)買次數(shù)指標(biāo)再次拆解,購(gòu)買次數(shù)包含新用戶購(gòu)買次數(shù)和老用戶購(gòu)買次數(shù)。因?yàn)閿?shù)據(jù)有限,假設(shè)第一次出現(xiàn)的用戶id為新用戶,第二次及之后出現(xiàn)的為老用戶,則:
圖25 新老用戶購(gòu)買次數(shù)統(tǒng)計(jì)
可以看出,老用戶占比極低,所以對(duì)應(yīng)的復(fù)購(gòu)率就低,具體原因需要結(jié)合更多的信息判斷。
2 熱銷產(chǎn)品
圖26 商品一級(jí)分類銷售占比
圖27 商品二級(jí)分類銷量前十
商品一級(jí)分類中28,50008168和50014815銷量最好,三者占比為82.02%,占據(jù)了主要的市場(chǎng)。商品二級(jí)分類中銷量呈階梯式下降,銷量第一的50018831占比5.34%。
(二)用戶角度
1 不同性別對(duì)商品需求的差異
圖28 不同性別商品購(gòu)買量占比
已知性別的數(shù)據(jù)占比較少,所以此項(xiàng)分析僅供參考。在已知性別的929名用戶中案例分析報(bào)告,男性共428位,女性491位,接近1:1。但是圖28顯示男女嬰兒購(gòu)買商品數(shù)量比約為2:3,說(shuō)明用戶中女嬰兒占比高,比男嬰兒多20%。
圖29 不同性別選擇商品的不同
圖30 每種商品男女選擇占比
由圖29,30可得,男女用戶均主要集中選購(gòu)的商品為:50014815、50008168和28。6種商品中,50014815和38商品女性購(gòu)買者比男性多40%。
2 不同年齡段對(duì)商品需求的差異
圖31 六類商品在不同年齡段的銷量
圖32 同一年齡段6類商品需求占比
未出生和0-3歲階段是嬰兒需求量最大的兩個(gè)階段,其中0-3歲年齡段銷量最大,50014815在未出生和0-3歲都是最受歡迎的,不同年齡段6種商品銷量排行均不同,說(shuō)明不同年齡段的需求是不同的。
5008168對(duì)于4個(gè)年齡段都是需求極大的商品,并且隨著年齡的增大,銷量占比也越來(lái)越大,與之相反的是50022520,未出生時(shí)需求最大。
三、提出建議商品總銷量和購(gòu)買次數(shù)有關(guān),而購(gòu)買用戶中老用戶占比極少,如果商品不是耐用品,商家應(yīng)該考慮是什么原因?qū)е碌模⒓右愿倪M(jìn)。不同年齡的嬰兒主推產(chǎn)品要有所側(cè)重,找準(zhǔn)目標(biāo)群體,比如0-3歲主推50014815,4-12歲推售50008168;女性嬰兒在產(chǎn)品需求上比男性更高,可加強(qiáng)50014815和38產(chǎn)品對(duì)女性嬰兒的宣傳力度;在活動(dòng)期間,可以設(shè)置套餐,將熱銷產(chǎn)品捆綁或者一個(gè)熱銷產(chǎn)品贈(zèng)送一個(gè)冷門產(chǎn)品出售,又或者將相鄰年齡段的產(chǎn)品搭配出售。法定節(jié)假日及電商節(jié)要把握銷量高峰的時(shí)機(jī),平時(shí)也可借鑒推出不同的活動(dòng),刺激消費(fèi)。
End.
參考費(fèi)米問題%E8%B4%B9%E7%B1%B3%E9%97%AE%E9%A2%98/5100727?fr=aladdin辛普森悖論%E8%BE%9B%E6%99%AE%E6%A3%AE%E6%82%96%E8%AE%BA/4475862?fr=aladdin
2023-01-07 15:04
2023-01-07 14:06
2023-01-07 14:06
2023-01-07 10:01
2023-01-07 10:00