廣西臻實項目數(shù)據(jù)分析師事務所特約分析師 陳虹堅/文
一、業(yè)務背景
交叉銷售是企業(yè)結(jié)合客戶需求,提高現(xiàn)有客戶客單價的一種營銷方式。實現(xiàn)交叉銷售對于企業(yè)而言意義非凡:一是使銷售行為更容易成功,將產(chǎn)品或服務推銷給一個現(xiàn)有客戶比推銷給新客戶更容易成功;二是使客戶忠誠度增加,經(jīng)濟學上的經(jīng)驗表明,持有兩項產(chǎn)品的客戶流失率為55%,而持有四種產(chǎn)品以上的客戶流失率幾乎為零;三是提升企業(yè)盈利能力,交叉銷售實現(xiàn)在提升銷售的同時降低新客戶獲取的成本,提高單個客戶的貢獻度,從而實現(xiàn)更高的盈利。
對于企業(yè)而言,實現(xiàn)交叉銷售,首先需要通過數(shù)據(jù)分析,發(fā)現(xiàn)哪些產(chǎn)品經(jīng)常被一起購買,進而可以對用戶進行推薦,更多時候,需要從海量的購買記錄中尋找交叉銷售的機會。Apriori算法作為最具影響力的挖掘關(guān)聯(lián)規(guī)則的算法,已經(jīng)被廣泛應用在零售、電信及網(wǎng)絡監(jiān)測等眾多領域,成為最經(jīng)典和常用的分析方法之一。
二、Apriori算法
Apriori算法是一種挖掘布爾關(guān)聯(lián)規(guī)則頻繁項集的算法,使用候選項集通過設定一些指標找出頻繁項集。項集是產(chǎn)品的任意組合,頻繁項集就是經(jīng)常被一起購買的產(chǎn)品組合,反映了大部分人的購買習慣。簡而言之,Apriori算法是要發(fā)現(xiàn)大部分客戶一起購買的產(chǎn)品A、B,建立A→B或B→A的關(guān)系式。
布爾運算(Boolean)通過對兩個以上的物體進行并集、差集、交集的運算,從而得到新的物體形態(tài)。算法的基本思想如下:
1.如果一個項集不是頻繁項集,那么任何包含它的項集也一定不是頻繁項集。也就是說,同時購買產(chǎn)品A和B的人很少,那么同時購買A、B和C的人就更少了。
2.如果一個項集是頻繁項集,那么它的任何子集也是頻繁項集,也就是說,購買A、B和C的人多,那么購買A和B的人就更多了。
三、Apriori算法的主要指標
Apriori算法有5個關(guān)鍵指標:項集/頻繁項集、支持度、置信度、提升度、強關(guān)聯(lián)規(guī)則。
指標1、項集/頻繁項集
項集是所有產(chǎn)品及其任意組合,一個項即為一個產(chǎn)品或者組合,在多數(shù)客戶的訂單中頻繁出現(xiàn)的那些項就是頻繁項集。
指標2、支持度
根據(jù)項在全部客戶記錄中出現(xiàn)的頻率,可稱為支持度。支持度體現(xiàn)了關(guān)聯(lián)規(guī)則的普遍性。
指標3、置信度
對于那些經(jīng)常被一起購買的產(chǎn)品,他們之間存在較強的關(guān)聯(lián)性,怎么定義關(guān)系的強弱,就涉及到置信度指標。
置信度是指客戶在持有一個產(chǎn)品(或者一組產(chǎn)品)的前提下,還持有其他產(chǎn)品的概率,置信度體現(xiàn)關(guān)聯(lián)規(guī)則的可靠性。
指標4、提升度
滿足條件的事件,相比不滿足條件的事件,發(fā)生增加的可能性。計算公式:Lift(A→B)=CONF(A→B)/SUPP(B)
指標5、強關(guān)聯(lián)規(guī)則
諸如A→B,購買A的情況下又購買B的事件,稱為關(guān)聯(lián)規(guī)則。其中,滿足最小支持度閥值和最小置信度閥值的關(guān)聯(lián)規(guī)則稱為強關(guān)聯(lián)規(guī)則,規(guī)則即普遍又可靠。
四、Apriori算法的基本步驟
Apriori算法主要包括以下幾個步驟:
1.數(shù)據(jù)輸入:按照格式要求準備數(shù)據(jù),一般包含用戶ID和產(chǎn)品名稱兩個字段??赏瑫r設定支持度閥值、置信度閥值。
2.生成項值:根據(jù)出現(xiàn)的全部產(chǎn)品,生成全體項集。
3.計算項集的支持度:針對每個項,分別計算支持度,同時去除小于支持度閥值的項,得到頻繁項集。
4.計算關(guān)聯(lián)規(guī)則的置信度:針對頻繁項集,建立諸如A→B的全部關(guān)聯(lián)規(guī)則,計算置信度,同時去除小于最小置信度閥值的規(guī)則。
5.將強關(guān)聯(lián)規(guī)則直觀展示出來。
6.規(guī)則分析:從業(yè)務角度出發(fā),分析規(guī)則的實際意義,提取具有現(xiàn)實指導意義的關(guān)聯(lián)規(guī)則。
五、SAS實現(xiàn)
SAS EM有專門的關(guān)聯(lián)規(guī)則挖掘模塊,可以交互式操作。一般包括三段代碼:
STEP1:為建模創(chuàng)建事物數(shù)據(jù)庫,即為分析準備一個虛擬環(huán)境,不產(chǎn)生分析結(jié)果。
STEP2:用于生成項集并根據(jù)支持度閥值得到頻繁項集,當產(chǎn)品項很多時,運算量會較大。頻繁項集輸出到列表ASC_RESULT中。
STEP3:利用頻繁項集構(gòu)造滿足最小置信度閥值的強關(guān)聯(lián)規(guī)則,并直觀展示出來,輸出到列表RLA_RULES中。
部分代碼清單如下:
PROC DMDB
DATA=Asso_Datsrc
OUT=_null_
DMDBCAT=Tmp2;
ID Csr_Id;
CLASS Prod;
TARGET Prod;
RUN;
PROC ASSOC
DMDBCAT=TMP2
DATA=Assoc_Datsrc
OUT=Asc_Result
PCTSUP=10
ITEMS=4;
CUSTOMER Car_Id;
TARGET Prod;
QUIT;
PROC RULEGEN
IN=Asc_Result
OUT=Rla_Rules
MINCONF=60;
QUIT;
備注:
1.廣西臻實項目數(shù)據(jù)分析師事務所業(yè)務范圍:
●投資項目評估、經(jīng)濟效益評價、項目數(shù)據(jù)處理、項目融資、投資項目策劃、社會經(jīng)濟咨詢等。
●專業(yè)項目數(shù)據(jù)分析評估:為眾多投資人提供專業(yè)項目分析服務,減少投資風險;
●撰寫項目數(shù)據(jù)分析報告:為項目方編寫項目數(shù)據(jù)分析報告;
●提供融資服務:項目融資與項目分析工作緊密相連,是項目分析工作價值的體現(xiàn);
●項目理財策劃:項目運營的關(guān)健是現(xiàn)金流,是數(shù)據(jù)真實的體現(xiàn), CPDA重要的工作是對未來運營情況的判…
2.廣西數(shù)據(jù)分析師探討交流QQ群:117268053
3.業(yè)務咨詢電話:0771-5862703/18978862530 韋勛峰經(jīng)理
(聲明:文章來源于網(wǎng)絡,不代表本站觀點及立場,版權(quán)歸原作者所有,若有侵權(quán)或異議請聯(lián)系更正或刪除)