-
-
判別分析
來(lái)源:默認(rèn)管理員點(diǎn)擊數(shù):343發(fā)布時(shí)間:2012-12-101 基本概念:判別分析(Discriminant Analysis)是根據(jù)觀測(cè)到的某些指標(biāo)對(duì)所研究的對(duì)象進(jìn)行分類的一種統(tǒng)計(jì)方法。進(jìn)行判別分析時(shí),通常是根據(jù)已掌握的一批分類明確的樣品建立判別函數(shù)、分類的規(guī)則,然后將待分類的樣品的實(shí)測(cè)值代入該函數(shù),求出其函數(shù)值,并據(jù)此作出判斷。按數(shù)學(xué)原理,判別分析分概率型、非概率型兩類方法。常用的判別分析方法主要包括:Bayes準(zhǔn)則下的判別分析、Fisher準(zhǔn)則下的判別分析。
2 基本原理
Bayes準(zhǔn)則:設(shè)有g(shù)個(gè)分類明確的總體π1,π2,πg,分別為x1,x2,…,xp 的多元正態(tài)分布。對(duì)于任何一個(gè)個(gè)體,若已知p個(gè)變量的觀察值,要求判斷該個(gè)體最可能屬于哪一個(gè)總體。在某一分類規(guī)則下,我們把實(shí)屬第i類的個(gè)體錯(cuò)分到第j類的概率記為P(j|i),這種錯(cuò)分造成的損失記為C(j|i)。那么,在這個(gè)判別分類規(guī)則下,實(shí)屬第i類個(gè)體錯(cuò)分到其他類別的總損失為
記第i類個(gè)體出現(xiàn)的概率為P(π1),從而這個(gè)判別分類規(guī)則錯(cuò)分的平均損失為
Bayes判別準(zhǔn)則是:平均損失最小化。按照這一準(zhǔn)則尋找判別分類的方法,稱為Bayes判別分析。
Fisher準(zhǔn)則:
對(duì)兩類判別,對(duì)任意一組常數(shù)(a1,a2,…an),構(gòu)造線性函數(shù),
Z=a1X1+a2X2+…+anXn
在條件
最大的原則下,獲得判別函數(shù)。
其中,
、
為兩組的Z得分, 為兩組Z得分方差的聯(lián)合估計(jì)。
對(duì)多類判別,尋找滿足矩陣方程
[B-λW]A=0
的系數(shù)矩陣。其中B為類別間的方差-協(xié)方差矩陣,W為類別內(nèi)的方差-協(xié)方差矩陣。
判別分析應(yīng)用示例
在一項(xiàng)市場(chǎng)細(xì)分研究中,經(jīng)過(guò)研究(如:聚類分析等),將被訪者分為3類,Bayes準(zhǔn)則下的判別函數(shù)為:
P1= -3.5+0.52 age+12.5vision+3.3at+0.036bv+0.564qpv
P2= -1.5+0.65 age+10.3vision+3.8at+0.022bv+0.415qpv
P3= -8.5+0.85 age+13.5vision+1.3at+0.006bv+0.612qpv
Fisher準(zhǔn)則下的判別函數(shù)為:
D1= -2.5+0.12 age+6.5vision+2.3at+0.12bv+0.35qpv
D2= -4.4+0.25 age+5.3vision+3.5at+0.05bv+0.65qpv
相應(yīng)的Territorial Map圖為: