欧美性欲视频_国产一区正在_91久久精品国产91性色tv_精品动漫3D一区二区三区免费版_91精品久久久久久久_久久天天操

統計基礎

首頁 > > 統計基礎
  • 第4章 基本抽樣問題

    來源:默認管理員點擊數:1175發布時間:2012-12-18

      本章重點介紹的內容:

      l 掌握抽樣概念

      l 學習制定抽樣計劃的步驟

      l 明確隨機樣本與非隨機樣本的區別

      l 明確抽樣誤差和非抽樣的概念

      l 復習隨機抽樣法類型

      l 了解非隨機抽樣方法

      4.1 重要術語的定義

      4.1.1 總體與全域

      在抽樣領域,總體和全域是可以相互代替的。但在這里,我們將選用“總體”這個術語。總體或同質總體,是指能提供所需信息的人的全體。分析人員的首要任務是定義同質總體,這又經常涉及到對產品和服務目標市場的界定。

      舉例來說,一個研究人員正在為一種新型非處方感冒藥進行產品創意測試。他也許會認為同質總體包括每個人,因為每個人會有患感冒的可能性。即便如此,并非每個患者都會選擇這種非處方藥。在這種情況下,調查過程中的重要任務是確定哪些人是目標主體,這就要看感冒時他們是否選購或使用這種或多種品牌的藥。只有那些購或使用的人們,才應包括在同質總體內。

      為同質總體下定義是抽樣調查中關鍵的一步。為達到研究目的,究竟誰的觀點才是我們真正需要采納的呢?定義同質總體沒有一定之規,需要研究人員有良好的辯別和判斷能力。通常,對于總體的定義是常常基于已有的和潛在的顧客的特征。

      4.1.2 抽樣與普查

      普查這一概念用于描述獲取同質總體中每個成員的信息。市場調研中并不經常用到普查,因為其同質總體一般情況下包括成千上萬的個體,這樣大規模地進行普查在成本和時間上的耗費都是巨大的,以致于在通常情況下是不可行的。

      事實已不止一次地證明:一個相對較小、但精心選擇的樣本能準確地反映出所抽查的總體的特征。一個樣本是總體所有成員的一個子集。從總體中子集獲得的有關信息,可以用來估測總體的特征。理想的情況是,子集能夠代表總體的各個部分。

      盡管市場調查中很少用到普查,但是有時它們也適用于某些案例。譬如,在工業產品營銷中,一個企業只向少量客戶銷售極為特殊的產品。這時,普查則是適當和可行的,有可能從整個總體獲取信息。盡管普查可能很具有吸引力(因為一般認為普查與抽樣相比具有更大的準確性),但有時并非如此。例如,做人口普查時,試圖從總體每個成員中獲取信息事實上存在很多障礙。我們不能取得總體中每個成員完整、準確的資料,或許總體中某些成員會拒絕提供信息,考慮到這些障礙,即使涉及的總體規模較小,也很難進行普查。你也許讀到或曾聽到過美國人口普查中存在的問題。

      4.2 制定抽樣計劃的步驟

      開發一個具有可操作性的樣本計劃大致需要7個步驟,圖4.1。下面詳細討論這些步驟。

      4.2.1 定義同質總體

      為了滿足研究目的的需要,必須詳細說明可提供信息或所需信息有關的個體或實體(譬如公司、商店等)所具有的特性。同質總體可以從以下幾方面進行描述:地域特征、人口統計學的特征、產品或服務使用情況、認知程度等。在調查中,從調查表開始部分的過濾性問題,可以看出某個體是否屬于同質總體。即使有總體和樣本清單,仍有必要使用過濾性問題識別合格的應答者。

      另外,為了確定總體包括哪些人,通常情況下,重要的是確定那些應排除在外的人的特征。例如,大部分商業市場調查就因為一些所謂的安全性問題而排除某些個本。通常,問卷調查表上的第一個問題就是詢問采訪對象或其家庭成員是否從事市場研究、廣告或生產與調查內容有關產品的工作。如果采訪對象指出他們從事某項工作,那么就不必要去采訪他了。這就所說的安全性問題,因為這樣的采訪對象不保險。他們也許是競爭對手或為競爭對手服務的,所以,我們不能給予他們關于我們打算干什么的暗示。

      此外,排除某些個體還有其他原因。譬如,可口可樂公司就寧愿采訪一些一周內飲用5瓶或5瓶以上各種包裝飲料的人,而不愿采訪一些只喝可口可樂的人。因為公司要加深對這些不喝可口可樂而喝軟飲料的人的了解。因此,就會排除那些過去一周內經常喝可口可樂的人。

      4.2.2 選擇資料收集方法

      資料收集方式對抽樣過程有著重要的影響。例如,電話采訪有一種內在優勢,購物中心攔截顧客有著自身的劣勢。

      4.2.3 選擇抽樣框

      在整個過程中的第三步就是確定抽樣框。以往,我們把抽樣框定義為總體的數據目錄或單位的名單,從中可以抽出樣本單位。理想的情況是,我們有一個完整和準確的名單。遺憾的是,通常這樣的名單是不存在的。例如,在一項調查中,調查總體是那些在近30天內打三輪或三輪以上十八洞高爾夫球的人。但是,根本就沒有一種計算方法可以完全提供這份名單。在不存在傳統意義上的抽樣框的情況下,我們需要依據能夠產生具有希望特征的樣本個體的程序來反映抽樣框。例如,電話號碼本就可能是電話調查的框架。這個例子也予明了在抽樣框和同質總體間很少有極好的對應關系。在問卷中,同質總體很有可能是城市中的所有居民。但是,電話號碼本就不包括那此沒電話的居民和那此沒有公布他們號碼的居民。

      一些潛在的因素證明,公布電話的居民和不公開電話號碼的居民在一些重要的特征方面具有很大的區別。很明顯地,那些不主動提供電話號碼的居民很大可能是房客,居住在城市中心,最近剛搬家,或人口多,孩子小,收入低。在某產品的購買、擁有、使用方面,兩種類型的人具有很顯著的差別。

      在西部、大城市、非白人和18-34歲的人,不公布自己電話號碼的人一般是比較多的。這項發現已一系列的調查所證實。這個發現的意義很明顯,即當樣本單位是從電話調查中獲得時,還應該包括那些不公布電話號碼但是卻適合采訪的城市居民。在這種情況下,可以使用一種程序來產生樣本的名單。隨機電話抽取就是隨意抽取電話號碼來產生樣本名單。在抽樣領域,形成一個適當的抽樣框經常是調查者面臨的最有挑戰性的問題之一。

      4.2.4 選擇抽樣方法

      制定抽樣計劃的第四部是選擇抽樣方法。選擇哪種抽樣方法取決于研究目的、經濟實力、時間限制、欲調查問題的性質。可供選擇的重要抽樣方法可以分為兩大類:概率抽樣與非概率抽樣。每大類中又有許多可供選擇的具體方法。

      (1)概率抽樣

      概率抽樣指在總體中的每個單位都具有同等可能性被抽中。簡單隨機抽樣是一種眾所周知并廣為使用的概率抽樣。在概率抽樣法中,調查員必須嚴格遵守正確的選擇程序,即要求避免武斷或有偏見地選擇抽樣單位,當嚴格執行這些程序時,概率論中的法則都是有效的。這就是說,對于預測的范圍來說,樣本中的數據可以認為是不同于總體數據的,其差異稱為抽樣誤 差。

      (2)概率抽樣

      非概率抽樣指從總體中非隨機地選擇特定的要素(單位)。根據簡便易行、減少開支的原則選擇總體中的某些要素(單位),會導致非隨機性。有目的的非隨機抽樣可能會系統地排除或過分強調總體的某些部份。例如, 一項要調查所有18歲以上女性意見的調查若在周一至周五的白天通過電話進行,顯然會系統地排除了所有女性。

      概率抽樣包括以下幾個優點:

      l調查者可獲得被抽取的不同年齡、不同層次的人們的信息。

      l 能估算出抽樣誤差。

      l 調查結果可以用來推斷總體。例如,在一和概率抽樣法的調查中,如果有5%的被訪者給出了某種特定回答,那么,調查者就可以以此百分比再結合抽樣誤差,推及總體情況。

      另一方面,概率抽樣也有一些弊病:

      l 在大多數案例中,同樣規模的概率抽樣的費用要比非概率抽樣高。通常精挑細選的做法不僅增加調研費用而且還要專門的時間對樣本進行復核修改。

      l 概率抽樣比非概率抽樣需要更多時間策劃和實施。必須遵守的抽樣計劃執行程序會大量增加收集資料的時間。

      非概率抽樣的弊病恰好是概率抽樣的優勢:

      l不能估計出抽樣誤差。

      l 調查者不知道抽中的單位所具有代表性的程度。

      l 非概率抽樣的結果不能也不應該推及總體。

      看到非概率抽樣的這些弊病后,你會奇怪:為什么還使用電腦呢?其實他們經常被市場調研人員使用。使用非概率抽樣的原因與其本身固有的優勢有關:

      l 非概率抽樣比概率抽樣費有低。非概率抽樣的這一特點對那些精確性要求不嚴格的調查有相當大的吸引力。試探性調查就是其中的一例。

      l一般來計,非概率抽樣實施起來要比概率抽樣用的時間少。原因在前面已討論過了。

      如果合理運用非概率抽樣,它能產生極具代表性的合理的抽樣結果。

      除了是否選擇概率抽樣或非概率抽樣之外,調研人員還須在眾多抽樣程序中選擇其一。這些程序在圖4.2中做了概括。

      4.2.5確定樣本量

      一旦選定抽樣方法,下一步就要確定合適的樣本量。關于這個問題,下一章會有詳細闡述。在下章中,我們討論預算的重要性、各種各樣的抽選規則、子集量的分析和傳統的統計樣本量的計算。對非概率抽樣,通常我們僅依靠可能的預算、抽選規則、子集量分析來決定樣本量。然而,就概率抽樣而言,需要在允許誤差的目標水平(抽樣結果和總體指標的差異)和置信水平(置信區間的概率,置信區間是樣本結果加減允許誤差形成的一個涵蓋總體真值的范圍)下,計算樣本量。如前所述,基于樣本指標推測總體指標是概率抽樣的主要優勢 。

      4.2.6 制定選擇樣本單位的操作程序

      無論使用概率或非概率抽樣,在一個項目的資料收集階段必須指定和明確選擇樣本單位的操作程序。對于概率抽樣的成功來說,這個程序更為重要,必須詳細、清晰,不受訪問員的干擾。若不能制定合適選擇樣本單位的操作程序,則整個抽樣程序會陷入困境。表4.1提供了一個適于操作的抽樣計劃。

      表4.1 適用于操作的抽樣計劃

      4.2.7抽樣計劃的實施

      在實施適于操作的抽樣計劃前,應先對其進行討論研究。這一步很重要,它包括檢查、明確是否要根據擬好的詳細程序來實施計劃。

      4.3 抽樣誤差和非抽樣誤差

      請假想一種情景:我們的目標是想確定一個特殊人群的平均年齡。如果可以獲得總體中每個人的確切信息,我們就可以計算出這些具有同一特征的人的平均年齡。總體的參數是總體真實特征定義的數值。假設(總體參數或平均年齡)為36.3歲。正如已討論的那樣,要調查整個總體中每一個人是不可能的,但是,研究人員會抽取樣本,并根據樣本的調查結果對總體的特征(參數)進行推測。如在計算平均年齡的問題中,研究人員從25萬人的總體中抽取400個樣本單位。估計的總體平均年齡要從本數據中計算出來,假設樣本年齡為35.8歲。同樣可以在總體中抽出第二個400人為樣本,再計算其平均數,結果是36.8歲。另外,可能有很多適當的方法從總體中抽出若干個樣本。研究人員將對不同的樣本計算出相當接近但不完全同于總體參數的樣本指標。

      樣本結果的準確性受到兩種誤差的影響:一種是抽樣誤差,另一種是非抽樣誤差(測量誤差)。下列公式描述了在估計總體平均數時這二種誤差的影響。

      其中,為樣本平均數;為真正的總體平均數;為抽樣誤差;為非抽樣誤差或測量誤差。

      抽樣誤差是指所選樣本的結果不能全代表總體而導致的誤差。有兩類抽樣誤差:隨機的和管理上的。管理上的抽樣誤差涉及抽樣執行中的問題,即樣本的設計和執行中有缺陷而不是樣本不能代表總體。這類誤差能在樣本設計和執行中通過小心謹慎而避免或使之極小化。隨機抽樣誤差是由于偶然事件引起的,是無法被避免的。這類誤差只能依靠增加樣本量使之縮小,但不能完全消除。非抽樣或測量誤差是在研究過程中由于計算的不準確和偏見等原因產生的不同于抽樣誤差的各種誤差。

      4.4 概率抽樣方法

      4.4.1 簡單隨機抽樣

      簡單隨機抽樣是最完全的概率抽樣。如前面提到的,隨機抽樣就是總體中每個單位在抽選時有相等的被抽中機會。在簡單隨機抽樣條件下,抽樣概率公式為:

      例如,如果總體單位數為10000,樣本數為400,那么抽樣概率為4%,計算過程為:

      如果一個抽樣框(列出所有的總體單位)是可以得到的,那么調查人員可以選擇簡單隨機抽樣方式,步驟如下:

      (1) 對總體的每個單位進行編號,總體單位數為10000的總體可編號為1-10000;

      (2) 在隨機數表中,從任意的一個編號數開始向上數或向下數或跳躍數選編號,在0001和10000之間選出400個(樣本單位數);

      (3) 在有明確總體單位的數字表中選出的數字將包括在樣本中。

      簡單隨機抽樣的優越性在于,它看起來簡單,并且滿足概率抽樣的一切必要的要求,保證每個總體單位在抽選時都有相等的被抽中機會。簡單隨機抽樣以一個完整的總體單位表為依據,在現實中編制這樣一個完整的表是極其困難的,也是不可能做到的。簡單隨機抽樣可以通過電話隨機撥號功能完成這個步驟。最后,簡單隨機抽樣可以從電腦檔案中挑選調查對象。電腦資料是可以得到的或從電腦檔案中抽取隨機樣本的記錄,如顧客名單。

      4.4.2等距抽樣

      等距抽樣經常作為簡單隨機抽樣的代替物使用。由于其簡單,所以應用相當普遍。等距抽樣得到的樣本幾乎與隨機抽樣得到的樣本相同。

      使用這種方式,必須獲得一份總體單位表,這一點與簡單隨機抽樣方式一樣。調查人員必須決定一個間隔,并在此間隔基礎上選擇單位,樣本距離可通過下面公式確定:

      例如,假設你使用本地電話號碼本并確定樣本距離為100,那么100個中取1個組成樣本。這個公式保證了整個列表的完整性。

      等距抽樣方式隨意用一個起點,例如你正使用一本電話本,必須隨意取出一個號碼決定從該頁開始翻閱。假設從第53頁開始,在該頁上再另選一個數決定從該行開始。假設選擇從第3行開始,最后在該行任選一個數,這就決定了實際開始的位置。假定從第17個數開始,那么以此為起點,樣本距離就確定下來了。

      等距抽樣方式相對于簡單隨機抽樣方式最主要的優勢就是經濟性。等距抽樣方式比簡單隨機抽樣更為簡單,花的時間更少,并且花費也少。使用等距抽樣方式最大的缺陷在于總體單位的排列上。一些總體單位數可能包含隱蔽的形態,調查者可能疏忽,把它們抽選為樣本。然而,這種缺陷在使用字母表時可以消除。

      4.4.3 分層抽樣

      分層抽樣是一種卓越的概率抽樣。具體程序是:

      l 把總體各單位分成兩個或兩個以上的相互獨立的完全的組(如男性和女性)。

      l 從兩個或兩個以上的組中簡單隨機抽樣,樣本相互獨立。

      總體各單位按主要標志加以分組。盡管一些作者指出,分層抽樣的要求沒有指明分層標志,但是根據常識的判斷,分組的標志與我們關心的總體特征相關。例如,如果你正在進行一次政治性民意調查,要預測選舉結果。結果證明,男性和女性投票的方式大不相同,那么性別是劃分層次的適當標志。如果不以這種方式進行分層抽樣,分層抽樣就得不到什么效果,花再多時間、精力和物資也是白費。前面的例子中,將性別作為分層抽樣的標志,我們得到男、女兩組,各組都相互完全獨立。在一組中(男性組或女性組)保證每個總體單位都有被選的機會,沒有哪些總體單位是不能被抽中的。第二步就是進行簡單隨機抽樣,在每個組中獨立進行。

      分層抽樣與簡單抽樣相比,人們往往選擇分層抽樣,因為它有顯著的潛在統計效果。也就是說,如果我們從相同的總體中抽取兩個樣本,一個是分層樣本,另一個是簡單隨機抽樣樣本,那么相對來說,分層樣本的誤差更小些。另一方面,如果目標是獲得一個確定的抽樣誤差水平,那么更小的分層樣本將達到這一目標。由于排除了一種變差的來源,所以分層抽樣在統計上更為有效率。為此,后面的部分將做詳細的解釋。

      你也許會問:“如果分層抽樣統計效果更好,為什么不一直使用這種方式呢?”原因有兩個:

      (1) 將樣本適當劃分層次所需的信息常常是得不到的。例如,幾乎沒有人知道某種特殊產品的消費者的人口統計特征。注意,我們強調的是:“適當”分層。要適當分層并得到分層的好處,必須選擇個層次間存在明顯差異的因素為分層基礎。

      (2) 即使必要的信息是可以得到的,但是從所得信息的價值看,分層所需的時間和費用不劃算。

      對于簡單隨機抽樣,調查者完全依照隨機原則抽取總體中有代表性的樣本;對于分層抽樣,調查者按各組總體單位數占全部總體單位數的一定比例來抽取樣本,某種程度上更具有代表性。例如,調查者可能了解到,盡管男性和女性同樣有可能是某種特殊產品的使用者,但女性更有可能成為產品的主要使用者。在設計一個方案分析產品消費情況時,抽取的樣本中如果女性不具更大的代表性,將會導致片面的消費設計方案。假定女性占總體的60%,男性占總體的40%。即使每件事都做得完全正確,但是簡單隨機抽樣的程序可能會抽取到這樣的樣本,女性占55%,男性占45%,這種結果是由于樣本的波動。當我們將一枚硬幣擲10次時也會有這種誤差。正確的結果將是5次正面和5次背面,但是大部分時間我們得到的結果不是這樣。同樣,即便設計正確和操作簡單的隨機抽樣,也不可能從女性占60%和男性占40%的總體中恰好抽取到一個含60%的女性和40%的男性的樣本。然而,對于分層抽樣,調查者可以控制樣本含60%的女性、40%的男性。

      如上所述,提高分層樣本的精確度要付出一些代價。實現正確的分層抽樣有三個步驟:

      首先,辨明突出的(重要的)人口統計特征和分類特征,這些特征與所研究的行為相關。例如,研究某種產品的消費比率時,按常理認為男性和女性有不同的平均消費比率。為了把性別作為有意義的分層標志,調查者肯定能夠拿出資料證明男性與女性的消費水平明顯不同。用這方式可識別出各種不同的顯著特征。調查表明,一般來說,識別出6種重要的顯著特征后,再增加顯著特征的辨別對于提高樣本代表性就沒有多大幫助了。

      第二:確定在每個層次上總體的比例(如性別已被確定為一個顯著的特征,那么總體中男性占多少比例,女性占多少比例呢?)。利用這個比例,可計算出樣本中每組(層)應調查的人數。當然,在做最終決定之前,還要確定是否按總體比例或不按總體比例分配樣本各組單位數,以達到最佳樣本。

      l 按比例分配,即樣本各組比例與總體各層比例等同。

      用公式表示:

      式中 n--樣本量;

      N—總體單位數;

      i--各組(層)單位數。

      l 非比例分配或最佳分配,它能產生最有效的樣本,并為樣本提供最精確的和最可靠的估計。這種方法需要一個雙重方案,其一是考慮樣本量中各組比例與總體各層比例相關;其二是,樣本量中各組單位數的樣本還要考慮總體各層之中共有特征的離差(變差)。前者固然很重要,它涉及對總樣本數的估計;后者對總體某個變異較大的層,通過擴大其在樣本量中的比例,可提高樣本的代表性,相應也提高了估計的準確性。如果總體各層之中變異(標準差)相同,不成比例抽樣則沒有太大意義。

      最后,調查者必須從每層中抽取獨立簡單隨機樣本。現實中,這個步驟可以以不同的方式完成。假設按分層抽樣計劃要求訪問240位女性和160位男性。樣本從包括男性和女性的總體中抽取,在訪問過程中對被訪的男性和女性的人數進行跟蹤。在訪談過程中的某個時點,可能訪問了240位女性和12位男性。自此以后,只訪問男性,直到達到160人的目標。按這種方式,樣本中男性和女性的比例將與第二步中的要求一致。

      分層抽樣在市場研究中用到并不很頻繁。因為,我們往往預先得不到給樣本分層的必要信息。分層不能建立在猜測或預感的基礎上,而應建立在對總體特征及其內部變量關系和所調查行為的充分認識的基礎上。分層抽樣經常被用在政治選舉和大眾媒體的研究,在這些領域,研究者更情愿也更容易掌握分層的必要信息。

      4.4.4 整體抽樣

      迄今為止,我們討論的抽樣類型全部是按單位抽取,即按樣本單位數,分別一個單位一個單位地抽取。在整群抽樣中,樣本是一組單位一組單位地抽取。這里有兩個步驟:

      l 同質總體被分為相互獨立的完全的較小子集。

      l 隨機抽選子集構成樣本。

      如果調查者在抽中的子集中觀察全部單位,我們就有了一級整群樣本。如果在抽中的子集中再以概率方式抽取部分單位觀察,我們就有了二級整群樣本。分層和整群抽樣都要將總體分為相互獨立的和完全子集。它們的區別是,分層抽樣的樣本是從每個子集中抽取,而整群則是抽取部分子集。全部觀察一級樣本或先抽取部分子集再在抽中的子集中抽取部分單位,取得二級樣本。

      所有概率抽樣法 需要列舉或提供一些已組織好的關于目標總體所有單位的統計表。在整群抽樣中,研究人員開發出了不需列舉所有單位而只需列舉子集的抽樣。抽取子集后,再列舉其內部單位統計表,最后取得樣本。

      地理區域抽樣是整群抽樣的典型方式。挨門挨戶去調查一個特定城市的調查者也許會隨機抽選一些區,較集中地訪查一些群體,大量減少訪問時間和經費。整群抽樣被認為是概率抽樣技術,因為它隨機抽出群和隨機抽出單位。

      在整群抽樣下,我們假定群中單位與全及總體一樣存在異質性。如果一群中單位的特征非常相似,那么就違反了這個假設。在上面的例子中,由于共同環境使群內差異小而群與群之間差異大。一般來說,要解決這個問題可以擴大群數,然后從各群中抽取少量單位數,以保證樣本的代表性。

      這種整體抽樣的類型是一個兩級抽樣。第一級是群的抽取。第二級是群內單位的抽取。多級區域抽樣或多級概率抽樣也許有著更多的步驟。這種類型被應用于覆蓋廣闊區域的全國性調查。在這種抽樣方法下,調查者隨機抽取相對較小的區域。例如,在一個州內的挨門挨戶的調查也許包括以下步驟:

      (1) 選取這個州內的縣以表明不同區域都有代表性,縣也許是通過與縣中家庭數成正比的方式抽出,家庭數目較多的縣比家庭數目較少的縣抽中的機會要大一點。

      (2) 在樣本縣中抽住宅區域。

      (3) 在中選住宅區域中抽取家庭。

      從統計效率的立場看,一般說來整體抽樣的效率沒有其他類型高。換言之,一組一定大小的整體樣本,將比一組簡單隨機樣本或一組同樣大小的分層樣本有更大的抽樣誤差。我們用下面的例子來說明這種方法的高成本績效及其低統計效率。

      比如,我們需要在某個特定的城市選取一個由200個家庭組成的樣本來進行家訪。如果這200個家庭是通過簡單隨機抽樣抽取的,它們會散布到整個城市之中。但通過整群抽樣可以抽取城市中20個住宅區并從每區中抽取10戶人家來采訪。容易看出,整群抽樣可以大幅度降低費用,采訪者將不必花費大量時間穿梭于各個被采訪的對象之間。然而,簡單隨機抽樣的抽樣誤差卻小一些。散布在整個城市的200戶人家,提高了得到一組涉及各個方面被訪者代表的可能性。相反,如果采訪僅僅在城市中選定的住宅區中進行,那么,就有可能錯過、夸大或降低某些宗教,社會或經濟團體的代表意義。

      如前所述,整體抽樣沒有簡單隨機抽樣的統計效率高。簡單隨機抽樣也可視為一種特殊的整群抽樣,其中樣本量與整群相當,從每群中選一個樣本單位。在這一點上,整體抽樣的統計效率和簡單隨機抽樣相同。從這一點開始,我們只選擇一個群并從中抽所有的樣本單位。例如,可以在城市中選一個相對小的地區,在那訪問200人。如果這種方式能抽出代表整個城市居民的樣本,那么,工作也太容易了!

      4.5非概率抽樣

      一般而言,任何不滿足概率抽樣要求的抽樣都被歸為非概率樣。非概率抽樣的缺點是,不能計算其抽樣誤差,這意味著評估非概率抽樣的總體質量有很大的困難。我們知道它們不滿足概率抽樣所需的標準,但問題是它們脫離標準有多遠?資料的使用者必須對非概率抽樣進行評估。評估應該建立在對非概率抽樣方法論仔細評價的基礎上。那么,使用的方法是否能夠覆蓋目標總體的各個部份?或者樣本是否無目的地傾向于一些特殊方面?這些是仔細評估時必須考慮的。經常使用的非概率抽樣有四類:便利抽樣、判斷抽樣、配額抽樣和滾雪球抽樣。

      4.5.1便利抽樣

      顧名思義,便利抽樣被應用是因為便利。如Frito-Lay公司的R&D部門經常讓員工對其開發的新產品進行初步測試。固然,這個方法看上去有很大的偏差,然而他們不要求雇員評估現有的產品或競爭對手的產品進行比較。他們要求雇員提供總的感覺(如成色、脆度、油膩度)。在類似情況下,便利抽樣是獲得必要信息的有效而實用的方法。在進行試探性調研時,即缺乏經驗而急需真實數據的近似值時,這種方法很實用。

      有人認為,與概率抽樣相比,便利抽樣應用比率增長很快。其原因是由于在低發生率和難以分類情形下消費者資料庫的可獲得性。例如,一家公司開發出了一種新型腳癬治療儀,并且需要在受疾病困擾的人中做一次調查。它發現這些人僅占人口的4%。這表明在電話調查中,調查員在找到一個忍受腳癬痛苦的人之前,不得不與25個人交談。一個變通的辦法是努力取得一個已知目標者(忍受腳癬痛苦者)的名單。這樣,調查成本和所需時間就會大大減少。盡管一個名冊中也許會包括那些購買產品時使用優惠券的人,公司仍甘愿低成本快速獲得低質量的樣本。從Survey Sampling 公司可以獲得3000多份類似的名單,具體可參見www.ssisamples.com/lite/lite.qry。

      4.5.2 判斷抽樣

      判斷抽樣適用于調查員基于選擇標準抽取典型樣本的任何情形。購物中心進行的大部分市場或產品測試調查基本上都屬于判斷抽樣。就市場測試而言,是選擇一個還是幾個市場需看它們能否代表全及總體。為調查產品品味而選擇購物中心取決于調查人員的判斷。特殊的購物中心會吸引不同階層的消費者,而這些人恰好是某種被調查產品的既定調查群。

      4.5.3 配額抽樣

      配額抽樣是根據一定標志對總體分層或分類后,從各層或各類中主觀地選取一定比例的調查單位的方法。所謂“配額”是指對劃分出的總體各類型都分配給一定數量而組成調查樣本。因而,配額抽樣較之判斷抽樣加強對樣本結構與總體結構在“量”的方面的質量控制,能夠保證樣本有較高的代表性。配額抽樣類似于隨機抽樣中的分層抽樣。不過,有兩點重要的區別:配額抽樣的被調查者不是按隨機原則抽出來的,而分層抽樣必須遵守隨機原則。其次,在分層抽樣中,用于分類的標志,應聯系研究目標來選擇,而配額抽樣無此要求。

      4.5.4 滾雪球抽樣

      滾雪球抽樣是指,通過使用初始被調查者的推薦來挑選另外的被調查者的抽樣程序。這種方法用于低發生率或少見的總體中進行抽樣。至于低發生率或少見的總體,是指全及總體中所占比例很少的那一部分。要找到這些少見總體中的個體,代價是很大的,使得調查人員因為費用的原因不得不使用例如滾雪球抽樣那樣的技巧。例如,某保險公司可能想得到過去6個月中從健康保險轉入康復組織的全國性個體樣本,為了找到符合條件的1000個樣本。可能需要在全國范圍內進行大量的調查。然而,若先取得特征總體中200個最初樣本單位,平均從每個最初調查者那里得到另外4個人的名單,以此來完成這1000個樣本單位就經濟多了。

      滾雪球抽樣調查的優點是調查費用大大減少,然而這種成本的節約是以調查質量的降低為代價的。整個樣本很可能有偏差,因為那些個體的名單來源于那些最初調查過的人,而他們之間可能十分相似。結果,樣本可能不能很好地代表整個總體。另外,如果被調查者不愿意提供人員來接受調查,那么這種方法就會受阻。

      小結

      總體或全域是指能提供所需信息的一群人的總和。普查指從總體的所有個體中搜集令人滿意的信息。一個樣本僅僅是總體的一個子集。制定抽樣調查計劃的步驟如下:定義同質總體、選擇資料收集的方法、選擇抽樣框、選擇抽樣方法、決定樣本容量、確定一個可執行的實施計劃、然后執行抽樣調查計劃。抽樣框是列出總體中個體名單的方法,樣本就是從中抽出來的。

      由于概率抽樣法是按隨機原則抽選樣本,以致總體中每個單位者可能按已知非零的概率被抽中。非概率抽樣調查法包括按非隨機原則從總體中選擇特定單位的各種方法。概率抽樣法有一些非概率抽樣法所沒有的優點,包括信息來源于總體中具有代表性的各層次,抽樣誤差可被計算出來,并且可以用調查結果來估計總體。然而,概率抽樣法的費用比非概率抽樣法高,并且通常需用更多的時間來設計和實施調查。

      抽樣調查結果的準確度是由抽樣誤差和非抽樣誤差決定的。抽樣誤差是因為樣本不能理想地代表總體特征造成的。有兩種形式的抽樣調查誤差:隨機性誤差和管理性誤差。隨機性抽樣誤差是因為偶然事件產生的,不可避免,只能通過增大樣本容量而減少誤差。

      概率抽樣法包括簡單隨機抽樣、等距抽樣、分層抽樣和整群抽樣。非概率抽樣包括便利抽樣、判斷抽樣、配額抽樣和滾雪球抽樣。

    上一篇下一篇
? 主站蜘蛛池模板: 91麻豆精品久久久久蜜臀 | 精品国产不卡 | 亚洲久久久久久久 | 蜜芽视频在线观看 | 久久看人人爽人人 | 国产精品99一区二区三区 | 91久久久久久亚洲精品禁果 | 神马久久春色视频 | 国产第一夜 | 天天做天天爱天天干 | 亚洲视频不卡 | 一级高清 | 国语自产精品视频 | 青娱乐福利视频 | 日韩av一区二区三区在线观看 | 亚洲一区二区三区影院 | 91免费在线视频观看 | 一本大道香蕉久在线播放29 | 美女一级大黄录像片 | 91婷婷精品国产综合久久 | 西西人体www大胆高清视频 | 亚洲午夜一级 | 欧美+日本+国产+在线a∨观看 | 一区二区三区视频网站 | 国产高清精品一区 | 99爱视频在线观看 | 精品亚洲aⅴ一区二区三区 国产精品igao视频网网址3d | 国产免费www | 五月网址 | 国产特黄一级免费AA大片 | 久久蜜臀| 伊人色综 | 人人玩人人添人人澡免费 | 欧美亚洲高清一区二区三区不卡 | 天堂久久精品 | 日韩在线看片 | 日韩黄色三级在线观看 | avv在线播放 | 国产福利精品一区 | 一区二区三区四区日本视频 | 永久免费av片在线观看全网站 |