抽樣調查中關於缺失資料之各種補齊法性質之研究

由於時代的急速變遷,人們所面臨的問題日趨複雜。在有限的人力與財力限制之下, 欲對目標母體(TARGET POPULATION ),作一詳細的調查與研究通 常是不可能的, 因此如何藉由抽樣方法從母體中抽取具有代表性的樣本是重要的。在抽樣調查的過程 中我們常常發現樣本回收率沒有原來預期的高,若我們只用回收的樣本去做資料分析 ,常常使我們做成的結果是偏誤(BIASED)。本文的目的即在針對此一問題,做一深 入的研究探討。 抽樣調查中無觀測值(NONOBSERVATION)通常有三種情況發生: (1)未包括的範圍(NONCOVERAGE ),(2)未回收(TOTAL NONRESPONSE )(3 )...

Full description

Bibliographic Details
Main Authors: 楊淑蘭, YANG, SHU-LAN
Language:中文
Published: 國立政治大學
Subjects:
Online Access:http://thesis.lib.nccu.edu.tw/cgi-bin/cdrfb3/gsweb.cgi?o=dstdcdr&i=sid=%22B2002005728%22.
Description
Summary:由於時代的急速變遷,人們所面臨的問題日趨複雜。在有限的人力與財力限制之下, 欲對目標母體(TARGET POPULATION ),作一詳細的調查與研究通 常是不可能的, 因此如何藉由抽樣方法從母體中抽取具有代表性的樣本是重要的。在抽樣調查的過程 中我們常常發現樣本回收率沒有原來預期的高,若我們只用回收的樣本去做資料分析 ,常常使我們做成的結果是偏誤(BIASED)。本文的目的即在針對此一問題,做一深 入的研究探討。 抽樣調查中無觀測值(NONOBSERVATION)通常有三種情況發生: (1)未包括的範圍(NONCOVERAGE ),(2)未回收(TOTAL NONRESPONSE )(3 )回答不完全(ITEM NONRESPONSE)。吾人針對回答不完全。使用插補法(IMPUTATI O )予以研究,即是對於缺失資料的項目依據種插補法給定一些值,使回收的資料具 完整性,以利資料的分析利用。 在日常生活中經常會遇到斤欲研究變數Y 與其另一輔助變數X 有某種線性關係存在。 例如農作物產量與種植面積、家庭收入與家庭支出、1980年全市人口總數與19 70年全市人口總數等。為方便研究起見,首先假設一簡單的線性迴歸模式: y I = β × I+εI εI ∼ i.i.d.N(O.σ□) 在上式中,若(XI,yI) i=1,2,……n 為一完整的資料集,即n 個隨機樣本(X I,yI )皆無缺失值,則β與σ□的最小平方估計式可以很快求出,現在假設y 值有 部份缺失值,則必須想辨法把缺失的 值補齊,才能進一步研究β與σ□的性質,本 文即針對下列六種插補法。(a )平均插補法(MO)、(b )隨機插補法(RO)、( C )分層平均 插補法(MC)、(d )分層隨機插補法(RC)、(e )簡單迴歸插補法(RG)及(f )隨機迴歸插補法(RRS,RRN),根據所建立的模式,運用各種不同的插補法將缺失 值予以補齊後,對模式結果作理論的探討,並對各種插補法作綜合分析比較。 最後利用其理論結果,配合1986年美國零售交易普查資料作實證研究,並分析其 實結果。