首頁 > 台灣兒童及少年長期追蹤調查 > 關於TPSCY > 資料處理方式

資料處理方式

(一)答案建立說明

TDCYP中兒少問卷、家長問卷等,都是由受試兒少及主要照顧者直接將答案劃記在書面問卷題本上,再由閱卷王來讀取答案。之所以選擇以閱卷王來處理資料,主要考量是:1.減少資料在人工過錄或鍵入的過程中,所可能產生的錯誤,及2.節省過錄與鍵入的時間,及3.省去設計答案卡的開版及印刷費用。

在閱卷王掃瞄題本讀取答案的過程中,不論掃瞄位置的設定、及印刷題本的正確率、掃瞄題本時放置的角度差異,在在都會影響答案讀取的結果。因此TDCYP在正式進行答案掃瞄之前,已先使用印刷好的題本來進行掃瞄位置設定測試,並在確認讀取位置的設定與讀卡機器均能達到快速且正確讀取的要求後,才開始所有的掃瞄作業。除此之外,在劃記題本時,如果經立可白修改、或原子筆劃記太輕、或劃記範圍過大過小等,皆會讓最後讀取答案的結果產生誤差。為了減少這過程對資料轉出所產生的誤差,TDCYP先在閱卷王軟體內建功能,將讀取不到、空白、單選答複選的資料先進行檢查修改後,再進一步轉成SPSS檔進行資料檢誤。如此一來,可以避免因為劃記或掃瞄不當所產生的讀取誤差,並提升資料品質。

另外,社工問卷因為要節省紙張印刷成本,故題目行距設計較近,無法使用閱卷王軟體讀取答案,而是另外經由人工輸入的方式,將答案建立起。鍵好的答案仍會透過SPSS統計程式,分別進行不合理值檢誤及邏輯檢誤,來確保資料的正確性。

(二)答案處理程序及檢核

家扶基金會在資料處理的流程中,從目視檢查題本開始,到最後以統計程式進行邏輯檢核,經過多道關卡,希望能藉此提高資料完整度及正確性。

1.人工檢查題本:
家扶基金會從一開始收到各地家扶中心所寄回的題本時,就開始以人工目視檢查的方式對書面題本進行第一道的篩檢。如果發現題本的劃記呈現過淡、或錯誤塗改率太高,則會直接以原子筆加粗答案、或重新謄寫一本題本後再送去掃瞄。

2.閱卷王設定讀取檢查:
我們所使用的閱卷王軟體已將所有題目設定好為單選題、複選題、或文字題。選擇題部分若答案讀取結果為單選答複選、或空白,則會直接查詢已掃瞄歸檔的題本圖檔,來確認答案的正確性。若確認為因題本放置歪斜使電腦讀取錯誤,則直接更正答案。文字題部分,則是直接在閱卷王上看該題對應的圖檔位置,將答案鍵入。

3.複選題資料過錄:
在問卷中,除了少數幾題是複選題外,大多數的題項是以單選題的形式進行資料蒐集。而為了日後資料使用的便利與普及,我們將原本單一複選題所記錄的選項數值,在過錄時轉換為多題單選題的形式。

範例說明:

第一版訪談問卷:

A1  請問你一天通常會吃哪幾餐?【可複選】

  早餐             上午點心     午餐

  下午點心     晚餐            宵夜

資料狀況:

變項名稱:w1a1_1w1a1_2w1a1_3w1a1_4w1a1_5w1a1_6

選項數值:0(沒有劃記)、1(有劃記)

某受訪者填寫答案:135

讀取後結果:w1 a1_1→1w1 a1_2→0w1a1_3→1w1a1_4→0

w1a1_5→1w1a1_6→0

4.不合理值檢核:
       所謂不合理值泛指答案出現問卷既有的選項數值之外的答案。例如:題項為單選題卻出現兩個以上的答案;或該題選項範圍為14,卻出現56的答案;這些狀況均為不合理值的篩檢範圍。不合理值的出現,可能是劃記過程不小心劃錯,或受訪者無心參與調查問卷填寫,所以隨意劃記,或題本放置歪斜以致讀取錯誤所產生。

       在不合理值上的處理,檢誤人員會再次去確認該問卷圖檔或原稿答案是否為此、或為電腦讀取答案錯誤後進行更正。另為求一致性,我們將所有題項確認後仍為不合理值者,若其為非態度與頻率量表的單選題,卻勾選兩個答案,則保留原始答案;但若為態度與頻率量表的單選題,卻勾選兩個答案,則將答案歸類至遺漏值「99、或999、或9999…」,遺漏值過錄碼數視過錄欄位長度而定。

範例說明:

題型一、非態度與頻率量表的單選題

eiq問卷_A8  你「大部分」衣服的來源是?【請選一個】
       
  家人買的新衣服       哥哥姊姊穿過的

  親朋好友送的          家扶中心贈送的

  自己買的                   其他(請說明):       

修改前資料狀況:

變項名稱:w1a8w1wave 1,為第一波eiq問卷A8題)
  選項範圍:123456
  受訪者答案:23 →非態度與頻率量表的單選題,卻勾選兩個答案。

修改後資料狀況:
  受訪者答案修改:不修改,保留原始答案。

Recode變項資料狀況:(單選答複選已歸類)

受訪者答案修改:依照選項次數分配多寡順序,將受訪者答案歸至較多人選擇的答案中。

次數分配由高至低選項順序:1 3 2 4 6 5

某受訪者填寫答案:135

Recode變項答案:因為選項1最多人選,所以將複選答案歸入1

 

題型二、 態度與頻率量表的單選題

eiq問卷_A12  你每天從家裡到學校時間要多久?

  不到十五分鐘           十五到三十分鐘

  三十一到四十五分鐘     四十六分鐘到一小時

  超過一小時以上       N   不適用(目前身份非學生)

修改前資料狀況:

變項名稱:w1a12
  選項範圍:12345、不適用為95
  受訪者答案:34 →為態度與頻率量表的單選題,卻勾選兩個答案。

修改後資料狀況:
  受訪者答案修改:將答案視為遺漏值,修改為「99、或999」。

 

5.邏輯檢核:
       邏輯檢核主要是經由檢誤程式,來檢查受訪者整份問卷中的答案是否前後一致、合理。由於問卷部分題項間存有邏輯關係,故針對這些題項,進行資料邏輯檢核。例如:第二版自填問卷A31題,受訪者回答現在是否有打工的答案為「沒有」,但回答打工時數時卻說「2小時」,而不是空白。未能通過邏輯檢核的原因,可能是因為電腦讀取答案位移錯誤、或受訪者誤解題意、記憶模糊、精神狀態不佳等因素所致。

6.未填答值處理:
所有「應答而未填答」均視為遺漏值,以代碼「999999999…」代表,過錄碼數視過錄欄位長度而定。

7.文字題部分:
經檢誤後會將文字做歸類,另recode為新變項,以便使用者使用及閱讀。

版權所有 © 財團法人台灣兒童暨家庭扶助基金會  40341台中市西區民權路234號12樓 Tel:04-22061234  Fax:04-22027303  [email protected]
建議使用 Mirosoft IE 6.0 或以上版本,1024x768 解析度以上瀏覽網頁 Power by SHANG YU