描述性統計030311
查資料過程
n ICPSR
n 3103
n search for data
n study of prosecutir
n from 1999 to 1999
n united state 12 data
n author
n download
n all files
n e-mail
n i agree
n save
n 解壓縮
n 畫圖說明
類別資料和數值資料
類別資料要分區表示來整理資料, 或是畫圖表示, 可以展現其相關關係, 予人有清楚概念, 各種圖表各有利弊
數值資料整理, 先分組, 每組組距相同, 每個數值只被分派到一個組別, 盡量不要太多(>15), 也不要太少(<5)組.
直方圖和長條圖的區分?
資料勘誤, 運用散佈圖可以驗證
比如年齡和年資分佈圖, 應該呈現正比關係, 若是53歲, 年資2年, 表示有錯, 將所有資料LABEL, 查出CASE 269的問題何在. 是否輸錯還是有其他問題, 再做重新整理
資料轉換
n 重新編碼成不同變數
n 保留最原始資料檔比較安全
n 建立新變項, 要記錄其理論根據, 所以寫工作日誌有所必要, 便於查詢
n 記錄檔RECORD, 記錄了今天在spss 所做工作,
集中趨勢和分散趨勢
集中---平均數, 中位數和眾數, 方便, 以一個數字就能表達,
加權平均: 分數乘以學分, 每科加總除總學分, 等於加權平均; 每個觀查值的重要性不一樣時, 就必須採用加權平均
中位數, 最中間的數, 若有偶數則取最中間兩數的平均
眾數, 類別最多的數目, 不相鄰眾數出現, 叫做雙峰分配
使用時機
平均分配時, 平均數可以代表
有偏差時, 眾數或中位數較有代表性
分散趨勢
離散量數代表個別差異有多大, 若離散量數小, 表示數值資料較集中,
全距—最大值與最小的差
四分位差---
平均差---等於0
變異數---各值減去平均數, 再平方, 平方根後成為標準差, 永為正數, 表示和平均值的距離, 等於0表示每個數值都和平均數一樣.
限會員,要發表迴響,請先登入

