Stata教学:描述性统计与绘图
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
label variable height "身高" label variable nethour "每週上網時數" label variable havepc "住處有無電腦" label variable math "自評數學程度" label variable socstat "對社統的感覺"
身高
-------------------------------------------------------------
Percentiles Smallest
1%
153
153
5%
155
155
10%
160
160 Obs
25
25%
161
160 Sum of Wgt.
25
50%
75% 90% 95% 99%
分組從150到185為範圍
連續變數的直方圖
間斷或類別變數的直方圖
• 工具列-graphics-histogram
直方間要有間距 每個直方頂上 要標示次數 (人數)
調整X軸
自行輸入變數值標籤
間斷或類別變數的直方圖
類別變數的次數分配表
• Command視窗輸入 • Tab1 gender fethnic methnic religion
用do-file來界定變數和變數值標籤
label values religion rellb label define yesno 1 "有" 2 "沒有" label values havepc yesno label define degree 5 "很好" 4 "好" 3 "還可以" 2 "不好" 1 "很不好" label values math degree label define fearlb 1 "很害怕" 2 "害怕" 3 "沒有感覺" 4 "喜歡" 5 "很喜歡" label values socstat fearlb
168
Mean
166.6
Largest Std. Dev. 7.582875
171
175
178
178 Variance
57.5
180
180 Skewness .2408674
181
181 Kurtosis 2.19615
重分組
• 150-185公分,每5公分為一組。
150到185每5每公個分直一方組以5公分為一組, 最低一組的最小值為150
label values gender glb1 label define glb1 1 "男" 2 "女“ label define ethlb1 1 "本省閩南人" 2 "本省客家人" 3 "大陸各省市" 4 "原住民" 5 "其他 " label values fethnic ethlb1 label values methnic ethlb1 label define hrlb 1 "北北基" 2"桃竹苗" 3"中中彰投" 4 "雲嘉南" 5 "高高屏" 6 "花東宜 蘭" 7 "金馬澎湖" 8 "其他" label values hregist hrlb label define rellb 1"台灣民間信仰" 2"佛教" 3 "基督教" 4 "天主教" 5 "沒有宗教信仰" 6 "其他"
data- browser
• 工具列data-data browser (只能瀏覽, 不能改變)
連續變數的直方圖
• 工具列-graphics-histogram
輸入變數名稱
選擇Y軸項目
百度文库
直方圖
分組需調整
summarize 變數名稱, detail
• 為了調整分組,我們先看看身高的分佈狀況
• summarize height, detail
• 如果一行要寫很長,超過80字元的規定
• 可以用「#delimit ;」這個指令來處理,取代 原來的換行規定,Stata一直要讀到;才會執行 指令
• 復原的話用「#delimit cr」
儲存do-file
執行do-file
確認正確的路徑
變數名稱改變了
describe
在command視窗打 入describe,發現 變數值也已經執行 了
Stata教學
描述性統計
用do-file來界定變數並加上標籤
Do-file編輯器
用do-file來界定變數和變數值標籤
use student.dta rename var1 gender rename var2 hregist rename var3 fethnic rename var4 methnic rename var5 religion rename var6 height rename var7 nethour rename var8 havepc rename var9 math rename var10 socstat
Tab1的結果:次數分配表
出現6,因為當初變數值6沒有 給予標籤
出現more表示尚有結 果未呈現,按space
Tab1的結果:次數分配表
label variable gender "性別" label variable hregist "戶籍地" label variable fethnic "父親籍貫" label variable methnic "母親籍貫" label variable religion "宗教信仰"
用do-file來界定變數和變數值標籤
身高
-------------------------------------------------------------
Percentiles Smallest
1%
153
153
5%
155
155
10%
160
160 Obs
25
25%
161
160 Sum of Wgt.
25
50%
75% 90% 95% 99%
分組從150到185為範圍
連續變數的直方圖
間斷或類別變數的直方圖
• 工具列-graphics-histogram
直方間要有間距 每個直方頂上 要標示次數 (人數)
調整X軸
自行輸入變數值標籤
間斷或類別變數的直方圖
類別變數的次數分配表
• Command視窗輸入 • Tab1 gender fethnic methnic religion
用do-file來界定變數和變數值標籤
label values religion rellb label define yesno 1 "有" 2 "沒有" label values havepc yesno label define degree 5 "很好" 4 "好" 3 "還可以" 2 "不好" 1 "很不好" label values math degree label define fearlb 1 "很害怕" 2 "害怕" 3 "沒有感覺" 4 "喜歡" 5 "很喜歡" label values socstat fearlb
168
Mean
166.6
Largest Std. Dev. 7.582875
171
175
178
178 Variance
57.5
180
180 Skewness .2408674
181
181 Kurtosis 2.19615
重分組
• 150-185公分,每5公分為一組。
150到185每5每公個分直一方組以5公分為一組, 最低一組的最小值為150
label values gender glb1 label define glb1 1 "男" 2 "女“ label define ethlb1 1 "本省閩南人" 2 "本省客家人" 3 "大陸各省市" 4 "原住民" 5 "其他 " label values fethnic ethlb1 label values methnic ethlb1 label define hrlb 1 "北北基" 2"桃竹苗" 3"中中彰投" 4 "雲嘉南" 5 "高高屏" 6 "花東宜 蘭" 7 "金馬澎湖" 8 "其他" label values hregist hrlb label define rellb 1"台灣民間信仰" 2"佛教" 3 "基督教" 4 "天主教" 5 "沒有宗教信仰" 6 "其他"
data- browser
• 工具列data-data browser (只能瀏覽, 不能改變)
連續變數的直方圖
• 工具列-graphics-histogram
輸入變數名稱
選擇Y軸項目
百度文库
直方圖
分組需調整
summarize 變數名稱, detail
• 為了調整分組,我們先看看身高的分佈狀況
• summarize height, detail
• 如果一行要寫很長,超過80字元的規定
• 可以用「#delimit ;」這個指令來處理,取代 原來的換行規定,Stata一直要讀到;才會執行 指令
• 復原的話用「#delimit cr」
儲存do-file
執行do-file
確認正確的路徑
變數名稱改變了
describe
在command視窗打 入describe,發現 變數值也已經執行 了
Stata教學
描述性統計
用do-file來界定變數並加上標籤
Do-file編輯器
用do-file來界定變數和變數值標籤
use student.dta rename var1 gender rename var2 hregist rename var3 fethnic rename var4 methnic rename var5 religion rename var6 height rename var7 nethour rename var8 havepc rename var9 math rename var10 socstat
Tab1的結果:次數分配表
出現6,因為當初變數值6沒有 給予標籤
出現more表示尚有結 果未呈現,按space
Tab1的結果:次數分配表
label variable gender "性別" label variable hregist "戶籍地" label variable fethnic "父親籍貫" label variable methnic "母親籍貫" label variable religion "宗教信仰"
用do-file來界定變數和變數值標籤