定性数据分析第二章课后答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章课后作业
【第1题】
解:由题可知消费者对糖果颜色得偏好情况(即糖果颜色得概率分布),调查者取500块糖果作为研究对象,则以消费者对糖果颜色得偏好作为依据,500块糖果得颜色分布如下表1、1所示:
表1、1 理论上糖果得各颜色数
由题知r=6,n=500,我们假设这些数据与消费者对糖果颜色得偏好分布就是相符,所以我们进行以下假设:
原假设:类所占得比例为
其中为对应得糖果颜色,已知,
则检验得计算过程如下表所示:
在这里。
检验得p值等于自由度为5得变量大于等于18、0567得概率。
在Excel 中输入“”,得出对应得p值为,故拒绝原假设,即这些数据与消费者对糖果颜色得偏好分布不相符。
【第2题】
解:由题可知 ,r=3,n=200,假设顾客对这三种肉食得喜好程度相同,即顾客选择这三种肉食得概率就是相同得。
所以我们可以进行以下假设:
原假设
则检验得计算过程如下表所示:
在这里。
检验得p值等于自由度为2得变量大于等于15、72921得概率。
在Excel 中输入“”,得出对应得p值为,故拒绝原假设,即认为顾客对这三种肉食得喜好程度就是不相同得。
【第3题】
解:由题可知 ,r=10,n=800,假设学生对这些课程得选择没有倾向性,即选各门课得人数得比例相同,则十门课程每门课程被选择得概率都相等。
所以我们可以进行以下假设:
原假设
则检验得计算过程如下表所示:
在这里。
检验得p值等于自由度为9得变量大于等于5、125得概率。
在Excel 中输入“”,得出对应得p值为,故接受原假设,即学生对这些课程得选择没有倾向性,各门课选课人数得频率为0、1。
【第4题】
解:(1)由题可知,r=3,n=5606,假设1997年8月中国股民投资状况得调查数据与比较流行得说法就是相符合。
所以我们可以进行以下假设:
原假设:类所占得比例为
其中为股票投资中对应得赢、持平与亏,已知,
则检验得计算过程如下表所示:
在这里。
检验得p值等于自由度为2得变量大于等于3511、96137得概率。
在Excel中输入“”,得出对应得p值为,故拒绝原假设,即认为1997年8月中国股民投资状况得调查数据与比较流行得说法就是不相符合得。
(2)解:由题知股票投资中,赢包括盈利10%及以上、盈利10%以下,符合条件得股民共有151+122=273人;持平可以指基本持平,符合条件得股民共有240人;亏包括亏损不足10%与亏损10%及以上,符合条件得股民共有517+240=757人。
由题可知,r=3,n=1270,假设2003年2月上海青年报上得调查数据与比较流行得说法就是相符合。
所以我们可以进行以下假设:
原假设:类所占得比例为
其中为股票投资中对应得赢、持平与亏,已知,
则检验得计算过程如下表所示:
在这里。
检验得p值等于自由度为2得变量大于等于188、21372得概率。
在Excel中输入“”,得出对应得p值为,故拒绝原假设,即认为2003年2月上海青年报上得调查数据与比较流行得说法就是不相符合得。
【第5题】
解:由题意,我们将“开红花”、“开白花”与“开粉红色花”分别记为,并记所占得比例为,本题所要检验得原假设为:
其中,这些都依赖一个未知参数。
在原假设成立时得似然函数为
则对L(p)取对数得
从而有对数似然方程
即。
据此求得p 得极大似然估计,从而得到得极大似然估计 。
它们分别为0、2025、0、3025与0、495。
由此得各类得期望频数得估计值。
它们分别为24、3、36、3、132、20与59、4。
所以统计量得值为
这里r=3,m=1,r-m-1=1。
检验得p 值等于自由度为1得变量。
利用Excel 可以算出p 值,故接受原假设,即我们认为以上数据在0、05得水平下与遗传学理论就是相符得。
【第6题】
解:由题意,我们可以得到以下信息:
① 遗传因子得分布律为:(其中p+q+r=1)
②血型得分布律为:
将“O ”血型、“A ”血型、“B ”血型与“AB ”血型这四类血型分别记为,并记所占得比例为,本题所要检验得原假设为:
pq p qr q p pr p r H 2 ,2 ,2p ,p :42322210=+=+==
这些都依赖两个未知参数。
在原假设成立时得似然函数为
58
132
132
436
436
748
58132243623742)
2()
22()
22()
1( )2()2()2()(),(pq p q q
q p p
q p pq qr q pr p r q p L ------∝++∝
则对L(p,q)求对数得
pq
p q q q p p q p q p L 2ln 58)22ln(132ln 132)22ln(436ln 436)1ln(748),(ln +--++--++--=对求偏导数得
⎪⎪⎩
⎪
⎪⎨
⎧=+---+---+---=∂∂=+---+---+---=∂∂0
58221321322287201748ln 058222640224364361748ln q p q q q p q p q L p p q q p p q p p L 利用Mathematica 软件求解(程序编码及运行结果见附录)
解得p 与q 得极大似然估计为,从而得得极大似然估计。
它们分别为0、37332、0、43668、0、13220与0、05780。
由此得各类得期望频数得估计值。
它们分别为373、32、436、68、132、20与57、80。
所以统计量得值为
003292
.0 80
.57)80.5758(20.132)20.132132(68.436)68.436436(32.373)32.373374(2
2222
=-+
-+-+-=χ 这里r=4,m=2,r-m-1=1。
检验得p 值等于自由度为1得变量。
有Excel 可以算出p 值为,故接受,我们认为以上数据与遗传学理论就是相符得。
附录 ①程序代码:
NSolve[{(-748)/(1-p-q)+436/p+(-436)/(2-p-2*q)+0+(-264)/(2-q-2*p)+58/p ==0,(-748)/(1-p-q)+0+(-872)/(2-p-2*q)+132/q+(-132)/(2-q-2*p)+58/q==0},{p,q}]//MatrixForm
②利用Mathematica 软件运行结果: Out[21] //MatrixForm
注:在上述结果中由于p + q = 1-r < 1,所以软件运行得结果中只有第四个解满足条件,即p 与q 得极大似然估计为。
【第7题】
解:由题知,在豌豆实验中,子系从父系(或母系)接受显性因子“黄色”与“青色”
得概率分别为p 与1-p,而子系从父系(或母系)接受显性因子“圆”与“有角”得概率分别为q 与1-q 。
我们将豌豆实验中得到得“黄而圆得”、“青而圆得”、“黄而有角得”与“青而有角得”这四类豌豆分别记为,,,,则这四类豌豆得分布律如下表所示:
将豌豆类型所占得比例记为,则本题所要检验得原假设为:
这些都依赖两个未知参数。
在原假设成立时得似然函数为
266280423416423416322210121082315)1()1()2()2( ])1()1[(])1)(2([])1)(2([)]2)(2([),(q p q p q p q p q p p p q q q p pq q p L ----∝--------∝则对L(p,q)求对数得
)
1ln(266)1ln(280)2ln(423)2ln(416ln 423ln 416),(ln q p q p q p q p L -+-+-+-++=对求偏导数得
即得出下列方程:
解得p 与q 得极大似然估计为,从而得得极大似然估计。
它们分别为0、56923、0、17898、0、19157与0、06023、由此得各类得期望频数得估计值。
它们分别为316、489、99、511、106、511与33、489。
所以统计量得值为
082564
.1 489
.33)489.3332(511.106)511.106101(511.99)511.99108(489.316)489.316315(22222
=-+
-+-+-=χ 这里r=4,m=2,r-m-1=1。
检验得p 值等于自由度为1得变量。
利用Excel 可以算出p 值为,故接受,我们认为观察数据与这样一个遗传学得模型就是相符得。