试卷代号:1318
国家开放大学20 19年秋季学期期末统一考试
社会统计学 试题(半开卷)
2020年1月
一、单项选择题(每题只有一个正确答案,请将正确答案的字母填写在括号内。每题2分,共20分)
1.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系 统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称 为( )。
A.简单随机抽样
B.系统抽样
C.整群抽样
D.分层抽样
2. 对于右偏分布,平均数、中位数和众数之间的关系是( )。
A.平均数>中位数〉众数
B.中位数>平均数〉众数
C.众数〉中位数>平均数
D.众数〉平均数>中位数
3.中心极限定理认为不论总体分布是否服从正态分布,从均值为卩、方差无体中, 抽取容量为n的随机样本,当n充分大时(通常要求n>30),样本均值的抽样分布近似必.八均 值为( )、方差为( )的正态分布。
A.p. az
B. p./n a2 /n
C. m 决/n
D. ft/n <j2
4.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是( )
A.甲的离散程度小,稳定性水平低
B.甲的离散程度小,稳定性水平高
C.乙的离散程度小,稳定性水平低
D.乙的离散程度大,稳定性水平高
5.在标准正态分布中,o值越小,则()。
A.离散趋势越大
B.离散趋势越小
c.曲线越低平
D.变量值越分散
6.对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个变量之间()。
A.相关程度越大
B,相关程度越小
C.完全相关
.D.完全不相关
7、从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为()。
A. 432,426
B.216,71
c. 432,71
D. 216,426
8.某单位对该厂第一加工车间残品率估计高于13%,而该车间主任认为该比例偏高。如果要检验该说法是否正确,则假设形式应该为()。
A.H。:w0.13; H:r<0.13
B. He:r≤0.13; H :x>0.13
C. H。:式—0.13;H :r≠0.13
D. H。:w>0.13;H :≤0.13
9.某次社会统计学考试中学生平均成绩82,标准差为6,某同学考试成绩为80,将这个分数转化为Z值为().
A. 一0.33
R.+0.33
c. -3
D.+3
10.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第()组。
组别 | 按年龄分组(岁) | 工作人员数(人) |
1 | 20~24 | 6 |
2 | 25 〜29 | 14 |
3 | 3034 | 24 |
4 | 35 〜39 | 18 |
5 | 40 〜44 | 12 |
6 | 45 〜49 | 18 |
7 | 50 〜54 | 14 |
8 | 55〜59 | 6 |
合计 | 112 |
A.第3组
B.第4组
C.第5组
D.第6组
二、名词解释(每小题5分,共20分)
11.折线图
12.二维表
13.统计推断
14.自变量与因变量
三、简答题(每题10分,共30分)
15.简述按照测量水平区分的四类变量,并举例说明。
16.简述什么是简单一元线性回归分析?其作用是什么?
17.简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。
四、计算题(每题15分,共30分)
18.为估计每个网络用户每天上网的平均时间是多少,抽取了 225个网络用户的简单随 机样本,得到样本均值为6. 5个小时,样本标准差为2. 5个小时。
(1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。
(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水 平,计算年龄在20岁以下的网络用户比例的置信区间。
注:Zo. 025 = 1. 96
19.为研究某种商品的价格(x)对其销售量(y)的影响,收集了 12个地区的有关数据。通
试卷代号:1318
国家开放大学2019年秋季学期期末统一考试
社会统计学试题答案及评分标准(半开卷)
(供參考)
2020年1月
一、 单项选择题(每题2分,共20分)
I.D 2. A 3. C 4. B 5. B
6. A 7. C 8. A 9. A 10. B
二、 名词解释(每小题5分,共20分)
II.折线图:以直方图为基础,把直方图顶部的中点用直线依次连接起来,然后把原有的 直方图抹掉后得出的图形就是折线图,也可称为频数多边形图。(5分)
12.二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排 放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。(3分)
13.统计推断;根据统计量的分布和概率理论,由样本统计量来推断总体参数的过程,包 括参数估计和假设检验两部分内容。(5分)
14.自变量与因变量:引起其他变量变化的变量称为自变量(2分),由于其他变量的变化 而导致自身发生变化的变量成为因变量。(3分)
三、 简答题(每题10分,共30分)
15.简述按照测量水平区分的四类变量,并举例说明。
(1) 定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其 它特征时,这种变量称为定类变量。(2分)例如:性别(0. 5分)
(2) 定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度 等序次差异时,这种变量称为定序变量。(2分)例如:学历(0. 5分)
(3) 定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同 类别之间的数量差别和间隔差距时,这样的变量称为定距变量。(2分)例如:智商(0. 5分)
(4) 定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这 样的变量称为定比变量。(2分)例如:收入(0.5分)
16.简述什么是简单一元线性回归分析?其作用是什么?
简单回归分析是通过一定的数学表达式将两个变量间的线性关系进行描述,确定自变量 的变化对因变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关 系。(或者简单回归分析是对具有线性相关关系的两个变量之间(其中一个为自变量,另一个 为因变量)数量变化的一般关系进行分析,确定相应的数学关系式,以便进行估计或预测。)
(4分)
其作用包括:
(1) 从已知数据出发,确定变量之间的数学关系式;(2分)
(2) 对变量间的关系式进行统计检验,考察自变量是否对因变量有显著影响;(2分)
(3) 利用所求出的关系式,根据自变量的取值估计或预测因变量的取值。(2分)
17.简要举例说明在分析双变量的关系时,t检验和卡方检验的主要区别。
分析双变量关系时,t检验和卡方检验都是主要用于检验这两个变量之间是否存在显著 关系。(2分)t检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变量 的双变量关系的统计显著性检验。(2分)卡方检验主要用于对两个分类变量之间的相关性进 行统计检验,判断变量之间是否存在显著关系。(2分)
例如,我们想考察收入与性别是否存在关系,或者两性的收入是否存在显著差异,可以用 两独立样本t检验。(2分)如果我们想考察职业与性别是否存在关系,而职业和性别都是分 类变量,那么可以用卡方检验考察不同性别之间职业是否存在显著差异。(2分)
四、计算题(每题15分,共30分)
评论0