试卷代号:1318
国家开放大学(中央广播电视大学)2016年秋季学期“开放本科”期末考试
社会统计学 试题(半开卷)
2017年1月
题号 一 二 三 四 总分
分数
得分评卷人
一、单项选择题(每题只有一个正确答案,请将正确答案的字母填写 在括号内。每题2分,共20分)
1.以下关于因变量与自变量的表述不正确的是( )。
A.自变量的变化是以因变量的变化为前提
B.因变量是由于其他变量的变化而导致自身发生变化的变量
C.自变量是引起其他变量变化的变量
D.因变量的变化不以自变量的变化为前提
2.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1 — 2小时;3)2
—3小时;4)3 —4小时;5)4 —5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为
A.5小时 B. 6小时
C. 5. 5小时 D. 6. 5小时
3.以下关于条形图的表述,不正确的是( )。
A,条形图中条形的宽度是固定的
B,条形图的矩形通常是紧密排列的
C,条形图中条形的长度(或高度)表示各类别频数的多少
D,条形图通常是适用于所有数据类型
4.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第( )组。
组别 按年龄分组(岁) 工作人员数(人)
1 20 〜24 6
2 25 〜29 14
3 30 〜34 24
4 35 〜39 18
5 40〜44 12
6 45〜49 18
7 50 〜54 14
8 55 〜59 6
合计112
A.第3组 B.第4组
C.第5组 D.第6组
5.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标 准差为5分。某学生语文得了 83分,数学得了 97分,从相对名次的角度看,该生( )的成 绩考得更好。
A.数学
C.两门课程一样
6.在假设检验中,不拒绝虚无假设意味着( )。
A.虚无假设是肯定正确的 B.虚无假设肯定是错误的
C.没有证据证明虚无假设是正确的 D,没有证据证明虚无假设是错误的
7. 根据一个样本均值求出置信水平为90%的置信区间表明( )。
A.总体均值一定落入该区间内
B.总体均值有90%的概率不会落入该区间内
C.总体均值有90%的概率会落入该区间内
D.总体均值有10%的概率会落入该区间内
8.在回归方程中,若回归系数等于0,这表明( )。
A.因变量y对自变量x的影响是不显著的
B.自变量x对因变量y的影响是不显著的
C.因变量y对自变量x的影响是显著的
D.自变量x对因变量y的影响是显著的
9.中心极限定理认为不论总体分布是否服从正态分布,从均值为卩、方差为扌的总体中,
抽取容量为n的随机样本,当n充分大时(通常要求n230),样本均值的抽样分布近似服从均 值为 、方差为 的正态分布。( )
A. fx, a2 B. pt/n ,az/n
C. pt,a2/n D. pt/n,(j2
10.下列哪种情况不适合用方差分析?( )
碍一分一评卷人 二、名词解释(每题5分,共20分)
11.整群抽样
12.Z 值
13.二维表
14.误差减少比例
得分评卷人 三、简答题(每题10分,共30分)
15.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是 连续变量。
(1) 网络供应商的姓名;
(2) 每月的网络服务费;
(3) 每月上网时间;
(4)上网的目的;
(5)上月网购次数。
16.简述什么是回归分析?其作用是什么?
17.如何对配对样本进行t检验。
得分评卷人
四、计算题(共30分)
18.为估计每个网络用户每天上网的平均时间是多少,抽取了 225个网络用户的简单随 机样本,得到样本均值为6.5个小时,样本标准差为2. 5个小时。
(1)试用95%的置信水平计算网络用户每天平均上网时间的置信区间。
(2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水 平,计算年龄在20岁以下的网络用户比例的置信区间。
注:Zo. 025 = 1. 96
19-某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试 验田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进行分析得到下面 的方差分析表。请完成方差分析表。
变差来源 SS df MS F Sig.
组间 A C 320 F 0. 000
组内 6048 D E 一 一
总计 B 39 一 一
试卷代号:1318
国家开放大学(中央广播电视大学)2016年秋季学期“开放本科”期末考试
社会统计学试题答案及评分标准(半开卷)
(供参考)
2017年1月
一、 单项选择题(每题2分,共20分)
I.C 2. C 3. B 4. C 5. A
6. D 7. C 8. B 9. C 10. B
二、 名词解释(每题5分,共20分)
II.整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取 一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。(5分)
12.Z值:Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据 在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公 式为:Z= (X—pi)/a(5 分)
13.二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排 放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。(3分)
14.误差减少比例:在预测变量Y的值时,知道变量X的值时所减少的误差(E,-E2)与 总误差Ei的比值称为误差减少比例,简称PRE。(5分)
三、 简答题(每题10分,共30分)
15.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是 连续变量。
(1) 网络供应商的姓名:定性;(2分)
(2) 每月的网络服务费:定量、连续变量;(2分)
(3) 每月上网时间:定量、连续变量;(2分)
(4) 上网的目的:定性(2分)」
(5) 上月网购次数:定量、离散变量。(2分)
16.简述什么是回归分析?其作用是什么?
(1)回归分析是通过一定的数学表达式将变量间的关系进行描述,确定一个变量或几个变 量的变化对另一个特定变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数 量伴随关系。(4分)
1014
(2)回归分析的作用包括:
①从已知数据出发,确定变量之间的数学关系式;(2分)
②对变量间的关系式进行统计检验,并从影响某一变量的多个变量中找出影响显著的变 量;(2分)
③利用所求出的关系式,根据一个变量或多个变量的取值估计或预测另一个特定变量的 取值。(2分)
17.如何对配对样本进行t检验。(10分)
配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的t检验用于检 验两个相关的样本是否来自具有相同均值的总体。(2分)在对配对样本进行t检验时,首先 计算两个样本中每个对应变量之间的差值;(3分)然后再检验其差值的均值是否为零,(1分) 如果差值的均值接近零(在给定的置信区间内),(2分)说明两个总体均值在给定的置信水平 上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差 异。(2分)
四、计算题(共30分)
18.(1)已知:n = 225 ,x =6. 5,S=2. 5,Zo.o2s = 1. 96(2 分) 用户每天平均用水量的95%的置信区间为:
2 5
5 + 1.96X —^―=6. 5 土 0. 33(4 分)
7225
所以,网络用户每天平均上网时间的置信区间为(6. 17,6.83)。(2分)
P士Z,/2 成与亞=。.4士 1. 96X产免|7世=0. 4士0. 064 (3 分)
所以,年龄在20岁以下的网络用户比例的置信区为(33. 6%,46. 4%)。(2分)
19.960,(3 分)7008,(2 分)3,(3 分)36,(2 分)168.(3 分)1. 90,(2 分)
变差来源 SS df MS F Sig.
组间 960 3 320 1. 90 0. 000
组内 6048 36 168 —
总计 7008 39 一 — —
点点赞赏,手留余香
给TA打赏
评论0