超星数据时代的推断陷阱尔雅答案
超星学习通网课数据时代的推断陷阱章节测验答案 杨楠
1.1
1【单选题】
(图)下图统计了2019年中国消费者购买食品时看重的因素,其中对品质因素的关注度百分比为()。B
1.1-1.png
A、0.557
B、0.493
C、0.372
D、0.365
2【单选题】
(图)社交电商的高效获客和裂变能力吸引了众多企业加入,2018年社交电商成为资本的宠儿,拼多多、云集、蘑菇街等社交电商的上市更是将社交电商推上风口。行业规模快速增长,2018年中国社交电商行业规模达6268.5亿元,同比增长255.8%,成为网络购物市场的一匹黑马。下图统计并预测了2015-2021年中国社交电商行业规模及增速,其中增速最快的一年为()。B
1.1-2.png
A、2016年
B、2017年
C、2018年
D、2019年
3【单选题】
(图)一项调查显示, “95后”喜欢通过网络渠道获取品牌的相关信息,具体统计结果如下图所示,其中,95后最青睐于()渠道获取相关信息。D
1.1-3.png
A、互联网广告
B、电视节目和广告
C、电商
D、微博微信
4【单选题】根据2019年4月发布的相关报告,抖音小镇90后女吃货的美食打卡的视频数量在以下哪个餐饮场景中所占份额最大l C
A、快餐厅
B、糕饼店
C、中餐厅
D、咖啡厅
5【单选题】2018年中国晚睡党睡眠时长分布占比最多的时间是C
A、5H
B、6H
C、7H
D、8H
6【判断题】
(图)下图统计了2010年-2019年上半年中国年诊疗人次及人均诊疗次数,从图中可以看出,我国每年诊疗人次与人均诊疗次数均在逐年提升。()√
1.1-4.png
7【判断题】
(图)下图统计了2012-2019年中国移动阅读市场规模,从图中可以看出,2012-2019年中国移动阅读市场规模稳步上升,增速也在逐年增加。()x
1.2
1【单选题】
日本科学家越水重臣和他的团队运用压力传感器测量(),并用0-256的数值范围对其进行量化。A
A、人对椅子施加压力的方式
B、人的体重
C、人的血压
D、人的握力
2【多选题】下列选项中属于贵金属期货的是()。AB
A、纽约黄金
B、东京白银
C、现货黄金
D、现货白银
3【判断题】日本科学家越水重臣和他的团队对驾驶员坐姿的量化研究,不仅可以运用于汽车防盗系统,还可以用于检测司机是否疲劳驾驶。()√
1.3
1【单选题】
1936年,乔治·盖洛普开创性的将抽样调查运用于民意调查,仅运用()份调查问卷就成功预测出了罗斯福的胜利。C
A、5000
B、4000
C、3000
D、2000
2【单选题】根据2018年福布斯全美400富豪榜显示,美国最富有的前400位名人中,人数最多的年龄区间为()C
A、(60,66)
B、(66,72]
C、(72,78]
D、(78,85]
3【单选题】在福布斯全美400富豪榜中,以下组合分别为数值型变量和分类型变量的是()B
A、净资产、年龄
B、年龄、所属行业
C、所属行业、国籍
D、所属行业、年龄
4【判断题】据《哈佛深红报》相关调查显示:因资本惊人,资源过人,见识超人,精英的孩子被哈佛录取的概率非常高。()√
5【判断题】1936年美国大选前夕,《文学文摘》发放出海量的调查问卷,成功预测出罗斯福获胜。()x
1.4
1【多选题】
为了规避数据分析中可能存在的陷阱,首先需要学习正确的数据分析方法,了解陷阱的种类;其次不能完全依赖数据,需要将()有机结合,只有这样才能正确地进行数据分析并制定可靠的商业决策。ABCD
A、数据分析方法
B、业务知识
C、商业逻辑
D、数据本身
2【判断题】“大数据”的“大”是一种相对概念,可以与“完整数据”相提并论。()x
3【判断题】大数据和完整数据的混淆以及相关关系和因果关系的误判都可能产生数据分析陷阱。()√
4【判断题】在银行致电满意度分析案例中,星期一是导致客户不满意的主要原因,可作为输入变量进行分析。()x
5【判断题】在制定商业决策时可以完全依赖问卷调研数据。()x
2.1
1【单选题】
(图)这是一个治疗肾结石的例子,下表展示了A疗法和B疗法两种疗法的康复率:单独看治疗效果方面的数据,A疗法对治疗两种大小的肾结石的效果都更好,但是将数据合并后发现,B疗法针对所有情况的疗效更优。我们通常称此现象为()。B
2.1-1.png
A、区群谬误
B、辛普森悖论
C、罗杰斯现象
D、罗素悖论
2【单选题】
(图)英国统计学家辛普森提出了著名的辛普森悖论,下面这个案例可以让我们感受这个悖论:假设有甲乙两名法官,他们都在民事庭和行政庭主持审理案件,审理的部分案件被提出上诉,记录这些被上诉案件的终审结果如下图所示:(单位:件)记法官甲在民事庭、行政庭以及所有审理的案件维持原判的比率分别为x1、x2和x,记法官乙在民事庭、行政庭以及所有审理的案件维持原判的比率分别为y1、y2和y,则下列说法正确的是()。D
2.1-2.png
A、x1 y
B、x1
C、x1>y1,x2>y2,x>y
D、x1>y1,x2>y2,x
3【多选题】下面对辛普森悖论的描述正确的是()ABCD
A、爱德华·辛普森在1951年的论文中首次提出该悖论
B、辛普森悖论是一种统计现象
C、当数据组合并时,原来出现在不同分组中的趋势可能会消失
D、我们需要斟酌各分组的权重,并乘以一定的系数,来减少辛普森悖论的影响
4【判断题】现实中的图表经常利用一些视觉(维度、刻度等)误导我们对数据的判断。()√
5【判断题】缺乏相对基准的图表是一种坏图表。√
2.2
1【单选题】
(图)某种商品在7个月内销售量增长率的变化情况如图所示,从图上看,以下结论不正确的是()。D
2.2-1.png
A、2~6月该商品的销售量增长率逐渐变小
B、7月该商品销售量增长率开始回升
C、七个月内该商品每月销售量不断上涨
D、七个月内该商品销售量有涨有跌
2【单选题】单个饼图的主要用途是()A
A、用于总体中各组成部分所占比重的研究
B、比较多个总体的构成
C、反映一组数据的分布
D、比较多个样本的相似性
3【单选题】饼图中各组比例的总和应该()B
A、小于100%
B、等于100%
C、大于100%
D、不等于100%
4【判断题】条形图用来表示数值型数据分组频率分布,相邻竖条之间没有间隔()x
5【判断题】直方图通常被用来描述分类型数据。()x
2.3
1【单选题】
可以分区间表示一定数量的数值型数据的图形为()C
A、条形图
B、散点图
C、直方图
D、饼图
2【单选题】对于时间序列数据,用于描述其变化趋势的图形通常是()D
A、直方图
B、条形图
C、箱线图
D、折线图
3【单选题】为了描述身高与体重之间是否有某种关系,适合采用的图形是()C
A、条形图
B、对比条形图
C、散点图
D、箱线图
4【判断题】气泡图主要用于描述三个变量之间的相关关系。()√
5【判断题】与直方图相比,茎叶图没有保留原始数据的信息 。()x
2.4
1【单选题】下列图表中最适合描述2011年1月-2018年12月我国月度CPI(居民消费价格指数)的是()C
A、条形图
B、散点图
C、折线图
D、饼图
2【单选题】下列最适合展示并比较2个班级同学的语文、数学、外语、物理、化学、生物平均分(满分皆为100)的图表是()D
A、饼图
B、条形图
C、散点图
D、雷达图
3【单选题】假设100位同学参加了某一心理学测试,结果分为A、B、C、D四种情况,则下列图表中能最直观地描述每种结果所占比例的是()C
A、直方图
B、雷达图
C、饼图
D、折线图
4【判断题】散点图适合用于描述某大学大一新生中所有男生的体重与身高之间的关系。()√
5【判断题】甲校女生占全校总人数的50%,乙校男生占全校总人数的50%,则两校的女生人数不能确定。()√
2.5
1【单选题】
(图)下图表示同一时间段两个家庭在某一领域的消费支出(千元),错误的是()。A
2.5-1(1).png2.5-1(2).png
A、A家庭每年在该领域的消费支出与B家庭相比更加平稳
B、A家庭每年在该领域的消费支出在2万元左右
C、B家庭每年在该领域的消费支出总体呈上升趋势
D、B家庭每年在该领域的消费支出与A家庭相比更加平稳
2【单选题】
(图)下图描述了佛罗里达州各年死于枪击的人数,下列选项中正确的是()。C
2.5-2.png
A、1999年死于枪击人数明显大于2007年
B、2010年之后死于枪击的人数在逐渐下降
C、1990-1999年内,每年死于枪击的人数总体呈下降趋势
D、2006年死于枪击的人数与2005年相比有了显著减少
3【单选题】
(图)下面这张图表是一张反映各国人均寿命与财富的世界地图,纵轴反映该国家的人均寿命,人均寿命较长的国家在上面,人均寿命较短的国家在下面;横轴反映收入状况,较富裕的国家在右边,较贫穷的国家在左边。每一个气泡代表一个国家,气泡的大小表示每个国家的人口数量。下图呈现每个国家2017年的平均预期寿命和平均收入。下列选项中错误的是()( China为中国,Japan为日本,India为印度,Indonesia为印度尼西亚) B
2.5-3.png
A、日本的人均寿命处于较高的状态
B、从图中可以大致看出,国家的人口多少与抚育情况有着正相关的关系
C、从图中可以大致看出,国家越富裕,其人均寿命就越长
D、与印度相比,印度尼西亚更加富裕
4【判断题】有时会出现比例之和超过100%的饼图,这可能是因为允许一个人选多个选项造成的。√
5【判断题】茎叶图适合描述分类数据。()x
6【判断题】
图)下列图形非常好地展示了表格内的数据。()。x
3.1
1【单选题】《小镇消息》案例中采用的调查方法是()。D
A、简单随机抽样
B、分层抽样
C、整群抽样
D、以上都不是
2【多选题】抽样调查相比全面普查,具有的特点有()。ABC
A、更节省时间
B、更节省成本
C、更加易操作
D、结果更准确
3【判断题】1936年美国总统大选前,《文学文摘》放出海量调查问卷,调查结果却没能指向罗斯福获胜,说明被调查者的数量大小不是决定结果准确性的唯一因素。()√
4【判断题】抽样调查根据样本得出结论,结果并不可靠。()x
3.2
1【单选题】
调查者根据自身或者事先选定专家的主观意见抽取样本,这种抽样方法被称为()。B
A、便利抽样
B、判断抽样
C、系统抽样
D、分层抽样
2【单选题】非概率抽样一般用于()。D
A、探索性分析
B、预备性研究
C、总体边界不清,难以实施概率抽样的研究
D、以上都是
3【多选题】下列属于概率抽样的有()。BCD
A、判断抽样
B、系统抽样
C、分层抽样
D、整群抽样
4【判断题】非概率抽样操作简单、成本低、省时间,所抽取的样本可以推断总体的性质。()x
5【判断题】确定抽样框是整个抽样过程的开始,假如抽样框没有覆盖总体的某个部分,则抽样所得的样本可能导致有偏差的结果。()√
3.3
1【单选题】分层抽样最重要的特点为?()C
A、操作简单易行
B、抽样的有效性低
C、总体各个部分在样本中都有代表
D、调查成本易控制
2【单选题】为进行选举后的民意调查,调查人员通常使用哪种抽样方法?()D
A、简单随机抽样
B、方便抽样
C、分层抽样
D、整群抽样
3【多选题】下面哪些属于常见的概率抽样方法?()AB
A、简单随机抽样
B、整群抽样
C、方便抽样
D、判断抽样
4【判断题】概率抽样的一个重要特点在于使用与人为因素无关的随机方式来抽取样本。()√
5【判断题】简单随机抽样过程必须是有放回的。()x
3.4
1【单选题】
(图)以下哪幅图示意大偏差、小变异性?()A
A、图13.4-1A.png
B、图23.4-1B.png
C、图33.4-1C.png
D、图43.4-4D.png
2【单选题】下列几种抽样方法中,哪种是最优的?()C
A、偏差小,变异性大
B、偏差大,变异性大
C、偏差小,变异性小
D、偏差大,变异性小
3【多选题】非抽样误差产生的原因多种多样,主要可以分为哪几类?()ABC
A、抽样框误差
B、计量误差
C、回应误差
D、代表性误差
4【判断题】调查中涉及敏感性问题,如“你考试作过弊吗?”可能会产生回应误差。()√
5【判断题】因抽样框中包含异质单位或者缺失目标单位,都可以成为计量误差的来源。()x
3.5
1【单选题】
在2016年美国大选民调预测案例中,“隐形选民“(不公开支持,但仍会投票)的出现会产生以下哪种误差?()B
A、抽样框误差
B、回应误差
C、时间误差
D、处理误差
2【多选题】在2016年美国大选民调预测案例中,下列哪些行为可能会产生抽样误差?()AB
A、对蓝领阶层的取样不足
B、多通过座机电话进行民调
C、选民在民调时刻意隐藏自己的观点
D、选民在选举期内的观点发生变化
3【判断题】在2016年美国大选民调预测案例中,由时间推移对结果所造成的影响可忽略不计。()x
4.1
1【单选题】假设A国2018年死于意外交通事故的人数分别为:汽车1200人,火车200人,轮船50人。现以单位里程死亡率作为评价出行方式安全性的标准,可以得出结论:()D
A、汽车是A国最安全的出行方式
B、火车是A国最安全的出行方式
C、轮船是A国最安全的出行方式
D、以上说法都是错误的
2【多选题】通常我们要研究一个数据分析问题,首先要考虑选择什么作为我们的研究变量,其中的思考主要涉及到的几点包括()ABC
A、变量是如何定义的
B、该变量能否有效描述它所要度量的人或物的性质
C、度量结果有多精确
D、变量是否符合正态分布
3【多选题】为实现对变量定义正确的度量,以下哪些做法是正确的()ABCD
A、了解变量的具体含义
B、注意度量单位
C、选择有效度量
D、尽量减小度量偏差
4【判断题】度量同一个客观物体,在分析不同问题时可能会采用不同的变量。()√
5【判断题】美元指数有许多种,其中有两种美元指数:(1)DXY指数:由老牌发达国家的六种货币来衡量,其中欧元占比57.6%,最早产生并广泛使用至今,但由于老牌发达国家在对美贸易份额中的下降,合理性被受到质疑;(2)TWEXB指数:调整货币种类为26种,增加了新兴市场货币,但权重仅由贸易量决定,未考虑金融市场因素以及货币市场流动性,仍受到质疑。然而,大部分市场参与者仍在采用有缺陷的 TWEXB 和 DXY指数作为主要指标。由此可以看出:很多情况下没有一个所谓完美的指数,都取决于应用的场景与目标,并不断改进发展。()√
4.2
1【单选题】一组数据中出现频数最多的数值称为()A
A、众数
B、中位数
C、四分位数
D、均值
2【单选题】下列关于众数的叙述,不正确的是()C
A、一组数据可能存在多个众数
B、众数适用于分类数据,也适用于数值数据
C、一组数据的众数一定是唯一的
D、众数不受极端值的影响
3【单选题】按顺序排列的一组数据中居于中间位置的数称为()B
A、众数
B、中位数
C、四分位数
D、均值
4【单选题】某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调査,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。该组数据的中位数是()A