2021新高考数学二轮总复习专题突破练20 统计与统计案例含解析

晨鸟教育

PAGE

Earlybird

专题突破练20 统计与统计案例

     

1.

(2020吉林辽源高三检测,18)某城市在进行创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数.满分为100分).从中随机抽取一个容量为120的样本.发现所有数据均在[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,回答下列问题:

(1)算出第三组[60,70)的频数,并补全频率分布直方图;

(2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表)

2.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.

为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①;y^=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y^=99+17.5

(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;

(2)你认为用哪个模型得到的预测值更可靠?并说明理由.

3.(2020河南郑州高三检测,19)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:

(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;

(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:

超过m

不超过m

第一种生产方式

第二种生产方式

(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?

附:K2=n(ad-

P(K2≥k)

0.050

0.010

0.001

k

3.841

6.635

10.828

4.(2020贵州贵阳高三6月适应性测试,18)2020年2月以来,由于受新型冠状病毒肺炎疫情的影响,贵州省中小学陆续开展“停课不停学”的网络学习.为了解贵阳市高三学生返校前的网络学习情况,对甲、乙两所高中分别随机抽取了25名高三学生进行调查,根据学生的日均网络学习时长(单位:h)分别绘制了部分茎叶图(如图1)和乙校学生日均网络学习时长的部分频率分布直方图(如图2),其中茎叶图缺少乙校茎“5”和“6”叶的数据.

注:茎叶图中的茎表示整数位数据,叶表示小数位数据,如乙校收集到的最小数据为3.1.

(1)补全图2的频率分布直方图,并估计乙校学生日均网络学习时长的平均数(同一组中的数据用该组区间的中点值作代表);

(2)求50名学生日均网络学习时长的中位数m,并将日均网络学习时长超过m和不超过m的学生人数填入下面的列联表:

超过m

不超过m

总计

甲校

乙校

总计

(3)根据(2)中的列联表,能否有95%的把握认为甲、乙两校高三学生的网络学习时长有差异?

附:K2=n(ad

P(K2≥k0)

0.10

0.05

0.025

0.010

0.005

k0

2.706

3.841

5.024

6.635

7.879

5.(2020海南海口高三模拟演练,20)某病毒研究所为了研究温度对某种病毒的影响,在温度t(℃)逐渐升高时,连续测20次病毒的活性指标值y,实验数据处理后得到下面的散点图,将第1~14组数据定为A组,第15~20组数据定为B组.

(1)某研究员准备直接根据全部20组数据用线性回归模型拟合y与t的关系,你认为是否合理?请从统计学的角度简要说明理由.

(2)若根据A组数据得到回归模型y^=2.1+0.8t,根据B组数据得到回归模型y^=90.6-1.3t,以活性指标值大于5为标准,估计这种病毒适宜生存的温度范围(结果精确到0.

(3)根据实验数据计算可得:A组中活性指标值的平均数