第八章 成对数据的统计分析 知识点题库

已知两个变量x,y之间具有线性相关关系,试验测得(x,y)的四组值分别为(1,2),(2,4),(3,5),(4,7),则y与x之间的回归直线方程为(  )

A . y=0.8x+3 B . y=-1.2x+7.5 C . y=1.6x+0.5 D . y=1.3x+1.2
某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是(    )

A . B . C . D .
对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫(  )

A . 函数关系 B . 线性关系 C . 相关关系 D . 回归关系
在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是(   )
A . 100个吸烟者中至少有99人患有肺癌 B . 1个人吸烟,那么这人有99%的概率患有肺癌 C . 在100个吸烟者中一定有患肺癌的人 D . 在100个吸烟者中可能一个患肺癌的人也没有
关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料

x

1

2

3

4

y

0.5

1

1.5

3

试用最小二乘法求出y关于x的线性回归方程

参考公式:

用最小二乘法求线性回归方程系数公式:

某地有一企业2007年建厂并开始投资生产,年份代号为7,2008年年份代号为8,依次类推.经连续统计9年的收入情况如下表(经数据分析可用线性回归模型拟合 的关系):

年份代号(

7

8

9

10

11

12

13

14

15

当年收入( 千万元)

13

14

18

20

21

22

24

28

29

(Ⅰ)求 关于 的线性回归方程

(Ⅱ)试预测2020年该企业的收入.

(参考公式:  

某校在本校任选了一个班级,对全班50名学生进行了作业量的调查,根据调查结果统计后,得到如下的 列联表,已知在这50人中随机抽取1人,认为作业量大的概率为 .

认为作业量大

认为作业量不大

合计

男生

18



女生


17


合计



50

(Ⅰ)请完成上面的列联表;

(Ⅱ)根据列联表的数据,能否有 的把握认为“认为作业量大”与“性别”有关?

附表:

0.100

0.050

0.025

0.010

0.001

2.706

3.841

5.024

6.635

10.828

附:

某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表:

年  份

2007

2008

2009

2010

2011

2012

2013

年份代号t

1

2

3

4

5

6

7

人均纯收入y

2.9

3.3

3.6

4.4

4.8

5.2

5.9

  1. (1) 求y关于t的线性回归方程;
  2. (2) 利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.

    附:回归直线的斜率和截距的最小二乘估计公式分别为:

为了调查喜欢旅游是否与性别有关,调查人员就“是否喜欢旅游”这个问题,在火车站分别随机调研了 名女性或 名男性,根据调研结果得到如图所示的等高条形图.

参考公式:

,其中

  1. (1) 完成下列 列联表:

    喜欢旅游

    不喜欢旅游

    估计

    女性

    男性

    合计

  2. (2) 能否在犯错误概率不超过 的前提下认为“喜欢旅游与性别有关”.

    附:

某机构为研究学生玩电脑游戏和对待作业量的态度之间的关系,随机抽取了200名学生进行调查,所得数据如下表所示:

认为作业多

认为作业不多

总计

喜欢玩电脑游戏

80

40

120

不喜欢玩电脑游戏

20

60

80

总计

100

100

200

(参考公式: ,可能用到数据:P( =6.635)=0.01,P( =3.841)=0.05),参照以上公式和数据,得到的正确结论是(   )

A . 有95%的把握认为喜欢玩电脑游戏与认为作业多少有关 B . 有95%的把握认为喜欢玩电脑游戏与认为作业多少无关 C . 有99%的把握认为喜欢玩电脑游戏与认为作业多少有关 D . 有99%的把握认为喜欢玩电脑游戏与认为作业多少无关
某产品的广告费用x与销售额y的统计数据如下表:

广告费用x(万元)

4

2

3

5

销售额 图片_x0020_100002 (万元)

49

26

39

54

根据上表可得回归方程 中的 为9.4,据此模型预报广告费用为6万元时销售额为(   )

A . 63.6万元 B . 65.5万元 C . 67.7万元 D . 72.0万元
某市预测2000年到2004年人口总数与年份的关系如下表所示

年份200x(年)

0

1

2

3

4

人口数y(十)万

5

7

8

11

19

(参考数值:0×5+1×7+2×8+3×11+4×19=132,

参考公式:用最小二乘法求线性回归方程系数公式 )

  1. (1) 请根据上表提供的数据,计算 ,用最小二乘法求出y关于x的线性回归方程
  2. (2) 据此估计2005年该城市人口总数.
在中国,不仅是购物,而且从共享单车到医院挂号再到公共缴费,日常生活中几乎全部领域都支持手机支付,出门不带现金的人数正在迅速增加.某机构随机抽取了一组市民,并统计他们各自出门随身携带现金(单位:元)的情况,制作出如图所示的茎叶图.规定:随身携带的现金在100元以下(不含100元)的为“手机支付族”,其他为“非手机支付族”.

图片_x0020_100005

  1. (1) 根据茎叶图的数据,完成答题卡上的 列联表;

    男生

    女生

    合计

    手机支付族

    非手机支付族

    合计

    45

  2. (2) 根据(1)中的列联表,判断是否有99%的把握认为“手机支付族”与“性别”有关.

    附:

    0.050

    0.010

    0.001

    3.841

    6.635

    10.828

2020年全球经济都受到了新冠疫情影响,但我国在中国共.产.党的正确领导下防控及时、措施得当,很多企业的生产所受影响甚微.我国某电子公司于2020年6月底推出了一款领先于世界的5G电子产品,现调查得到该5G产品上市时间x和市场占有率y(单位:%)的几组相关对应数据.如图所示的折线图中,横轴1代表2020年8月,2代表2020年9月……,5代表2020年12月,根据数据得出y关于x的线性回归方程为 .若用此方程分析并预测该产品市场占有率的变化趋势,则该产品市场占有率最早何时能超过0.5%(精确到月)(    )

A . 2021年5月 B . 2021年6月 C . 2021年7月 D . 2021年8月
为提高空气质量,缓解交通压力,某市政府推行汽车尾号单双号限行.交通管理部门推出两个时间限行方案,方案A:早晨六点到夜晚八点半限号;方案B:早晨七点到夜晚九点限号.现利用手机问卷对600名有车族进行民意考察,考察其对AB方案的认可度,并按年龄段统计,22~40岁为青年人,41~60岁为中年人,人数分布表如下:

年龄段

人数

180

180

160

80

现利用分层抽样从上述抽取的600人中再抽取30人,进行深入调查,

  1. (1) 若抽取的青年人与中年人中分别有12人和5人同意执行B方案,其余人同意执行A方案,完成下列 列联表,并判断能否有90%的把握认为年龄层与是否同意执行方案A有关;

    同意执行A方案

    同意执行B方案

    总计

    青年

    12

    中年

    5

    总计

    30

  2. (2) 若从同意执行B方案的4个青年人和2个中年人中,随机抽取3人进行访谈,求抽取的3人中青、中年都有的概率.

    参考公式: ,其中

    参考数据:

    P(K2≥k0

    0.10

    0.05

    0.025

    0.010

    0.005

    0.001

    k0

    2.706

    3.841

    5.024

    6.635

    7.879

    10.828

已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:

x

2

4

5

6

8

y

30

40

50

60

70

根据上表可得回归方程 ,计算得 ,则当投入10万元广告费时,销售额的预报值为(   )

A . 75万元 B . 85万元 C . 99万元 D . 105万元
某单位做了一项统计,了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日用电量与当天平均气温,并制作了对照表:

气温(℃))

18

13

10

-1

用电量(度)

24

34

38

64

由表中数据得到回归方程 ,则当平均气温气温为-3 (℃)时,预测用电量为(   )

A . 64度 B . 66度 C . 68度 D . 70度
为检查“创建全国文明城市”(以下称“创城”)活动成果,某市统计了自宣传发动“创城”以来的几个月中,在市区某主要路段的骑行者和行人过马路情况,并从中随机抽查了60人,得到 列联表如下:

不走斑马线

走斑马线

合计

骑车

6

步行

22

30

合计

60

  1. (1) 补全上述列联表;
  2. (2) 根据小概率值 独立性检验,有没有充分证据推断:过马路“不走斑马线行为”与骑车有关?

    附: ,其中

    α

    0.15

    0.10

    0.05

    0.025

    0.010

    xα

    2.072

    2.706

    3.841

    5.024

    6.635

某学校食堂为提高服务质量,随机调查了20名教师和20名学生,每位师生对该学校食堂的服务给出了满意或不满意的评价,得到如下列联表:

满意

不满意

教师

14

6

学生

8

12

  1. (1) 分别估计教师、学生对该食堂服务满意的概率;若从对食堂服务不满意的6名教师和12名学生中,随机抽取3人作为代表与食堂进行沟通,求抽取人员中学生人数X的分布列及期望值.
  2. (2) 能否有 的把握认为教师、学生对该食堂的评价有差异.

    附:

    0.050

    0.010

    0.001

    3.841

    6.635

    10.828

为了解学生在学校月消费情况,随机抽取了100名学生进行调查,其中男生占 , 月消费金额(单位:元)分布在450~950之间.根据调查的结果绘制了学生在校月消费金额的频率分布直方图:

将月消费金额不低于750元的学生称为“高消费群”.

  1. (1) 若样本中属于“高消费群”的女生有15人,完成下列2×2列联表,并判断能否有97.5%的把握认为该校学生是否属于“高消费群”与“性别”有关?


    属于“高消费群”

    不属于“高消费群”

    合计

    合计

  2. (2) 将频率视为概率,从该学校中随机抽取3名学生,设被抽取的3名学生中属于“高消费群”的学生人数为随机变量X,求X的分布列及数学期望.

    附参考公式: , 其中.

    0.15

    0.10

    0.05

    0.025

    0.010

    0.005

    0.001

    2.072

    2.706

    3.841

    5.024

    6.635

    7.879

    10.828