8.2 一元线性回归模型及其应用 知识点题库

某市根据地理位置划分成了南北两区,为调查该市的一种经济作物A(下简称A作物)的生长状况,用简单随机抽样方法从该市调查了500处A作物种植点,其生长状况如表:


生长指数

2

1

0

﹣1

地域

南区

空气质量好

45

54

26

35

空气质量差

7

16

12

5

北区

空气质量好

70

105

20

25

空气质量差

19

38

18

5

其中生长指数的含义是:2代表“生长良好”,1代表“生长基本良好”,0代表“不良好,但仍有收成”,﹣1代表“不良好,绝收”.

(Ⅰ)估计该市空气质量差的A作物种植点中,不绝收的种植点所占的比例;

(Ⅱ)能否有99%的把握认为“该市A作物的种植点是否绝收与所在地域有关”?

(Ⅲ)根据(Ⅱ)的结论,能否提供更好的调查方法来估计该市A作物的种植点中,绝收种植点的比例?并说明理由.

附:

P(K2≥k)

0.050

0.010

0.001

k

3.841

6.635

10.828

连锁经营公司所属5个零售店某月的销售额利润资料如表:

商品名称

A

B

C

D

E

销售额x/千万元

3

5

6

7

9

利润额y/百万元

2

3

3

4

5

(参考公式: = = = x)

  1. (1) 画出销售额和利润额的散点图
  2. (2) 若销售额和利润额具有相关关系,试计算利润额y对销售额x的回归直线方程.
  3. (3) 估计要达到1000万元的利润额,销售额约为多少万元.
对具有线性相关关系的变量x,y有一组观测数据(xi , yi)(i=1,2,…,8),其回归直线方程是 = x+ ,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=8,请估算x=3时,y=
据某市地产数据研究院的数据显示,2016年该市新建住宅销售均价走势如图所示,为抑制房价过快上涨,政府从8月份采取宏观调控措施,10月份开始房价得到很好的抑制.

(Ⅰ)地产数据研究院研究发现,3月至7月的各月均价y(万元/平方米)与月份x之间具有较强的线性相关关系,试建立y关于x的回归方程(系数精确到0.01),政府若不调控,依次相关关系预测第12月份该市新建住宅销售均价;

(Ⅱ)地产数据研究院在2016年的12个月份中,随机抽取三个月份的数据作样本分析,若关注所抽三个月份的所属季度,记不同季度的个数为X,求X的分布列和数学期望.

参考数据: =25, =5.36, =0.64

回归方程 = x+ 中斜率和截距的最小二乘估计公式分别为:

= =

对变量x,y有观测数据(xi , yi)(i=1,2,3,…,8),得散点图如图①所示,对变量u,v有观测数据(ui , vi)(i=1,2,3,…,8),得散点图如图②所示,由这两个散点图可以判断(   )

A . 变量x与y正相关;u与v正相关 B . 变量x与y正相关;u与v负相关 C . 变量x与y负相关;u与v正相关 D . 变量x与y负相关;u与v负相关
某种产品的广告费用支出  与销售额 之间有如下的对应数据:

2

4

5

6

8

30

40

60

50

70

( 参考公式:用最小二乘法求线性回归方程系数公式 )

  1. (1) 求回归直线方程;
  2. (2) 据此估计广告费用为10时,销售收入 的值。
某地级市共有 中学生,其中有 学生在 年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为 ,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助 元、 元、 元.经济学家调查发现,当地人均可支配年收入较上一年每增加 ,一般困难的学生中有 会脱贫,脱贫后将不再享受“精准扶贫”政策,很困难的学生有 转为一般困难学生,特别困难的学生中有 转为很困难学生.现统计了该地级市 年到 年共 年的人均可支配年收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份 时代表 年, 时代表 年,……依此类推,且 (单位:万元)近似满足关系式 .( 年至 年该市中学生人数大致保持不变)

                

         

      

               

                 

                   

  1. (1) 估计该市 年人均可支配年收入为多少万元?
  2. (2) 试问该市 年的“专项教育基金”的财政预算大约为多少万元?

    附:对于一组具有线性相关关系的数据 ,…, ,其回归直线方程 的斜率和截距的最小二乘估计分别为 .

小明同学在做市场调查时得到如下样本数据

1

3

6

10

8

4

2

他由此得到回归直线的方程为 ,则下列说法正确的是(   )

①变量 线性负相关②当 时可以估计 ④变量 之间是函数关系

A . B . ①② C . ①②③ D . ①②③④
某公司对2019年1~4月份的获利情况进行了数据统计,如下表所示:

月份

1

2

3

4

利润 /万元

5

6

6.5

8

利用线性回归分析思想,预测出2019年8月份的利润为11.6万元,则 关于 的线性回归方程为.

某销售公司通过市场调查,得到某种商品的广告费 (万元)与销售收入 (万元)之间的数据如下:

广告费 (万元)

1

2

4

5

销售收入 (万元)

10

22

40

48

  1. (1) 求销售收入y关于广告费x的线性回归方程
  2. (2) 若该商品的成本(除广告费之外的其他费用)为 万元,利用(1)中的回归方程求该商品利润 的最大值(利润=销售收入-成本-广告费).参考公式: .
基于移动互联技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验,某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司最近六个月内的市场占有率进行了统计,设月份代码为x,市场占有率为y(%),得结果如下表

年月

2019.11

2019.12

2020.1

2020.2

2020.3

2020.4

x

1

2

3

4

5

6

y

9

11

14

13

18

19

参考公式,相关系数 ,回归方程 中斜率和截距的最小二乘估计公式分别为 .

参考数据: .

  1. (1) 观察数据,可用线性回归模型拟合y与x的关系,请用相关系数加以说明(精确到0.001);
  2. (2) 求y关于x的线性回归方程,并预测该公司2020年6月份的市场占有率;
  3. (3) 根据调研数据,公司决定再采购一批单车投入市场,现有采购成本分别为1000元/辆和800元/辆的甲、乙两款车型,报废年限不相同.考虑到公司的经济效益,该公司决定先对这两款单车各100辆进行科学模拟测试,得到两款单车使用寿命统计如下表:

    报废年限

    车辆数

    车型

    1年

    2年

    3年

    4年

    总计

    甲款

    10

    40

    30

    20

    100

    乙款

    15

    35

    40

    10

    100

    经测算,平均每辆单车每年可以为公司带来收入500元,不考虑除采购成本之外的其他成本,假设每辆单车的使用寿命都是整数年,且用频率估计每辆单车使用寿命的概率,以每辆单车产生利润的期望值为决策依据,如果你是该公司的负责人,你会选择采购哪款车型?

恩格尔系数是食品支出总额占个人消费支出总额的比重,恩格尔系数越小,消费结构越完善,生活水平越高.某学校社会调查小组得到如下数据:

年个人消费支出总额x/万元

1

1.5

2

2.5

3

恩格尔系数y

0.9

0.8

0.5

0.2

m

经计算年个人消费支出总额x与恩格尔系数y满足线性回归方程 ,则 .

中国是世界上沙漠化最严重的国家之一,沙漠化造成生态系统失衡,可耕地面积不断缩小,对中国工农业生产和人民生活带来严重影响.随着综合国力逐步增强,西北某地区大力兴建防风林带,引水拉沙,引洪淤地,开展了改造沙漠的巨大工程,该地区于2017年投入沙漠治理经费2亿元,从2018年到2020年连续3年每年增加沙漠治理经费1亿元,近4年沙漠治理经费投入x(亿元)和沙漠治理面积y(万亩)的相关数据如下表所示:

年份

2017

2018

2019

2020

x

2

3

4

5

y

26

39

49

54

  1. (1) 通过绘制散点图看出,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;(结果保留3位小数)
  2. (2) 建立y关于z的回归方程;
  3. (3) 若保持以往的沙漠治理经费增加幅度,请预测到哪一年沙漠治理面积突破100万亩.

    参考数据:

    参考公式:相关系数 ..

为了选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,教育部开展了招生改革工作——强基计划.现对某高中学校学生对强基课程学习的情况进行调查,在参加数学和物理的强基计划课程学习的学生中,随机抽取了 名学生.
  1. (1) 在某次数学强基课程的测试中,超过 分的成绩为优秀,否则为合格.这 名学生成绩的统计数据如茎叶图所示,现随机从这 名学生中抽取两名,记抽到成绩优秀的学生人数为 ,求随机变量 的分布列及期望;

  2. (2) 已知学生的物理成绩 与数学成绩 是线性相关的,现统计了小明同学连续5次在强基课程测试中的数学和物理成绩(如下表).若第6次测试该生的数学成绩达到132,请你估计第6次测试他的物理成绩大约是多少?

    数学成绩

    120

    118

    116

    122

    124

    物理成绩

    79

    79

    77

    82

    83

    附:

已知由一个样本数据确定的回归直线方程为 ,且 ,经检验发现两个样本点 的误差较大,去掉这两个样本点后的样本点中心为 ,则( )
A . B . C . D . 与4的大小关系无法确定
某公司销售部门对某产品在某地区的广告投入与纯利润之间的关系进行研究,记录了2020年6月份到10月份的广告费与纯利润,得到如下资料表:

月份

6

7

8

9

10

广告费 (万元)

10

11

13

12

9

纯利润 (万元)

23

25

30

26

16

附:回归直线 的斜率和截距的最小二乘估计分别为

  1. (1) 根据6至10月份的数据,求出 关于 的线性回归方程;
  2. (2) 该公司销售部门打算11月份对该地区投入广告费15万元,但公司决策部门规定,当纯利润预测不低于35万元时才能对该地区继续投人广告,否则终止投入广告,试判断销售部门对该地区是否继续投入广告.
某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限(单位:年)与失效费(单位:万元)的统计数据如下表所示:

使用年限(单位:年)

1

2

3

4

5

6

7

失效费(单位:万元)

2.90

3.30

3.60

4.40

4.80

5.20

5.90

参考公式:相关系数

线性回归方程中斜率和截距最小二乘估计计算公式:

参考数据:

  1. (1) 由上表数据可知,可用线性回归模型拟合的关系.请用相关系数加以说明;(精确到0.01)
  2. (2) 求出关于的线性回归方程,并估算该种机械设备使用8年的失效费.
随着人民生活水平的日益提高,汽车普遍进入千家万户,尤其在近几年,新能源汽车涌入市场,越来越受到人们喜欢.某新能源汽车销售企业在2017年至2021年的销售量y(单位:万辆)数据如表所示.

年份

2017年

2018年

2019年

2020年

2021年

年份代号x

1

2

3

4

5

销售量y/万辆

17

18

20

22

23

参考数据:含

参考公式:相关系数 , 其中为样本平均值,线性回归方程也可写为

  1. (1) 根据数据资料,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
  2. (2) 求出y关于x的线性回归方程,并预计2022年该新能源汽车销售企业的销售量为多少万辆?
中央办公厅和国务院办公厅联合印发《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》,要求大力发展土地流转和适度规模经营.某种粮大户2017年开始承包了一地区的大规模水田种植水稻,购买了一种水稻收割机若干台,这种水稻收割机随着使用年限的增加,每年的养护费也相应增加,这批水稻收割机自购买使用之日起,5年以来平均每台水稻收割机的养护费用数据统计如表:

年份

2017

2018

2019

2020

2021

年份代码

1

2

3

4

5

养护费用(万元)

1.1

1.6

2

2.5

2.8

参考公式:线性回归方程的斜率和截距的最小二乘法估计分别为

  1. (1) 求关于的线性回归方程;
  2. (2) 若该水稻收割机的购买价格是每台16万元,由(1)中的回归方程,从每台水稻收割机的年平均费用角度,你认为一台该水稻收割机是使用满5年就淘汰,还是继续使用到满8年再淘汰?
一只红铃虫产卵数和温度有关,现测得一组数据 , 可用模型拟合,设 , 其变换后的线性回归方程为 , 若为自然常数,则.