相关系数 知识点题库

在建立两个变量的回归模型中,分别选择了4个不同的模型,他们的相关指数R2如下,其中拟合得最好的模型为(     )

A . R2=0.75的模型1 B . R2=0.90的模型2 C . R2=0.45的模型3 D . R2=0.65的模型4
下列说法:
①将一组数据中的每一个数据都加上或减去同一个常数后,方差恒不变;
②设有一个回归方程 , 变量x增加一个单位时,y平均增加5个单位;
③相关系数r越接近1,说明模型的拟和效果越好;
其中错误的个数是(    )

A . 1 B . 2 C . 3 D . 4
某商品销售量y(件)与销售价格x (元/件)负相关,则其回归方程可能是(       )
A . =-10x+200 B . =10x+200 C . =-10x-200 D . =10x-20

甲,乙,丙,丁四位同学各自对A,B两变量的线性相关试验,并用回归分析方法分别求得相关系数r如表:


则这四位同学的试验结果能体现出A,B两变量有更强的线性相关性的是(  )

A . B . C . 丙  D .
变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量U与V相对应的一组数据为 (10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则(  )

A . r2<r1<0 B . 0<r2<r1 C . r2<0<r1 D . r2=r1
某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用 列联表进行独立性检验,经计算  ,则至少有的把握认为“学生性别与是否支持该活动有关系”.

 

 0.10

 0.05

 0.01

 0.005

0.001

  

2.706

3.841

 6.635

 7.879

10.828

为了解人们对“2019年3月在北京召开的第十三届全国人民代表大会第二次会议和政协第十三届全国委员会第二次会议”的关注度,某部门从年龄在15岁到65岁的人群中随机调查了100人,并得到如图所示的年龄频率分布直方图,在这100人中关注度非常高的人数与年龄的统计结果如右表所示:

年龄

关注度非常高的人数

15

5

15

23

17

(Ⅰ)由频率分布直方图,估计这100人年龄的中位数和平均数;

(Ⅱ)根据以上统计数据填写下面的 列联表,据此表,能否在犯错误的概率不超过 的前提下,认为以45岁为分界点的不同人群对“两会”的关注度存在差异?

(Ⅲ)按照分层抽样的方法从年龄在35岁以下的人中任选六人,再从六人中随机选两人,求两人中恰有一人年龄在25岁以下的概率是多少.

45岁以下

45岁以上

总计

非常高

一般

总计

参考数据:

0.100

0.050

0.010

0.001

2.706

3.841

6.635

10.828

传承传统文化再掀热潮,央视科教频道以诗词知识竞赛为主的《中国诗词大会》火爆荧屏。将中学组和大学组的参赛选手按成绩分为优秀、良好、一般三个等级,随机从中抽取了100名选手进行调查,下面是根据调查结果绘制的选手等级人数的条形图.

  1. (1) 若将一般等级和良好等级合称为合格等级,根据已知条件完成下面的2×2列联表,并据此资料你是否有95%的把握认为选手成绩“优秀”与文化程度有关?

    优秀

    合格

    合计

    大学组

    中学组

    合计

    注: ,其中 .

    0.10

    0.05

    0.005

    2.706

    3.841

    7.879

  2. (2) 若江西参赛选手共80人,用频率估计概率,试估计其中优秀等级的选手人数;
某基地蔬菜大棚采用水培、无土栽培方式种植各类蔬菜.过去50周的资料显示,该地周光照量X(小时)都在30小时以上,其中不足50小时的周数有5周,不低于50小时且不超过70小时的周数有35周,超过70小时的周数有10周.根据统计,该基地的西红柿增加量y(百斤)与使用某种液体肥料x(千克)之间对应数据为如图所示的折线图.

图片_x0020_100015

附:相关系数 ,参考数据:

  1. (1) 依据数据的折线图,是否可用线性回归模型拟合yx的关系?请计算相关系数r并加以说明(精确到0.01)(若 ,则线性相关程度很高,可用线性回归模型拟合)
  2. (2) 蔬菜大棚对光照要求较大,某光照控制仪商家为该基地提供了部分光照控制仪,但每周光照控制仪最多可运行台数受周光照量X限制,并有如表关系:

    周光照量 (单位:小时)

    光照控制仪最多可运行台数

    3

    2

    1

    若某台光照控制仪运行,则该台光照控制仪周利润为3000元;若某台光照控制仪未运行,则该台光照控制仪周亏损1000元.以过去50周的周光照量的频率作为周光照量发生的概率,商家欲使周总利润的均值达到最大,应安装光照控制仪多少台?

对相关系数 ,下列说法正确的是(  )
A . 越大,线性相关程度越大 B . 越小,线性相关程度越大 C . 越大,线性相关程度越小, 越接近0,线性相关程度越大 D . 越接近1,线性相关程度越大, 越接近0,线性相关程度越小
“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展,下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:

年份

2014

2015

2016

2017

2018

销量(万台)

8

10

13

25

24

某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:

购置传统燃油车

购置新能源车

总计

男性车主

6

24

女性车主

2

总计

30

  1. (1) 求新能源乘用车的销量 关于年份 的线性相关系数 ,并判断 是否线性相关;
  2. (2) 请将上述 列联表补充完整,并判断是否有 的把握认为购车车主是否购置新能源乘用车与性别有关;

    参考公式: ,其中 . ,若 ,则可判断 线性相关.

    附表:

    0.10

    0.05

    0.025

    0.010

    0.001

    2.706

    3.841

    5.024

    6.635

    10.828

根据最小二乘法由一组样本点 (其中 ),求得的回归方程是 ,则下列说法正确的是(  )
A . 至少有一个样本点落在回归直线 B . 若所有样本点都在回归直线 上,则变量同的相关系数为1 C . 对所有的解释变量 ), 的值一定与 有误差 D . 若回归直线 的斜率 ,则变量xy正相关
关于变量 的一组样本数据 ,……, 不全相等)的散点图中,若所有样本点 )恰好都在直线 上,则根据这组样本数据推断的变量 的相关系数为
某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表:

土地使用面积 (单位:亩)

1

2

3

4

5

管理时间 (单位:月)

9

11

14

26

20

并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:

愿意参与管理

不愿意参与管理

男性村民

140

60

女性村民

40

参考公式: ,其中

临界值表:

0.100

0.050

0.025

0.010

0.001

2.706

3.841

5.024

6.635

10.828

参考数据:

  1. (1) 求相关系数 的大小(精确到0.01),并判断管理时间 与土地使用面积 的线性相关程度;
  2. (2) 是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?
下列命题正确的是(    )
A . 将一组数据中的每个数据都乘以同一个非零常数 后,方差也变为原来的 B . 抛掷均匀硬币一次,出现正面的次数是随机变量 C . 线性相关系数 越大,两个变量的线性相关性越强;反之,线性相关性越弱 D . 若回归直线的斜率估计值为0.25, ,则回归直线的方程为
为了对变量 的线性相关性进行检验,由样本点 求得两个变量的样本相关系数为 ,那么下面说法中错误的有
A . 若所有样本点都在直线 上,则 B . 若所有样本点都在直线 上,则 C . 越大,则变量 的线性相关性越强 D . 越小,则变量 的线性相关性越强
武汉某科技公司为提高市场销售业绩,现对某产品在部分营销网点进行试点促销活动.现有两种活动方案,在每个试点网点仅采用一种活动方案,经统计,2018年1月至6月期间,每件产品的生产成本为10元,方案1中每件产品的促销运作成本为5元,方案2中每件产品的促销运作成本为2元,其月利润的变化情况如图①折线图所示.

  1. (1) 请根据图①,从两种活动方案中,为该公司选择一种较为有利的活动方案(不必说明理由);
  2. (2) 为制定本年度该产品的销售价格,现统计了8组售价xi(单位:元/件)和相应销量y(单位:件)(i=1,2,…8)并制作散点图(如图②),观察散点图可知,可用线性回归模型拟合y与x的关系,试求y关于x的回归方程(系数精确到整数);

    参考公式及数据:40,660,xiyi=206630,x12968,

  3. (3) 公司策划部选1200lnx+5000和x2+1200两个模型对销量与售价的关系进行拟合,现得到以下统计值(如表格所示):


    x2+1200

    52446.95

    122.89

    124650

    相关指数

    R

    R

    相关指数:R2=1

    (i)试比较R12 , R22的大小(给出结果即可),并由此判断哪个模型的拟合效果更好;

    (ii)根据(1)中所选的方案和(i)中所选的回归模型,求该产品的售价x定为多少时,总利润z可以达到最大?

如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法正确的是(   )

A . 相关系数r变大 B . 残差平方和变大 C . 相关指数R2变小 D . 解释变量x与预报变量y的相关性变强
相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到线性回归方程 ,相关系数为 ;方案二:剔除点 ,根据剩卜数据得到线性归直线方程: ,相关系数为 ,则(    )

A . B . C . D .
大学生刘铭去某工厂实习,实习结束时从自己制作的某种零件中随机选取了10个样品,测量每个零件的横截面积(单位:)和耗材量(单位:),得到如下数据:

样本号i

1

2

3

4

5

6

7

8

9

10

总和

零件的横截面积

0.03

0.05

0.04

0.07

0.07

0.04

0.05

0.06

0.06

0.05

0.52

耗材量

0.24

0.40

0.23

0.55

0.50

0.34

0.35

0.45

0.43

0.41

3.9

并计算得      

附:参考公式和数据:相关系数

  1. (1) 估算刘铭同学制作的这种零件平均每个零件的横截面积以及平均一个零件的耗材量;
  2. (2) 求刘铭同学制作的这种零件的横截面积和耗材量的样本相关系数(精确到0.01);
  3. (3) 刘铭同学测量了自己实习期制作的所有这种零件的横截面积,并得到所有这种零件的横截面积的和为182 , 若这种零件的耗材量和其横截面积近似成正比,请帮刘铭计算一下他制作的零件的总耗材量的估计值.