5.3.2 关联分析 知识点题库

四川雅安地震发生后,某公司各部门员工积极捐款,公司决定对捐款最多的部门进行表扬。现有一张含有员工姓名、部门、捐款额等信息的Excel工作表,能快速得到捐款最多的部门的方法是(   )   
A . 按捐款额排序 B . 按部门+捐款额排序 C . 自动筛选 D . 按部门分类汇总捐款额
瑞中2015级主持人大赛决赛成绩如下,请根据各小题要求填空。

图一

  1. (1) “评委五”一列出现“#”提示符的原因:
  2. (2) 请使用min()函数完成“最低分”的统计,H3公式是:
  3. (3) 请完成五个评委的“原始总分”统计,I3公式是:
  4. (4) 请完成“最后总分”统计,J3公式是:

    ( 最后总分 = 原始总分 - 最高分 - 最低分)

  5. (5) 请完成“最后总分”的“总平均分”的统计,J17公式是:
  6. (6) 完成“最后总分”与“总平均分”差距(相减)的统计,K3公式是:
  7. (7) 如果以“最后总分”为关键字进行排序,应选择的区域为:
小王收集了某地农产品价格数据,用Excel对其进行分析,整理后的数据如图a所示。请回答下列问题:

  1. (1) 表中J列数据是通过公式计算得到的。小王首先在J5单元格中输入公式:,然后利用自动填充功能向下填充到J23单元格。
  2. (2) 小王想对蔬菜类的数据以“农产品品种”为主要关键字按升序进行排序,则他应该选择的数据区域是
  3. (3) 小王要对数据进行筛选,筛选条件如图b所示,则他共筛选出行数据。

  4. (4) 小王根据图a中数据制作了一个图表,如图c所示,则制作此图表的数据区域为

小王收集了2017年8月我国50个城市部分食品平均价格变动情况,使用Excel软件对数据进行处理,界面如图所示。请回答下列问题:

图a

  1. (1) 已知 E14 单元格是由 C14 单元格复制公式得到的,则 E14 单元格中的公式为
  2. (2) 小米在操作时,不小心将 E3:E12 的数据删除,则 E14 单元格的值为(单选,填字母:A .“10”/ B .“0”/ C .“#DIV/0!”/ D .“#VALUE!”)
  3. (3) 如图 a 所示,若要将数据按照“食品名称”进行升序排序,应该选择的区域为           
  4. (4) 小王创建了如图 b 所示的图表,该图表的数据区域为

    图  b

小王收集了2018年、2019年、2020年内地电影票房排行数据,并使用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 如图a所示,区域A10:A18通过RANK函数计算得到2019年总票房的年度排名,在A10单元格输入公式后,用自动填充功能完成A11:A18的计算,则A10单元格的公式是

    (提示:RANK函数返回某数字在一串数值中的相对其他数值的大小排名。例如:=RANK(D3,D3:D9)表示D3中的数值在D3:D9区域中所有数值中的大小排名)

  2. (2) 根据图a中数据制作的图表如图b所示,创建该图表的数据区域是,C17,D17,C19,D19。
  3. (3) 如果给2020年的电影按“总票房(亿)”进行从高到低排序,应选择的数据区域为,排序完成后,图b所示的图表是否会发生改变(选填:会/不会)。
结合现实生活中的体验,谈一下数据分析的意义。
(      )和回归分析都可用于预测,预测是指从基于样本数据记录,根据分类准则自动给出对未知数据的推广描述,从而实现对未知数据进行预测。
A . 特征探索 B . 数据分类 C . 聚类分析 D . 关联分析
下列不是用于有关关系分析的是(      )
A . 百分比圆环图 B . 雷达图 C . 词云图 D . 网络关系图
wordcloud库是一个(     )的第三方库。
A . 统计分析 B . 中文分词 C . 词云展示 D . 绘图
下列不是数据分析类型的是(     )
A . 有关趋势的分析 B . 有关比例的分析 C . 有关大小的分析 D . 有关关系的分析
人事部统计了公司面试人员三项成绩的数据,并使用Excel软件对数据进行处理,请回答下列问题:
  1. (1) 区域L4:L100的数据是通过公式计算得到的,在L4单元格中输入公式后,再使用自动填充功能完成区域L5:L100的计算,则由图a可知 L100 单元格中的公式为。(提示:总分=笔试总分×50% +面试总分×30%+才艺总分×20%)

    图 a

  2. (2) 若要按照总分成绩对本次参加招聘的人员进行降序排序,则应选取的排序区域为
  3. (3) 在新工作表中计算各面试人员“笔试总分”、“面试总分”和“才艺总分”的平均分后,创建了如图b所示的图表。结合图a和图b,下列说法正确的有                 (多选,填字母)。

    图 b

    A . 由图b可知男生面试总分平均分远高于女生,而女生的笔试及才艺平均分高于男生 B . 由图a可知,列A中的单元格格式可能为数值类型 C . 在图a所示工作表的L列前插入一列,“总分”列的数值会发生改变 D . 更新数据导致新工作表中男生“笔试总分”的平均分发生变化,图表会随之改变
小枫收集了2020年上半年两个季度的全国建筑业发展情况,并用Excel软件进行处理,如图a所示。请回答下列问题:

  1. (1) 图a中,区域K4:K33中的数据是通过在K3单元格中输入公式并利用自动填充得到的,则K3单元格中的公式为 。(注:季度环比增长倍数=(第二季度总产值-第一季度总产值)/第一季度总产值)
  2. (2) 利用图a中的部分数据制作了图表,如图b所示,则该图表的数据区域是

      

  3. (3) 若要对华北地区各省市按“季度环比增长倍数”的情况进行降序排序,则应选择的排序区域是
  4. (4) 根据图a中的表格数据,下列说法正确的是            。(单选,填字母)。
    A . C列数据一定是利用公式计算得出 B . 若隐藏题图a表格的第8-0行,则题图b的图表会发生变化 C . 华北、东北、华东三个地区中,东北地区第二季度建筑业的环比增长最快
用Excel记录家庭每月用电量,并使用峰谷用电标准统计家庭电费使用情况,如图图a所示。请回答下列问题:

图a

  1. (1) 如图a所示,用I9单元格中的公式自动填充到J9和K9,则J9单元格的公式为
  2. (2) 根据上述公式自动填充后,则单元格K9将显示(单选,填字母:A . 1568/ B . 0/ C . #DIV/0!/ D . #REF)。
  3. (3) 将图a中B2:G16区域的数据复制到新工作表对应区域,并在新表中将数据按“总电量”为关键字进行排序,应选择的数据区域是
  4. (4) 根据图b所示,下列描述正确的是(单选,填字母:A .若G4单元格的数据修改为“70”,则图表也会随之发生改变/B .要在该图表中添加“低谷电”的相应数据,应增添的数据区域为F3:F16/C .调整该图表的宽度和高度,G4单元格的数据也会发生变化)。

    图b

关于新冠肺炎疫情的信息,由疫情实时大数据报告(如图为部分数据截图)获知,其中用汉字、数值、加减符号描述疫情确诊、治愈、死亡等情况;还可以用颜色、数据表、图描述疫情地区分布、境外输入确诊趋势等情况。请运用数据信息、知识与智慧之间的相互关系完成下列判断。

  1. (1) 疫情实时数据记录的形式有汉字、颜色、图等,因此数据具有二进制性特征。
  2. (2) 图1中用深红色突出显示确诊人数在10000以上的地区,深红色是数据,也是载体,它所承载的信息是“新冠肺炎确诊人数≥10000”。
  3. (3) 由图2可获知“新型冠状病毒肺炎国外新增确诊人数呈上升趋势”。
  4. (4) 由图1中“数据更新至2020.10.21 15:26”表明信息具有时效性,一旦超过其“生命周期”就失去原有的效用,成为历史记录。
  5. (5) 从图中获取新冠疫情数据和信息,不仅能帮助我们了解疫情情况,还能帮助我们解决个人防护问题。
  6. (6) 知悉新冠肺炎具有传染性后,我们需要学习新冠肺炎预防知识进行个人防护。
数据分析的常见方法包括平均分析、对比分析、交叉分析。
某国的一家大型连锁超市通过利用信息系统对大量的销售数据进行了特定的分发现一个“奥秘”,于是这家超市就把尿布和啤酒这两种看起来没有关联的商品摆放在一起销售,结果销售量大幅增加。原来,超市经营者从数据分析中发现,婴儿尿布通常是男人们下班时购买的,而他们在购买尿布时又会顺便购买自己爱喝的啤酒。这个案例中的超市信息系统应用了大数据分析中的哪种技术?(  )
A . 聚类分析 B . 关联分析 C . 分类分析 D . 回归分析
下列选择中,不是用于数据分析的是(      )
A . 现状分析 B . 原因分析 C . 预测分析 D . 可行性分析
小华收集了2011年~2020年全国废气主要污染物排放的部分数据,并使用Excel软件对数据进行处理,如图a所示。

请回答下列问题:

  1. (1) 在C4单元格中输入公式,再向下自动填充至单元格C12,并将区域C4:C12复制粘贴到区域E4:E12和G4:G12,则单元格E4中的公式为
  2. (2) 由于操作失误,不小心清除了单元格B12中的内容,则C12单元格中显示的结果是(单选,填字母A . #DIV/O! / B . #REF! / C . -100.00% / D . 100.00%)
  3. (3) 为了反映2011年~2020年全国废气主要污染物排放变化情况,根据图a中的数据制作的图表如图b所示。综合图a和图b,下列说法正确的有           (多选,填字母)。

    A . 创建该图表的数据区域为A1,A2:B12,D2:D12,F2:F12 B . 2011年~2020年间主要污染物排放量减少最快的是二氧化硫 C . 将图a中数据按年份进行降序排序,则图表不会发生变化 D . 将区域F3:F12中的数值格式设置为1位小数,则图表不会发生变化 E . 依次以“二氧化硫环比”、“氮氧化物环比”为筛选条件,都选择“最小3项”进行筛选后,筛选结果只显示2016年和2020年的数据
以下哪一个选项不是数据分析主要用于的场景(       )
A . 现状分析 B . 数据运算 C . 原因分析 D . 预测分析
一辆车发生交通事故后逃逸,王警官从现场四位目击证人处获得了以下线索。甲说:“车牌照以“苏FS”开头,后跟着四位数,乙说四位数字的前两位数字相同;丙最后两位数字也相同,但与前两位不同,丁是数学家,他说:四位数字刚好是一个整数的平方。请你根据以上线索协助王警官尽快锁定肇事车辆。
  1. (1) 通过分析以上信息,肇事车辆的车牌号为“苏FS”;四位数字,你认为下列选项(   )最符合这四位数字的特征。
    A . 形如xxyy B . 形如xxyy,且x≠y C . 形如xxyy,且x≠y,xxyy是整数z的平方 D . 形如xxyy,且x≠y,x≠0
  2. (2) 根据以上分析,我们能用目前所学的数学方法很快求出x与y值。
  3. (3) 根据车牌号的实际情况,四位数中x与y可能的区间是,z可能的区间是

    A.0-9

    B.1-9

    C. 0-100

    D.1-99

  4. (4) 由于计算机运算速度快,我们可以一一列举x、y和z的所有可能值的算法叫(   )。
    A . 枚举 B . 贪心 C . 递归 D . 迭代
  5. (5) 小李根据以上分析想出了算法1,代码实现如下,其中X、Y、Z是第⑶题中对应X、Y、Z的最大值加1,请问实现框内循环体的执行次数为

  6. (6) 小明以“车牌号的后四位刚好是整数的z的平方”为突破口想出了算法2,并画出如下所示的流程图,其中zmin和zmax分别表示整数z的最小值和最大值,用第3题中的结果直接代入。小明对(1)(2)处有些疑惑,请帮他选择正确的一项(   )

    A . (1) qw==bwandsw==gw and bw=!sw    (2)n+1 B . (1) qw==bw andsw==gw and bw!=sw     (2)n+1 C . (1) qw==bworsw==gw and bw!=sw      (2)n+2 D . (1) qw==bwandbw=!Sw            (2)n+2
  7. (7) 算法2的循环体要执行次,从这个角度看算法更优,因此算法有优劣之分。
  8. (8) 通过以上分析,我们知道编程解决问题的一般过程需经过以下几个步骤,正确的顺序是(   )

    ①调试运行②设计算法③编写代码④画流程图⑤分析问题⑥界定问题

    A . ⑤②③① B . ②⑥③① C . ⑤④③① D . ⑤④⑥①