5.1 走近数据分析 知识点题库

小王收集了2014-2016年主要国家的外币储备数据,并用Excel软件进行处理,如图a所示。请回答下列问题:

  1. (1) 为计算2016年外币储备的排名情况,在F4单元格中使用RANK函数统计区域E4:E13中的排名,然后通过自动填充得到F5:F13的公式。请写出F4单元格中正确的公式:

    (提示:RANK函数功能为返回某数字相对于某一列数据的大小排名。该函数有三个参数,例如:=RANK(B4,B$4:B$20,0)表示B4在数据区域B4:B20中的排名,第三个参数0表示降序排列)

  2. (2) 根据图a中的数据制作如图b所示的图表,则该图表的数据区域为

  3. (3) 如图a所示,如果以“涨跌幅”为主要关键字进行排序,则排序时所选择的数据区域为
  4. (4) 将区域A3:F13的数据复制到新工作表,在新工作表中对数据进行筛选操作,筛选设置如图c所示,则按此设置筛选出的国家有个。

小董收集了某购书网站主要畅销书销售数据,并使用Excel软件进行数据处理,如下图表格所示。

  1. (1) 区域I3:I17的数据是通过公式计算得到的,在I3单元格中输入公式,再利用自动填充功能完成区域I4:I17的计算。
  2. (2) 根据上图表格中的数据制作了如下柱形图图表,创建该图表的数据区域是

  3. (3) 小董若在上图表格工作表中对数据进行进一步的操作,下列说法正确的是_____________(多选,填字母)。
    A . 若要对“历史人文”类别的书籍以“折扣”为关键字升序排序,应选择排序的区域是A6:I9 B . 若在该工作表中,对D3单元格的数值小数位数设置为1,I3单元格的数值不变 C . 若在该工作表中的C列和D列之间插入一列,则书籍《大国战略》的“年销售金额”数据将在单元格J17中,该单元格公式变为:=C17*$E17*SUM(F17:I17) D . 若以“定价(元)”为最小1项进行筛选,则上面柱形图图表不会变化
人们用数据记录自然现象与社会发展,数据可以用来描述不同事物的特征。
数据可视化是指以图形、图像和动画等方式更加直观生动地呈现数据及数据分析结果,揭示数据之间的关系、趋势和规律等。
某艺术院校举行了三个类别的艺术校考面试,并用Excel软件进行数据处理,如图a所示。

 

请回答下列问题:

  1. (1) 总分是将“理论知识”成绩的10%与“专业问答”、“表演技能”的成绩按权重比例3:2:5相加所得。通过F3单元格中的公式,对数据区域F4:F59进行自动填充,则F3单元格中的公式为
  2. (2) 根据图a中的数据制作的图表如图b所示,创建该图表的数据区域是

  3. (3) 为了找出“歌唱类”中“专业问答”最高的3个报名号(若存在符合条件的多个报名号,则全部选取),下列操作可以实现该效果的是       (填字母)。
    A . 以“类别”为歌唱类,“专业问答”为最大3项进行筛选,然后选取筛选出的全部项。 B . 以“类别”为歌唱类进行筛选,再以“专业问答”为主要关键字降序排序,选取排在最前面的3项。 C . 以“专业问答”为主要关键字,“类别”为次要关键字,均按降序排序,选取排在最前面的3项。 D . 以“专业问答”为主要关键字降序排序,再以“类别”为歌唱类进行筛选,选取排在最前面的3项。
如图所示为某导航系统的导航路径。现在,人们的日常出行越来越离不开导航系统,人们也日益感受到智能交通带来的便利。下列有关智能交通的说法中错误的是(      )

A . 智能交通整合了物联网、大数据、云计算、人工智能等技术 B . 智能交通提高了交通效率但降低了安全性 C . 智能交通最终使交通运输服务和管理智能化 D . 智能交通对数据进行实时采集、传输和处理
下列关于大数据的说法,正确的是(    )
A . 大数据分析的是抽样数据 B . 用大数据进行数据处理时,必须保证每个数据都准确无误 C . 大数据的数据来源主要还是人力 D . 大数据采集的数据有结构化、半结构化和非结构化的数据类型
关于新冠肺炎疫情的信息,由疫情实时大数据报告(如图为部分数据截图)获知,其中用汉字、数值、加减符号描述疫情确诊、治愈、死亡等情况;还可以用颜色、数据表、图描述疫情地区分布、境外输入确诊趋势等情况。请运用数据信息、知识与智慧之间的相互关系完成下列判断。

  1. (1) 疫情实时数据记录的形式有汉字、颜色、图等,因此数据具有二进制性特征。
  2. (2) 图1中用深红色突出显示确诊人数在10000以上的地区,深红色是数据,也是载体,它所承载的信息是“新冠肺炎确诊人数≥10000”。
  3. (3) 由图2可获知“新型冠状病毒肺炎国外新增确诊人数呈上升趋势”。
  4. (4) 由图1中“数据更新至2020.10.21 15:26”表明信息具有时效性,一旦超过其“生命周期”就失去原有的效用,成为历史记录。
  5. (5) 从图中获取新冠疫情数据和信息,不仅能帮助我们了解疫情情况,还能帮助我们解决个人防护问题。
  6. (6) 知悉新冠肺炎具有传染性后,我们需要学习新冠肺炎预防知识进行个人防护。
数据分析的过程不包括(     )。
A . 首先要根据分析的目标提出假设 B . 然后选择恰当的分析方法进行分析 C . 验证假设是否正确 D . 根据分析直接得出相应的结论
通过对历史交易记录这个庞大数据库的观察,沃尔玛注意到,每当美国季节性飓风来临之前,不仅手电筒销量增加,而且含糖蛋挞销量也增加了。因此每当季节性飓风来临时,沃尔玛就会把含糖蛋挞与飓风用品摆放在一起,能够增加销量。以上材料最能体现的是(    )
A . 大数据时代不一定强调因果关系的探求,而更注重相关性 B . 大数据的价值密度低,能发挥作用的是其中的一小部分 C . 大数据给生活带来便利的同时,也带来一些社会问题 D . 大数据时代要分析的是全体数据,而不是抽样数据
数据挖掘时指在庞大的数据库中寻找有价值的隐藏实践,加以分析,并将有意义的信息进行归纳,为决策提供参考依据和控制机制,因此,(      )是信息挖掘的第一步。
A . 数据清理 B . 数据收集 C . 数据变换 D . 数据归纳
小王收集了2020年12月和2021年1月我国重要生产资料市场价格数据,并使用Excel软件进行数据处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域G3:G35的数据是通过公式计算得到的,在G3单元格中输入公式后,使用自动填充功能完成区域G4:G35的计算,则G3单元格中的公式是

    (提示:涨跌幅(%)=本期价格(元)-上期价格(元)/ 上期价格(元)*100)

  2. (2) 根据图a中的数据制作图表如图b所示,则图表的数据源是

    图b

  3. (3) 结合图a、图b分析,下列说法正确的有             (多选,填字母)。
    A . 若删除“F列”,则图b所示图表不会随之改变 B . 若不小心删除D3单元格的值,则G3单元格显示的内容变为“#DIV/0!” C . 以“类别”为“黑色金属”,“涨跌幅(%)”为“最大一项”进行筛选,则筛选出黑色金属中涨幅最大的产品 D . 选中区域A2:F35,按“比上期价格涨跌(元)”降序排序,区域G3:G35显示的值不会随之改变
某超市曾经研究销售数据,发现买商品A的人购买商品B的概率很大,这种属于数据的(  )
A . 聚类分析 B . 关联分析 C . 分类分析 D . 回归分析
图为2020年2月3日-4月15日我国工程建设领域复工率(含新建项目)、复工强度变化的图表表达,下面说法正确的是(    )

①单独一个数据是没有意义的,将数据联系起来进行加工处理分析,可以获取信息

②数据和信息都是有价值的,其价值时刻都能体现出来

③折线图适合表示数据间的对比,柱形图适合表示数据变化趋势

④从图表中可以分析出4月15日复工率已达3月18日的1.5倍左右,这反映了我国工程建设领域市场旺盛的需求

⑤根据对图表的分析,建议加强工程机械供应链及生产管理,保障工程建设复工的顺利进行

A . ①②④⑤ B . ①④⑤ C . ③④⑤ D . ①②③
综合题
  1. (1) 关于数据整理的说法,正确的是                 (单选)
    A . 格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据 B . 某人的出生日期数据为“2000/11/32”,是一种逻辑错误 C . 数据整理的目的包括,减少数据量,检测和修正错漏的数据,整合数据资源和提高数据质量 D . 要探究若干数据系列中各数值之间的关系,可采用散点图、柱形图
  2. (2) 小张从网上下载了第六次人口普查的相关数据,并用Excel软件进行数据处理,如图所示,区域E4:G14的数据是通过公式计算得到的,在E4单元格中输入公式,再使用自动填充功能完成区域E5:E14和F4:G14的计算。

    (提示:占总人口比重=年龄段人口数/总计人口数×100) )

  3. (3) 若要建立一张各年龄段人口比重图,合理的图表类型为(选填:柱形图/条形图/饼图)
想通过分析某同学各学科历次考试成绩的分数情况,预测他的下一次考试成绩,其基本步骤是

①数据整理 ②数据采集  ③ 撰写分析报告  ④ 数据分析与可视化

德国男人超市购买婴儿纸尿布的同时往往还购买啤酒,计算机分析超市的购物数据后发现了这一规律,于是将啤酒货架移到了婴儿纸尿布货架旁,啤酒和纸尿布的销量都有所增加。计算机分析购物数据发现这一规律的过程属于
在Excel中,若要直观地呈现全校男女同学的比例关系,最好使用
2020年2月3日-4月15日我国工程建设领域复工率(含新建项目)、复工强度变化的图表表达如下图,选项说法正确的是(     )

①单独一个数据是没有意义的,将数据联系起来进行加工处理分析,可以获取信息

②数据和信息都是有价值的,其价值时刻都能体现出来

③折线图适合表示数据间的对比,柱形图适合表示数据变化趋势

④从图表中可以分析出4月15日复工率已达3月18日的1、5倍左右,这反映了我国工程建设领域市场旺盛的需求

⑤根据对图表的分析,建议加强工程机械供应链及生产管理,保障工程建设复工的顺利进行

A . ①④⑤ B . ①②④⑤ C . ③④⑤ D . ①②③
在WPS表格中,创建图表时,应首先(     )。
A . 选择图表的形式 B . 选择图表的类型 C . 选择图表安放的位置 D . 选定创建图表的数据区域