4.2 大数据处理 知识点题库

在Excel中,要求在使用分类汇总之前,先对字段进行排序。
为了直观地关注全国范围内新型冠状肺炎病毒感染的情况, 某同学使用Excel软件记录了2月4日至2月10日全国各省每天的累计确诊人数和治愈人数。部分界面如图1所示:

请回答下列问题:

  1. (1) 为了统计当天增加的确诊人数和治愈人数,该同学在039单元格使用公式已计算出2月10日的治愈增长人数,若在当前状态下使用自动填充的方式获得B39:N39单元格内的数据,C39单元格中的内容将为(单选,填选项:A .885/B .#REF!/C .#VALUE!/D .0)
  2. (2) 治愈率即当天的累计治愈人数占累计确诊人数的比重(治愈率=治愈/确诊*100%),为了计算截至2月10日的治愈率,应在N40单元格填写公式
  3. (3) 图2为部分省份某日疫情柱状图,绘制该图表的数据区域为:
  4. (4) 累计确诊人数超过1000人的地区为重点关注地区,为了了解国内有多少省份需要重点关注,可以使用“筛选”中的 (单选,填选项:A .最大10项/B .自定义筛选)获得。
数据分类说法正确的是(    )
A . 对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。 B . 分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。 C . 是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。 D . 是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
总结归纳数据分析的常用方法。
结合现实生活中的体验,谈一下数据分析的意义。
使用Excel软件处理“2019年4月流通领域重要生产资料市场价格变动情况”数据,如图所示。

  1. (1) 计算表中下旬价格相比上期价格的涨跌幅(%):选择G4单元格输入公式,然后用自动填充功能完成其他单元格的计算则G4单元格中可使用的公式为
  2. (2) 若要对比分析图中的上、下旬价格的变化情况,写出一种分析方法。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然(     )的计算机进行处理,必须采用分布式架构。
A . 单台计算机 B . 超运算 C . 无法用超运算 D . 无法用单台计算机
聚类分析的基本算法从数据点集合中固定选择K个点作为初始的聚集中心,每个中心点代表着每个聚集中心的平均值。
数据可视化是指以图形、图像、地图、动画等生动、易于理解的方式展示数据和诠释数据之间的关系、趋势与规律等,以便更好地理解数据。
如要编程画出由100个圆组成的图案,比较好的算法是(   )。
A . 按顺序执行100个画不同大小圆的程序段 B . ①先编写1个能画不同大小圆的程序模块 ②在主程序中用100语句调用画圆程序模块 C . ①先编写1个能画不同大小圆的程序模块 ②用循环方法调用100次画圆程序模块 D . 不必先定义画圆程序模块,而直接循环100次的方法来画图案
王老师收集了学校男生寝室三项检查成绩的数据,并使用Excel软件对数据进行处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域L4:L93的数据是通过公式计算得到的,在L4单元格中输入公式,再使用自动填充功能完成区域L5:L93的计算。(提示:总分=内务分×20%+卫生分×30%+纪律分×50%)
  2. (2) 寝室号的编制规则是:楼号(第1字符)+楼层号(第2字符)+房间号(第3、4字符)。若要筛选出各男生寝室楼的3楼寝室,筛选方式设置如图b所示,则①处应为 (选填:包含/等于/开头是)。

    图b

  3. (3) 在新工作表中计算各年级“内务分”、“卫生分”和“纪律分”的平均分后,创建了如图c所示的图表。结合图a和图c,下列说法正确的有          (多选,填字母)。

    图c

    A . 由图c可知男生寝室纪律最好的是高三,内务和卫生最好的是高二 B . 更新数据导致高一“内务分”的平均分发生变化,图表不会随之改变 C . 对区域L2:L3执行“合并单元格”操作,合并后的单元格名称为L2 D . 在图a所示工作表的“寝室号”列前插入一列,“总分”列的数值会发生改变
某同学收集某书店销售及库存的统计数据,使用EXCEL软件处理,如图a所示。

图a

每本书对应一个唯一的书名编码,请回答下列问题:

  1. (1) 根据“销售清单”每本书的销售数量,计算销售小计。先在H3单元格计算“书名编码”是“A”的销量小计,并将公式自动填充到H8单元格。则H3单元格的公式是

    (提示:SUMIF函数用于对区域中满足条件的单元格求和,例如:=SUMIF(B3:B9,B3,E3:E9),表示区域B3:B9中“书名”是“《量子力学》”的所有“小计”的和)

  2. (2) H8单元格显示的结果是(单选,填字母:A .#DIV/0! / B .#VALUE! / C .0 )。
  3. (3) 根据图a中数据制作的图表如图b所示,下列说法正确的是            (多选,填字母)。

    图b

    A . 创建该图表的数据区域是G5:H7 B . 将图a“销售清单”中第9行的书名编码“D”改为“A”,则图表会随之变化 C . 对图a“销售清单”中的数据区域A2:E9进行排序,则图表会随之变化 D . 删除“图a”工作表中书名编码是“A”所在的第3行,则图表不会随之变化
分治的设计思想,是将一个难以直接解决的大问题,分割成一些较小的同类问题,各个击破,最终达到解决问题的目的。分治法所能解决的问题所具有的特征,以下说法错误的是(    )
A . 该问题可以分解为若于个规模较小的相同的子问题 B . 该问题的规模足够大 C . 该问题的规模缩小到一定的程度就可以很容易地解决 D . 将各个子问题的解可以合并为原问题的解
下图是某国各类能源消费量各年份的变化趋势情况分析表,从图中可看出(  )。

①历年来煤炭在各类能源消费中所占比例最高

②从1970年至2000年石油消费呈逐年递减的趋势

③近年该国加大力度开发石油、天然气资源,石油、天然气的消费增高,而煤炭消费比重降低

④天然气具有价格低、污染少、安全等优点,人们对天然气的需求大幅度增加

A . ①② B . ①③ C . ①③④ D . ①④
德国男人超市购买婴儿纸尿布的同时往往还购买啤酒,计算机分析超市的购物数据后发现了这一规律,于是将啤酒货架移到了婴儿纸尿布货架旁,啤酒和纸尿布的销量都有所增加。计算机分析购物数据发现这一规律的过程属于(     )。
A . 信息分类 B . 智能代理 C . 模式识别 D . 关联分析
小明参加课外活动小组,对盆栽中某一枝条做好标记,记录28天内该枝条的生长情况,每周日记录一次,四次记录结果分别为8.8cm、10.1cm、10.9cm、11.4cm。他使用Python编码。制作了关于枝条长度(单位:cm)的柱形图,代码及柱形图如下图所示,代码空白处应填。 (       )

A . "8.8,10.1,10.9,11.4" B . "8.8","10.1","10.9","11.4" C . 8.8,10.1,10.9,11.4 D . [8.8,10.1,10.9,11.4]
数据分析的方法不包括(     )
A . 线性分析 B . 关联分析 C . 聚类分析 D . 数据分类
数据挖掘是指在庞大的数据库中寻找有价值的隐藏事件,加以分析,并将这些有意义的信息进行归纳,为决策提供参考依据和控制机制。因此,(    )是信息挖掘的第一步。
A . 数据归纳 B . 数据变换 C . 数据收集 D . 数据清理
关于大数据处理,下列说法正确的是(     )
A . 大数据必须采集完成后才能处理 B . 大数据包括对静态数据的批处理、对流数据的实时计算和对图结构数据的图计算 C . 大数据只能处理结构化数据不能处理非结构化的数据 D . 数据的可视化可以增强数据的解释力与吸引力
数据分析报告是项目的展示,也是数据分析结论的有效承载形式。在数据分析报告中,首先需要明确数据分析的,阐述目前及通过分析希望解决的问题;其次需要描述数据来源和数据分析的;最后需要重点呈现数据分析的