5.1 走近数据分析 知识点题库

用EXCEL工作表记录全年级学生的期末考试成绩,包含学生的姓名、班级、科目成绩、总分等信息,能快速得到平均总分最高的班级的最好方法是(   )。
A . 按学生的总分排序 B . 按班级+总分排序 C . 自动筛选 D . 按班级对总分进行分类汇总
小李对金融很感兴趣,他关注“中国石油”的股票并下载了近期的交易数据,如图-1所示。

  1. (1) “涨跌额”为本交易日的“收盘价”与前一交易日的“收盘价”之差,要计算各交易的“涨跌额”,可在F3单元格输入公式 后,利用自动填充功能完成其他交易日的“涨跌额”计算。
  2. (2) 以区域的数据制作2015年2月2日至2015年3月13日“中国石油”收盘价的行情图,如图-2所示,该图表的类型是

  3. (3) 分析图-2可知,下列4个时间段:“收盘价”涨幅最大的时间段是       (填序号)。
    A . 2015年2月2日至2015年2月3日 B . 2015年2月16日至2015年2月17日 C . 2015年2月25日至2015年2月26日 D . 2015年3月11日至2015年3月12日
Excel中“求平均数”的函数是(  )
A . Min( ) B . Sum( ) C . Average( ) D . Max( )
某中学高一进行了一次学科能力测试,并将学生成绩用Excel软件进行数据处理,部分界面如图a所示。

请回答下列问题:

  1. (1) 表中每位学生的每门学科均差值=该同学该科成绩-该科平均成绩,因此需在E3单元格中输入公式,然后自动填充到E4:E22,并复制粘贴到G3:G22,H3:H22各区域,完成每位学生的每门学科均差值的计算。
  2. (2) 由于操作失误,将区域J3:J22的数据误删除,则J23 单元格中显示的结果是。(单选,填字母 A .0.0 / B .#DIV/0! / C .#REF! / D .234.1)
  3. (3) 根据图a所示的数据制作了图表如图b所示,下列描述正确的是             (多选题,填字母)
    A . 该图表的数据区域为D2,F2,H2,C23:D23,F23,H23 B . 将A2:J22区域的数据按总分进行降序排序,则图表不会发生变化 C . 以“班级”为高一(2)班、“总分”为最大1项进行筛选,则可以筛选出高一(2)班总分最高的学生 D . 先以“班级”为高一(2)班进行筛选,然后再按照总分进行降序排序,则最前面一条记录为高一(2)班总分最高的学生
小红收集了12个月水、电、燃气和电话费的数据,并使用Excel软件进行数据处理,如图a所示。请回答下列问题:

图 a

  1. (1) 表格第1行中的标题“水、电、燃气和电话费的统计”可以在A1单元格中输入标题,合并区域后居中得到。
  2. (2) 表格中的费用(水费、电费、燃气费)是通过公式计算得到(如:电费=用电量×电费单价)。这些费用的计算结果在用水量、用电量、用气量或单价更改时仍正确,则G3单元格中的公式是
  3. (3) 根据图a所示的数据制作的图表如图b所示,下列描述不正确的是 (多选,填字母)。

    图b

    A.该图表的数据区域为 C15,E15,G15:I15

    B.若清除 I15 单元格中的内容,则该图表不会发生变化

    C.如将 A 列数据隐藏,该图表会发生变化

    D. 将 A2:I15 区域的数据按“小计(元)”为关键字进行降序排序,该图表会发生变化

  4. (4) 将图a中A2:L14区域的数据复制到新工作表对应区域并进行筛选,设置筛选条件如图c所示,则按此设置筛选出的月份个数共有个。

    图 c

下列对大数据的理解错误的是(   )。
A . 从互联网产生大数据的角度来看,大数据具有“4V”特征,分别是大量(Volume),多样(Variety),低价值密度(Value),高速(Velocity)。 B . 从互联网思维的角度来看,大数据具有三个特征:样本渐趋于总体,精确让位于模糊,相关性重于因果。 C . 从大数据存储与计算的角度来看,大数据具有两个特征:分布式存储和分布式并行计算。 D . 以上都不对
数据分析的基本方法包括(   )
A . 特征探索、关联分析、聚类分析、数据分类 B . 特征探索、聚类分析、数据分类 C . 特征探索、数据分类 D . 关联分析、聚类分析、数据分类
下列大数据服务中,应用了医疗大数据的是(    )
A . 股价预测 B . 临床决策支持 C . 智能投资顾问 D . 农业灾害预警
当前大数据技术的基础是由(    )首先提出的。
A . 微软 B . 百度 C . 谷歌 D . 阿里巴巴
大数据的分析理念在数据规模上强调相对数据而不是绝对数据。
某地区进行了三个类别的教师招聘,并用EXCEL软件进行处理,如图a所示。

  1. (1) 总分是将“笔试”成绩和“面试”成绩分别乘以对应的权重相加所得。通过E3单元格的公式,对E4:E32进行自动填充,E4单元格中显示的结果是。(单选,填字母:A .#DIV/0! / B .#REF / C .0.00 / D .76.55)若要通过该公式能正确自动填充到E4:E32,则E3单元格的公式应改为
  2. (2) 根据图a中数据制作的图表如图b所示,创建该图表的数据区域是

    从1图b到图c可通过设置图d中(填字母A/B/C/D)得到。

  3. (3) 为了获得小学音乐类别中总分最高的准考证号(若存在符合条件的多个准考证号,则全部选取)。下列方法可行的是            (多选,填字母)
    A . 以“报考职位”为小学音乐进行筛选,再以“总分”为关键字降序排序,选取排在最前面的记录。 B . 以“报考职位”为主要关键字,以“总分”为次要关键字,均按降序排序,选取排在最前面的记录。 C . 以“报考职位”为小学音乐进行筛选,再以“总分”为最大的一项进行筛选,然后选取筛选后的记录。 D . 以“总分”为关键字进行降序排序,再以“报考职位”为小学音乐进行筛选,选取排在最前面的记录。
数据分析的方法中,下列(    )不是。
A . 特征探索 B . 建立模型 C . 线性分析 D . 聚类与分类
要统计大豆的营养成分比重,试问用哪一种表示方法更好一些?(    )
A . 表格 B . 饼形图 C . 折线图 D . 项目符号
下列选项中,可以实现实时数据可视化的是(    )
A . 导航地图 B . 标签云图 C . 思维导图 D . 统计图表
大数据时代,数据使用的关键是(      )   
A . 数据收集 B . 数据存储 C . 数据分析 D . 数据再利用
收集2020年全国部分城市1-4月降雨量,并用Excel软件对数据进行处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域G3:G36的数据要通过公式计算得到,在G3单元格中输入公式,再使用自动填充功能完成区域 G4:G36的计算。(rank函数的作用求某一个数值在某一区域内一组数值中的排名。rank函数的语法格式=rank(number,ref,[order])number ——参与排名的数值,ref ——排名的数值区域,order——有1和0两种。0——从大到小排名(降序),1——从小到大排名(升序)。0默认不用输入,得到的就是从大到小的排名。)
  2. (2) 对区域A2:G36进行相关数据分析,下列说法正确的是                (多选,填字母)
    A . 为了显示华北地区4月降雨量大于60的城市,可以先对“地区”进行筛选选择的值为“华北地区”,再对“4月”进行筛选,设置的筛选条件是大于60 B . 为了找出3月降雨量最高的三个城市,可以对“3月”进行筛选,选择“10个最大的值”并显示最大的3项 C . 若不小心删除C列数据,G列2月降雨量排名的值也会随之变化 D . 从数据表中可以看出,华北地区1月几乎不降雨
  3. (3) 要对2020年华东地区4月的降雨量为主要关键字降序排序 ,则所选择的数据区域是
某男同学的体重80KG,身高170cm,请问,以下能用来判断该同学偏肥或偏瘦最有效的数据分析方法是
下图为一张血液化验单,该化验单的分析不正确的选项是(    )

(说明:竖框为蓝的框,横框为红色框)

A . 医生根据化验结果做出诊断,依靠的是专业基础知识和临床实践经验 B . 蓝色框内是一组孤立的数据,不结合检查项目无法确定其含义 C . 红色框内的信息表明患者血红蛋白测定数据低于参考值 D . 该医院近年来的患者血液化验结果就可以构成医疗大数据
打开“Y:\79”文件夹中的文件“主要城市降水量.xlsx”进行以下操作并保存。

⑴将区域A1:N1合并居中,并将标题设置为楷体、加粗、14

⑵利用函数计算各城市的全年降水量,并将表格中的所有数据设置为水平居中;

⑶将表格除标题外的数据区域加上蓝色双线型外框线及蓝色虚线型内框线(左排第5种);

⑷在当前工作某中插入南京1月-12月降水量折线图,图表标题改成“南京全年降水量”,横坐标标题为“月份”,纵坐标标题为“降水量”

⑸保存文档并关闭WPS表格,

小清收集了2016~2020年我国电力、燃料及水消耗量的部分数据,并使用Excel软件对数据进行处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域E4:E8的数据是通过公式计算得到的,在E4单元格中输入公式,再使用自动填充功能完成区域E5:E8的计算。 
  2. (2) 利用“设置单元格格式”将E列数值设置保留1位小数后,以“住户用电量占年总耗电量比%”为主要关键字,以“住户”为次要关键字,将A4:J8单元格区域内数据进行降序排序,则2019年数据所在行标值为。 
  3. (3) 为了反映2016~2020年我国水消耗量变化情况,根据图a中的数据创作的图表如图b所示。综合图a和图b,下列说法正确的有(   )(多选,填字母)。

    图b

    A . 创建该图表的数据区域为A2:A8,J2:J8 B . 2016~2019年间水消耗量逐年递增,2020年出现下降情况 C . 要分别筛选出五年内“汽油”和“液化石油气”消耗量最高年份,可同时对H、I列设置筛选条件“最大的一项” D . 交换C列和D列的数据位置,会影响E列数据值的计算