5.1 走近数据分析 知识点题库

小王收集了2016年第四季度部分移动应用APP的相关数据,并使用Excel软件进行数据处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域G3:G18的数据是通过公式计算得到的:在G3单元格输入公式后,用自动填充功能完成G4:G18的计算,则G3单元格中的公式是
  2. (2) 通过排序使得相同应用领域的12月环比增幅有序,则排序的主次关键字依次为
  3. (3) 对图a中的数据进行筛选操作,筛选设置界面如图b所示,在下拉列表框中选择选项后,单击“确定”按钮,筛选结果只显示“酷狗音乐”、“酷我音乐”和“优酷视频”3行数据。

    图b

  4. (4) 根据图中数据,制作了一张反映所有APP的10月份活跃人数的图表。如图c所示,但该图表中显示的并不是APP名称,改正的方法是

    图c

为了直观地关注全国范围内新型冠状肺炎病毒感染的情况, 某同学使用Excel软件记录了2月4日至2月10日全国各省每天的累计确诊人数和治愈人数。部分界面如图1所示:

请回答下列问题:

  1. (1) 为了统计当天增加的确诊人数和治愈人数,该同学在039单元格使用公式已计算出2月10日的治愈增长人数,若在当前状态下使用自动填充的方式获得B39:N39单元格内的数据,C39单元格中的内容将为(单选,填选项:A .885/B .#REF!/C .#VALUE!/D .0)
  2. (2) 治愈率即当天的累计治愈人数占累计确诊人数的比重(治愈率=治愈/确诊*100%),为了计算截至2月10日的治愈率,应在N40单元格填写公式
  3. (3) 图2为部分省份某日疫情柱状图,绘制该图表的数据区域为:
  4. (4) 累计确诊人数超过1000人的地区为重点关注地区,为了了解国内有多少省份需要重点关注,可以使用“筛选”中的 (单选,填选项:A .最大10项/B .自定义筛选)获得。
以下属于大数据应用实例的是(     )。

①某系统通过用户视频点播的基础数据如评分、播放、快进等,分析计算出用户可能喜爱的影片,并为他提供定制化的推荐

②某网站通过追踪用户在其网络的行为,识别用户在它的网络中的好友,从而给出新的好友推荐建议

③某交通流量数据公司依靠分析历史和实时路况数据,能给出及时的路况报告,以帮助司机避开正在堵车的路段,并且帮他们提前规划好行程

④某保险公司天都会对美国境内超过100万个地点、未来两年的天气情况进行超过1万次模拟,而后将根系结构和土壤孔隙度的相关数据,与模拟结果相结合,为成千上万的农民提供农作物保险

A . ①②④ B . ①②③ C . ②③④ D . ①②③④
大数据最显著的特征是(   )
A . 数据规模大 B . 数据处理速度快                            C . 数据类型多 D . 数据价值密度高
大数据是以大、多、快、高为主要特征的数据集合,它正快速发展为对数量巨大、来源分散、格式多样的数据进,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
小华收集了2012-2018年浙江省各市水资源总量的相关数据,并使用Excel软件进行了数据处理,界面如图a所示,请回答下列问题:

图a

  1. (1) 区域B14:H14的数据是通过公式计算得到的,在B14单元格输入公式时应用了AVERAGE函数,并用自动填充功能完成区域C14:H14的计算,则B14单元格中的公式是
  2. (2) 若要对各个城市的数据以“2018年”为关键字按降序进行排序,则排序时选择的数据区域是(单选,填字母:A .H2:H13 / B .A1:H14 / C .A2:H14 / D .A2:H13)。
  3. (3) 根据图a中数据制作的图表如图b所示,创建该图表的数据区域是

    图b

  4. (4) 将区域A2:H13的数据复制到新工作表并进行筛选,设置“城市”和“2018年”的筛选方式如图c所示,则筛选出的城市数有个(填数字)。

大数据的产生是与人类日益普及的网络行为所伴生,故大数据起源于(   )
A . 金融 B . 传感器 C . 管理 D . 互联网
小明收集了一些招聘信息数据,并用Excel软件进行处理,如图a所示。请回答下列问题:

图 a

  1. (1) 如图a小明使用公式计算各专业的收入排名顺序,F4:F19 单元格内容通过对F3单元格公式自动填充获得,但排名产生了错误,要获得正确的收入排名号,F3单元格公式需修改为 。(排名可使用rank 函数,如“=rank(D3,D3:D19)”,功能是计算D3单元格的值在 D3:D19区域中的名次)
  2. (2) 利用图a中数据制作了如图b所示的图表,则该图表的数据区域是

    图 b

  3. (3) 将图a中A2:D19区域的数据复制到新工作表A1:D18区域进行排序,使得类型相同的专业按“薪酬(元)”降序排序,则下列操作正确的是                      (单选:填字母)
    A . 选择数据区域A1:D18,以“薪酬(元)”为主要关键字,按“降序”进行排序 B . 选择数据区域 A1:D18,以“薪酬(元)”为主要关键字,“类型”为次要关键字均按“降序”进行排序 C . 选择数据区域A1:D18,以“类型”为主要关键字进行“降序”排序,再以“薪酬(元)”  为主要关键字进行“降序”排序。 D . 选择数据区域A1:D18,以“薪酬(元)”为主要关键字进行“降序”排序,再以“类型”  为主要关键字进行“降序”排序
  4. (4) 将图a中B2:D19区域的数据复制到新工作表,对“人数”和“薪酬(元)”进行筛选,条件如图c所示,则按此条件筛选出的专业数有个。

    图 c

使用Excel软件处理2020年12月国内各省市油品的价格数据,如图 a所示。

图a

请回答下列问题:

  1. (1) 单元格J4中的结果可以通过复制D4单元格中的公式得到,则J4单元格的公式为:
  2. (2) 区域M4:M8的结果是使用AVERAGEIF函数计算得到的,在M4单元格中输入公式:,再利用自动填充功能完成区域M5:M8的计算。(提示: AVERAGEIF函数用于统计某个区域中满足条件的单元格区域平均值,如“=AVERAGEIF(A4:A10, L4, E4:E10)”可以求得E4:E10区域中,所属地区是华北地区的93号汽油的平均价格)
  3. (3) 若要将C列数值小数位数设置为0,可以通过点击工具栏中的按钮(填字母:A . /B . )实现,该操作会使M4单元格中显示的值(填字母:A .变大/B .不变/C .变小)。
  4. (4) 根据图a相关数据制作的图表如图b所示,创建该图表的数据区域是

    图b

  5. (5) 通过排序功能对图a中的数据按“0号柴油”价格从低到高排序,则排序时应选择的数据区域是
  6. (6) 若要找出“华北”地区97号汽油价格最高的省市(若存在符合条件的多个省市,则全部选取),下列方法可行的是______________ (多选,填字母)。
    A . 设置“地区”的筛选条件为“等于”“华北”进行筛选,再设置97号汽油“价格”的筛选条件为“最大1项”进行筛选 B . 设置“地区”的筛选条件为“等于”“华北”进行筛选,再以97号汽油“价格”为关键字降序排序,选取排在最前面的省市 C . 以97号汽油“价格”为关键字降序排序,再设置“地区”的筛选条件为“等于”“华北”进行筛选,选取排在最前面的商品 D . 以“地区”为主要关键字升序排序、97号汽油“价格”为次要关键字降序排序,选取排在最前面的商品
小吴收集了近三年全国工业产能利用率的数据,并用Excel软件进行数据处理,如图a所示。

 

图a

  1. (1) 如图a所示,区域C5:C18的数据由C4单元格公式自动填充得到,且结果正确。为了计算2019和2020年主要行业的产能利用率排名,小吴将C4:C18区域复制到E4:E18和G4:G18区域,但发现计算结果有误,则C4单元格的公式应修改为,并重新进行自动填充和复制操作。
  2. (2) 根据图a中数据制作的图表如图b所示,则创建该图表的数据区域为A3:B5,

    图b

  3. (3) 为了获得名称包含“制造”的主要行业中,2018年“产能利用率(%)”最大的5项数据,并显示在操作结果的最前面(紧邻第3行),一种可行的操作是:选择数据区域A3:G18后,对该区域(选填2个序号,按操作顺序)。

    ①按“主要行业”进行文本筛选,条件为:包含“制造”

    ②按“主要行业”进行文本筛选,条件为:等于“*制造”

    ③按2018年的“产能利用率(%)” 进行筛选,选择“10个最大的值”并显示最

    大的5项

    ④以2018年的“排名”为关键字进行降序排序

    ⑤以2018年的“产能利用率(%)”为关键字进行降序排序

2020年我国的国内生产总值突破了100万亿大关。分季度看国内生产总值,一季度下降6.8%,二季度增长3.2%,三季度增长4.9%,四季度增长6.5%。为了更形象的表示出我国2020年各季度经济增长状况,最合适的图形表示方式为(   )
A . 饼图 B . 柱形图 C . 扇形图 D . 折线图
下列有关大数据的说法正确的是(     )
A . 大数据是对抽样数据进行分析 B . 大数据采集的数据是结构化数据 C . 大数据采集必须保证每个数据都准确无误 D . 大数据蕴含有很高的价值,但价值密度相对较低
以下不属于创建数据透视表的条件的是(    )。
A . 数据源是规则数据 B . 每个字段的数据类型一致    C . 数据记录一定有合并单元格 D . 数据记录不能有空白单元格
小李收集了某书店主要畅销书销售情况的数据,并使用Excel软件对数据进行处理,如图所示。

  1. (1) 区域G3:G100的数据是通过公式计算得到的,在G3单元格中输入公式,再利用自动填充功能完成区域G4:G100的计算。
  2. (2) 对销售情况的数据以“定价(元)”为主要关键字按降序进行排序,则排序的数据区域是
  3. (3) 若在上图所示工作表中对数据进行进一步的操作,下列说法正确的是             (多选,填字母)。
    A . 若要制作一张关于《西游记》四个季度销量情况折线图,则图表的数据区域是A2:A3,C2:F3 B . 在“书籍名称”列前插入一列,“年销售金额”列的数值不会发生变化 C . 将对B3单元格的数值小数位数设置为0,则G3单元格的数值将变小 D . 分别筛选出第一季度销量和第二季度销量最大的3项,即可获得上半年销量排在前三的书籍
下列关于在Excel中创建图表的叙述,正确的是(    )
A . 图表既可以插入在当前工作表中,也可以作为新工作表插入 B . 图表不能插入在当前工作表中,只能作为新工作表插入 C . 图表只能插入在当前工作表中,不能作为新工作表插入 D . 无法从工作表中产生图表
下列图表中,最适合说明各种蔬菜销售量的图表是(    )
A . B . C . D .
互联网、移动网络、物联网等每天都产生大量数据,大数据技术应运而生。以当前广泛应用的监控视频为例,某次交通事故视频画面,有效的部分可能仅仅只需要几秒,“提纯”大数据,是人们一直努力的目标。这体现了大数据以下哪个特征?(     )
A . 数据规模大 B . 处理速度快 C . 数据类型多 D . 价值密度低
下列选择中,不是用于数据分析的是(      )
A . 现状分析 B . 原因分析 C . 预测分析 D . 可行性分析
有关某“无人超市”的信息系统结构图如第1题图所示,请回答下面小题。

  1. (1) 下列有关“无人超市”的说法,正确的是(     )
    A . 系统通过入口处刷脸获得的特征值属于个人一般信息 B . 零购物码和出门二维码使用后失效,体现了信息的时效性 C . 系统自动对用户数据进行加密是为了提高数据的完整性 D . 存储在系统数据库中的海量用户信息属于大数据
  2. (2) 下列对“无人超市”信息系统的功能描述,不正确的是(     )
    A . 录制用户付款视频和离开时的影像属于信息系统的收集功能 B . 识别到注册用户立刻开门属于信息系统的传输功能 C . 使用POS机自助付款属于信息系统的存储功能 D . 打印小票、出门二维码属于信息系统的输出功能
图表是常用的数据可视化表达方式,基本类型有柱状图、饼图和折线图等。要直观地呈现全国各年龄段人口所占比例,最适合的图表类型是