数据分析 知识点题库

在Excel的单元格中输入下列内容后,显示结果为3的是(   )   
A . 9-6 B . "9/3" C . =9/3 D . ="1+2"
钱会计要统计公司各部门的工资总额,做了以下工作:

  ①按员工姓名顺序,建立了包含工号、姓名、部门、工资等字段的Excel工作表,并输入了所有员工的相关信息

  ②选定相关的数据区域

  ③通过数据“分类汇总”出各部门的工资总额

  ④按部门递减的顺序排序

这些工作的正确顺序是(   )

A . ①、②、③、④ B . ②、①、④、③ C . ①、②、④、③ D . ③、①、②、④
小李对金融很感兴趣,他关注“中国石油”的股票并下载了近期的交易数据,如图-1所示。

  1. (1) “涨跌额”为本交易日的“收盘价”与前一交易日的“收盘价”之差,要计算各交易的“涨跌额”,可在F3单元格输入公式 后,利用自动填充功能完成其他交易日的“涨跌额”计算。
  2. (2) 以区域的数据制作2015年2月2日至2015年3月13日“中国石油”收盘价的行情图,如图-2所示,该图表的类型是

  3. (3) 分析图-2可知,下列4个时间段:“收盘价”涨幅最大的时间段是       (填序号)。
    A . 2015年2月2日至2015年2月3日 B . 2015年2月16日至2015年2月17日 C . 2015年2月25日至2015年2月26日 D . 2015年3月11日至2015年3月12日
小李收集了2010年到2014年中国亚洲个别国家入境游信息。并用Excel软件进行数据处理,如图1所示。请回答下列问题:

图1

  1. (1) 区域H4:H12中的数据时从H3单元格利用自动填充功能得到的。则H12单元格的公式是 。
  2. (2) 若要对表中数据以“2014年(万人次)”为关键字按降序进行排序,则排序时选择的数据区域是
  3. (3) 小李建立的图表如图2所示,其数据源是

    图2

  4. (4) 如果把表格中近5年入境总人数前三名的国家筛选出来 ,上一题的图表会不会发生变化?
小李收集了2018年1月部分地市网络零售统计数据,并使用Excel软件进行数据处理,如图a所示。

根据图a,请回答下列问题:

  1. (1) 当前状态下小李进行了如下操作:先按键Ctrl+C(复制),然后选择单元格E5,再按键Ctrl+V(粘贴),则单元格E5是(单选,填字母:A .数字36.59/B .公式=B5/$BS13 * 100/C .公式=D5/$B$13 * 100/D .公式=D5/D$13 * 100)。
  2. (2) 根据图a中数据,制作了一张反映所有地市居民网络消费额情况的图表。如图b所示,但该图表横轴中显示的是数字序号并不是预期的地市名称,改正的方法是

  3. (3) 将图a中区域A1: 12的数据值复制到新工作表后,为了筛选出顺差超过90的地市信息,小李进行了设置筛选标记的操作,得到图c。

    则小李的操作可能是________(多选,填字母)。

    A . 选中单元格F3,单击 B . 选中单元格F3:F12,单击 C . 选中单元格F3:F5,单击 D . 选中单元格F5:F12,单击
小张同学收集了某地区近五年(2015-2019)供水用水情况数据,用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 小张在C10单元格输入公式后,又将C10单元格复制到C12,并用自动填充功能完成C10:G10,D12:G12单元格的数据计算,则C12单元格中显示的结果是(单选,填字母:A .#VALUE!/B .1266.27/C .#DIV/O!/D .14.32)
  2. (2) 若要按照上述方法正确计算所有“占总用水量百分比(%)”,小张应修改C10单元格的公式为
  3. (3) 根据图a数据,小张制作了一张反映近五年用水总量对比图,如图b所示,则该图表的数据区域为B3:G3,B9:G9,B11:G11,

  4. (4) 分析图表,近5年用水量变化波动最大的是(选填:农业用水/工业用水/生活用水/生态用水)
图1是时代电器广场用Excel制作的9月份主要商品销售统计表。

图1

请根据表中数据回答下列问题:

  1. (1) 李明在单元格G3使用公式“=F3/$F$10”计算手机占总利润百分比,并对区域G4:G9进行了自动填充,则G9单元格的公式是
  2. (2) 李明想将编号这一列数据设计成“001,002,……,007”样式,可每次输入“001,002,……,007”样式后都自动变成了“1,2,……,7”,请给出一种解决方法
  3. (3) 根据图2所示,9月份占总利润百分比最大的商品名称是

    图2

  4. (4) 将图2所示的图表以图片形式复制到Word文档中并设置了文字环绕方式,部分界面如图3所示,该图表环绕方式是(单选,填字母:A .嵌入型/B .四周型/C .浮于文字上方/D .紧密型)。

    图3

小明收集了2020年6月3日的全球新冠肺炎疫情最新动态的数据,并将其中累计确诊人数超过5万的国家汇总成了一张表格,用Excel软件进行数据处理,如图a所示。

图 a

请回答下列问题:

  1. (1) 如图a所示,“排名”列的数据有Rank函数对“死亡率”列数据进行降序排名。小明通过H3单元格的公式对区域H4:H23进行自动填充,则H23单元格中显示结果是 (单选,填字母: A . # VALUE! / B . 17/ C . #DIV/0! / D . 1)。
  2. (2) 若要正确计算“排名”列的数据,可对H3单元格中的公式进行修改,对H4:H23进行自动填充,则H3单元格中的是
  3. (3) 小明在完成计算后,若要对欧洲地区的国家以“累计确诊人数”为关键字进行降序排序,则排序时选择的数据区域是
  4. (4) 根据图a中的数据制作的图表如图b所示,创建该图表的数据区域是

    图 b

数据分析可以分为(    )
A . 验证性分析 B . 深度分析 C . 描述性分析 D . 探索性分析
数据分析不但可以对数值型数据进行统计和描述,还可对文本、图像等数据进行分析。
按照涉及自变量的多少,下列(    )属于回归分析。
A . 线性回归分析 B . 非线性回归分析  C . 一元回归分析 D . 综合回归分析
下列不是有关趋势的分析的是(     )
A . 折线图 B . 柱形图 C . 堆叠柱形图 D . 圈图
网上下载了第六次人口普查的相关数据,并用 Excel软件进行数据处理,如图a所示。

图a

 请回答下列问题:

  1. (1) 区域 E4:G14的数据是通过公式计算得到的,在E4单元格中输入公式,再使用自动填充功能完成区域E5:E14和F4:G14的计算。

    (提示:占总人口比重=年龄段人口数÷总计人口数×100)

  2. (2) 对图a所示表格中数据按“性别比”降序排列,则应选择的数据区域为
  3. (3) 利用图a数据建立了“各年龄段人口比重”饼图,如图b所示。下列说法正确的是       (多选,填字母)。

    图b

    A . 可以通过数据区“A4:B14”创建该图表 B . 可以通过数据区“A4:A14,E4:E14”创建该图表 C . 隐藏“0-9岁”所在行数据,图表不会发生变化 D . 调整数据表中小数点位数,图表不会发生变化
关于新冠肺炎疫情的信息,由疫情实时大数据报告(如图为部分数据截图)获知,其中用汉字、数值、加减符号描述疫情确诊、治愈、死亡等情况;还可以用颜色、数据表、图描述疫情地区分布、境外输入确诊趋势等情况。请运用数据信息、知识与智慧之间的相互关系完成下列判断。

  1. (1) 疫情实时数据记录的形式有汉字、颜色、图等,因此数据具有二进制性特征。
  2. (2) 图1中用深红色突出显示确诊人数在10000以上的地区,深红色是数据,也是载体,它所承载的信息是“新冠肺炎确诊人数≥10000”。
  3. (3) 由图2可获知“新型冠状病毒肺炎国外新增确诊人数呈上升趋势”。
  4. (4) 由图1中“数据更新至2020.10.21 15:26”表明信息具有时效性,一旦超过其“生命周期”就失去原有的效用,成为历史记录。
  5. (5) 从图中获取新冠疫情数据和信息,不仅能帮助我们了解疫情情况,还能帮助我们解决个人防护问题。
  6. (6) 知悉新冠肺炎具有传染性后,我们需要学习新冠肺炎预防知识进行个人防护。
贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类算法,利用朴素贝叶斯算法可以实现新闻敏感词的屏蔽功能。贝叶斯分类属于大数据分析技术中的数据分类技术。
下列选择中,不是用于数据分析的是(      )
A . 现状分析 B . 原因分析 C . 预测分析 D . 可行性分析
想通过分析某同学各学科历次考试成绩的分数情况,预测他的下一次考试成绩,其基本步骤是

①数据整理 ②数据采集  ③ 撰写分析报告  ④ 数据分析与可视化

符合大数据概念的数据一般具有四个特征。大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行,从中发现新知识,创造新价值、提升新能力的新一代信息技术和服务业态。
(      )是项目研究结果的展示,也是数据分析结论的有效承载形式。
A . 数据分析 B . 数据可视化表达 C . 数据分析报告 D . 数据运算
下列关于中文分词方法的描述中,属于基于统计的分词方法的是(     )
A . 在分析句子时与词典中的词语进行对比,词典中出现的就划分为词 B . 依据上下文中相邻字出现的频率统计,同时出现的次数越高就越可能组成一个词 C . 让计算机模拟人的理解方式,根据大量的现有资料和规则进行学习,然后分词 D . 依据词语与词语之间的空格进行分词