数据分析 知识点题库

要统计全班同学的半期考成绩,用下列哪个软件比较快捷方便?(   )
A . 选用Microsoft Word设计表格统计成绩 B . 选用Microsoft Excel设计表格统计成绩 C . 选用Microsoft Powerpoint设计表格统计成绩 D . 选用WPS设计表格统计成绩
张老师请小红同学统计全班期末7门考试总分前10名的学生名单。小红做了以下工作,这些工作的正确顺序是(   )
  1)、按学号顺序建立了包含学号、姓名、各科成绩的Excel工作表。并输入了所有同学的各期末成绩
  2)、在工作表中用相关函救计算出每位同学的总分,并存放在工作表的相应位置
  3)、选前10条记录
  4)、按总分递减的顺序排序。
A .   1、2、3、4 B .   2、1、4、3 C .   1、2、4、3 D .   3、1、2、4
主要用于数据的统计与分析的软件是(   )
A . MicrosoftExecl B . MicrosoftPowerPoint C . 记事本 D . MicrosoftWord
小王收集了关于浙江省外商投资同期比较的数据,并用Excel软件进行数据处理,如图a所示。请回答下列问题:
  1. (1) 如图a所示工作表中,将D7单元格的公式复制并将粘贴到G5单元格,则G5单元格中的公式是

  2. (2) 为了更加直观地比较合同外资金额和实际利用外资情况,小王制作了如图b所示的图表,该图表的数据区域是

  3. (3) 图b中各市对应的柱形图上显示的数据标签是通过图表工具(如图c所示)中的(填:设计/布局/格式)实现的。

  4. (4) 现选择数据源A13:G15对台州、丽水、杭州三个市按“今年实投”进行降序排序,则要在图d所示对话框中设置主要关键字为“列E”,同时(填字母:A .选择/B .不选择)“数据包含标题”。

小张收集了15个省份2017,2018上半年GDP数据,并使用Excel软件进行数据处理,如图a所示。

请回答下列问题:

  1. (1) 要使表格第2行内容能完整显示,在不改变字号和列宽的前提下,下列操作可行的是(单选,填字母:A .选择B2:D2单元格,文本对齐格式设置为“垂直居中”/B .选择B2:D2单元格,文本对齐格式设置为“跨列居中”C .选择B2:D2单元格,文本对齐格式中的文本控制设置为“自动换行”)。
  2. (2) 若对图a中的“2018上半年GDP同比增速”和“2018上半年GDP总量(亿元)”两列进行筛选操作,筛选条件如图b所示,则按此设置筛选出的省份是

  3. (3) 根据图a中数据制作的图表如图c所示,创建该图表的数据区域是A2:B3,

  4. (4) 在E3单元格中使用RANK函数获得各省2018上半年GDP同比增速排名。再利用自动填充功能获得E4:E17单元格中的数据。则E17中的内容是。(提示:RANK函数用于返回某个数字在一系列数字中相对于其他数字的排名。例如:=RANK(E3,E3:E17)表示E3在数据区域E3:E17中的降序排名。)
请回答下列问题:

图a

  1. (1) 小王要通过自动填充功能将“报名号”列的值填充为如图a所示的序列“01,02,……,18”,则可先将该区域单元格格式设置为(单选,填字母:A .数值/B .货币/C .百分比/D .文本)。
  2. (2) 在L5单元格中使用SUMIF函数计算高三年级所有选手总分之和,则L5单元格中的公式是

    (提示:SUMIF函数用于对域中满足条件的单元格求和。例如:=SUMIF(B3:B2O,“高二”,I3:I20)表示高二年级所有选手总分之和)

  3. (3) 根据图a中数据制作的图表如图b所示,创建图表的数据区域是

    图b

  4. (4) 市教育工会将举行“巾帼杯”欢乐四项赛,比赛项目为上述四项,计分规则不变。比赛规则:每校由2名女教师参加;每项每校由1名教师参赛;每名教师参赛项目不限;比赛成绩为4项得分的总和。以本次教师欢乐四项赛的结果为依据,从林雅璇、郦佳玲和董雯静中选择2名选手代表学校参加比赛。为使学校取得最高总分,你的选择是(单选,填字母:A .林雅璇与郦佳玲/B .林雅璇与董雯静/C .郦佳玲与董雯静)。
想通过分析某同学语文历次考试成绩的分数情况,预测他的语文下一次考试成绩,其基本步骤是(   )。

①数据预处理    ②数据采集    ③分析报告   ④数据分析   ⑤可视化表达

A . ②④①⑤③ B . ②①⑤③④ C . ②①④⑤③ D . ②③①⑤④
结合现实生活中的体验,谈一下数据分析的意义。
22018年2~12月的移动应用程序(APP)数量分类占比情况如图所示,分析并描述图中数据的特征和规律(写出两条)。

 ② 

小王运用excel软件处理浙江省2018、2019年浙江城乡居民人均收支情况,如图a所示,请回答下列问题:

图 a

  1. (1) 要计算各类居民的“同比±%”,在D4 单元格中输入公式,并复制到D5:D17,G4:G17,J4:J17 区域,D4 单元格中的公式为。(提示:同比=(2019 年-2018 年)/2018 年*100)。
  2. (2) 经过题(1)的操作,不小心把F列删除,G4单元格会出现 (填字母:A .8.3; B .#DIV/0! ;C .#REF! ;D .###)
  3. (3) 选中数据表中的数据创建了如图b所示图表,则创建图表的数据区域为

    图 b

  4. (4) 从数据表中我们可以发现浙江省2018、2019这两年生活消费支出增长速度最快的项目是
大数据的分析理念在数据规模上强调相对数据而不是绝对数据。
词云可以使得难以实现结构化的数据文本挖掘成为轻而易举的事情。
为了响应全民健身计划,某高中对学生进行了体质健康测评,并用Excel软件进行数据处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域M2:P15 的数据是通过公式计算得到的,在M2单元格中输入公式后,再使用自动填充功能完成该区域的计算,则N3单元格中的公式是“=SUMPRODUCT(()*($I$3:$I$553=N$1))”。

    (提示:M2单元格输入公式=SUMPRODUCT((A1:A100=“2”)*(I1:I100=“优秀”)),表示同时满足A1:A100是2班和I1:I100是优秀这两个条件的情况有几个,也就是进行条件计数。)

  2. (2) 根据图a中的数据制作的图表如图b所示。创建该图表的数据区域是

    图b

  3. (3) 对图a工作表进行相关数据分析,下列说法正确的是                    (多选,填字母)。
    A . 以“总分等级”为依据进行升序排序,选择的区域是A3:I553 B . 选择“A3:I553”按照“总分等级”升序排序后,图b的图表不会发生改变 C . 现需要选出总分等级为“不及格”的学生,可选择区域A3:I553,以“总分等级”为“不及格”进行筛选并保留结果 D . 为了显示男生立定跳远得分最高的3位学生数据,可先对“性别”为“男”进行筛选,再对“立定跳远”进行筛选,选择最大的3项
在2021年7月23日到8月8日举行的“2020东京奥运会”上,共有206个国家、地区、独立代表团的11669名运动员参赛,争夺339枚金牌。奥运会闭幕后,小明从网上下载了金牌数前10名的国家,数据如图-1所示,然后根据各国金牌数绘制了柱形图,如图-2所示,请回答下面问题:

  1. (1) 在图-1中,表格标题“2020东京奥运会奖牌榜”所在的单元格是
  2. (2) 小明根据金牌数来计算各国名次,金牌数最多的为第1名,金牌数量相同名次也相同。小明采用“COUNTIF"函数在A3单元格计算美国队的名次,并自动填充到A4:A12单元格来计算其他国家的名次,则A3单元格应该输入(提示:“COUNTIF" 函数的功能是根据指定的条件来计数,例如=COUNTIF (F3:F12, ">"&F4)表示F3:F12范围内,统计比F4大的数的个数,结果是1。)
  3. (3) 根据图-1表格中的数据制作了图-2的图表,下列说法正确的是         (填字母)
    A . 绘制图-2图表时选择的数据区域是B3:C12 B . 将图-1表格中的数据以“奖牌总数”为关键字进行降序排列后,图-2的图表会发生变化 C . 若在图-1表格中“金牌”列前插入“参赛人数”列,图-2的图表会发生变化 D . 在图-2图表中的柱子上显示了金牌数据,这是通过“添加数据标签”实现的 E . 对图-1表格中。“国家/地区”列设置筛选条件为“包含国”,师选后,在图-2图表中看不到“日本”的情况(图表“隐藏和空单元格设置”默认
下列关于数据分析报告叙述错误是(     )
A . 数据分析报告是项目研究结果的展示 B . 数据分析报告是数据分析结论的有效承载形式 C . 通过报告不仅是把数据分析的起因、过程、结果及建议完整的展现出来 D . 数据分析报告不能为决策者提供科学、严谨的决策依据
小王收集了2019和2020年杭州市各区县(市)GDP数据,并使用Excel软件进行数据处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域D3:D17的数据是通过公式计算得到的,在D3单元格中输入公式后,使用自动填充功能完成区域D4:D17的计算,则D3单元格中的公式是。(提示:同比增幅% =(2020年(亿元)-2019年(亿元))/ 2019年(亿元)*100)
  2. (2) 若对“2020年(亿元)”列进行筛选,筛选设置都如图b所示,则筛选出的区县(市)有个(填数字)。

    图b

    图c

  3. (3) 根据图a中的数据制作图表如图c所示,下列说法正确的有                  (多选,填字母)。
    A . 由图c可知2020年杭州市各区县(市)GDP最高的是余杭区 B . 对数据区域C3:C17设置单元格格式“2位小数”,图c所示的图表会随之改变 C . 对数据区域A2:E17按“2020年(亿元)”降序排序后,公式仍旧可以正确计算2020年各区县(市)GDP名次 D . 在图a所示工作表的“2020年(亿元)”列前插入一列“2019年排名”,图c所示图表会随之改变
字节跳动公司的抖音APP利用强大的算法对用户观看内容的大数据进行分析,为用户提供适合用户要求的内容。其算法对数据处理的过程属于数据分类。
小王收集了2020年双十一部分商品销售情况,并使用Excel软件进行数据分析,如图a所示。请回答下列问题:

  1. (1) C4单元格统计的是“服饰"类商品销售总金额。小王在G4单元格中输入公式后,对区域H4:I4进行了自动填充,则H4单元格中显示的结果是。(单选,填字母:A . # VALUE !/B . 5793. 56. 84/C . #DIV/0! /D . 0. 00)。

    (提示: SUMIF 函数用于对满足条件的单元格求和。例如“=SUMIF (B4:B33, G3, E4:E33)”,用于统计2020年11月类别为“服饰”的金额总和。)

  2. (2) 若要正确计算H4和I4单元格中的数据,可对G4单元格中的公式进行修改,并对区域H4:14进行自动填充,则G4单元格中的公式应改为:
  3. (3) 下列对数据处理和分析正确的是              (多选,填字母)。
    A . 选中A3:E18区域,以“人数”为主要关键字进行升序排序,不会影响图表的呈现效果。 B . 若要查看“医疗器械”中销售额最大的商品,可以按“类别”为医疗器械,“金额(万元)”为最大1项进行筛选。 C . 假如G3单元格中“服饰”字样被误删,则G4单元格中的显示结果变为#REF!。 D . 先以“类别”为医疗器械进行筛选,再以“金额(万元)”为关键字降序排序,与先以“金额(万元)”为关键字降序排序,再以“类别”为医疗器械进行筛选,两种操作后排在最前面的商品相同。
小华收集了2011年~2020年全国废气主要污染物排放的部分数据,并使用Excel软件对数据进行处理,如图a所示。

请回答下列问题:

  1. (1) 在C4单元格中输入公式,再向下自动填充至单元格C12,并将区域C4:C12复制粘贴到区域E4:E12和G4:G12,则单元格E4中的公式为
  2. (2) 由于操作失误,不小心清除了单元格B12中的内容,则C12单元格中显示的结果是(单选,填字母A . #DIV/O! / B . #REF! / C . -100.00% / D . 100.00%)
  3. (3) 为了反映2011年~2020年全国废气主要污染物排放变化情况,根据图a中的数据制作的图表如图b所示。综合图a和图b,下列说法正确的有           (多选,填字母)。

    A . 创建该图表的数据区域为A1,A2:B12,D2:D12,F2:F12 B . 2011年~2020年间主要污染物排放量减少最快的是二氧化硫 C . 将图a中数据按年份进行降序排序,则图表不会发生变化 D . 将区域F3:F12中的数值格式设置为1位小数,则图表不会发生变化 E . 依次以“二氧化硫环比”、“氮氧化物环比”为筛选条件,都选择“最小3项”进行筛选后,筛选结果只显示2016年和2020年的数据
如下是2007-2017年某地区信息社会重要指数的发展情况,分析图表,选出下列说法错误的一项(       )

A . 信息社会的四个基本特征是指信息经济、网络社会、在线政府、数字生活 B . 与2016年相比,2017年四项指数中,信息经济涨幅最快 C . 2017年全国信息经济、网络社会、在线政府、数字生活指数分别为0.411、0.425、0.607、0.544 D . 2007-2017十一年间,“数字生活”涨幅最大,这也说明了信息技术越来越大众化