5.1 走近数据分析 知识点题库

钱会计要统计公司各部门的工资总额,做了以下工作:

  ①按员工姓名顺序,建立了包含工号、姓名、部门、工资等字段的Excel工作表,并输入了所有员工的相关信息

  ②选定相关的数据区域

  ③通过数据“分类汇总”出各部门的工资总额

  ④按部门递减的顺序排序

这些工作的正确顺序是(   )

A . ①、②、③、④ B . ②、①、④、③ C . ①、②、④、③ D . ③、①、②、④
瑞中2015级主持人大赛决赛成绩如下,请根据各小题要求填空。

图一

  1. (1) “评委五”一列出现“#”提示符的原因:
  2. (2) 请使用min()函数完成“最低分”的统计,H3公式是:
  3. (3) 请完成五个评委的“原始总分”统计,I3公式是:
  4. (4) 请完成“最后总分”统计,J3公式是:

    ( 最后总分 = 原始总分 - 最高分 - 最低分)

  5. (5) 请完成“最后总分”的“总平均分”的统计,J17公式是:
  6. (6) 完成“最后总分”与“总平均分”差距(相减)的统计,K3公式是:
  7. (7) 如果以“最后总分”为关键字进行排序,应选择的区域为:
阅读试题,请在相应位置写出问题的答案。

某银行国际业务部通过折线图比较业务处理效率情况,可掌握业务效率变化,及时发现业务延迟和低效率,提高服务水平。下面是汇入汇款,汇出汇款,电子转发,分报四种业务的折线图,请根据该折线图分析并回答以下问题。

  1. (1) 从折线图可以看出,汇入汇款,汇出汇款,电子转发,分报四种业务所耗时间变化波动最小的是
  2. (2) 02年第三季度,服务时间最短的业务是
  3. (3) 四种业务中,哪种业务所耗时间容易反弹,需要加强控制?
大数据(     )能从规模巨大的数据中,分析并提取出有潜在价值的信息。
A . 采集技术 B . 分析与挖掘技术 C . 预处理技术 D . 可视化与应用技术
下列关于舍恩伯格对大数据特点的说法中,错误的是(   )。
A . 数据规模大 B . 数据类型多样 C . 数据处理速度快 D . 数据价值密度高
当前,大数据产业发展的特点是规模较小并且增速缓慢。
K-平均算法属于(   )分析方法。
A . 聚类 B . 关联 C . 分类 D . 回归
聚类分析不需要预先设定数据归类的类目,完全根据数据本身性质将数据聚合成不同类别。
聚类分析的基本算法从数据点集合中固定选择K个点作为初始的聚集中心,每个中心点代表着每个聚集中心的平均值。
数据异常值处理中,我们可以利用画饼图发现异常值部分。
大数据的最显著特征是(       )
A . 数据处理速度快 B . 数据类型多样 C . 数据规模大 D . 数据价值密度高
小河收集了“2019年中国一线城市与部分新一线城市指数”数据,并使用Excel软件进行数据处理,如图a所示。

  1. (1) 将单元格H9中的公式向上自动填充至H3,依次出现#VALUE!和#REF!的错误提示,其中,显示为#REF!的错误原因是(单选,填字母:A .除数为0/B .引用地址出错/C .引用单元格内容出错)。
  2. (2) 为了避免出现以上错误,应将单元格H9中的公式修改为
  3. (3) 根据图a中的数据制作的图表如图b所示,下列描述正确的是          (多选,填字母)。

    A . 建立图b所示的图表数据区域为A2:G2,A7:G9 B . 图b所示的图表系列产生在列 C . 对新一线城市以“城市人活跃度”为关键字从大到小进行排序,则排序的数据区域是B7:H9,排序后图表发生相应改变 D . 筛选“未来可塑性”最高的20%后,显示的城市为北京,图表不会发生变化 E . 将C3:C9区域单元格格式设置为保留1位小数后,图表不会发生改变
学习了Python绘制图形操作后,信息小组接到了编程演示的任务。为此,小组同学编写了一段代码,绘制出多个不同颜色的圆形。

代码如下:

import turtle

turtle. bgcolor("black")

colors=["red", "green", "blue", "yellow"]

for x              range(100):

turtle. pencolor(colors[x%4])

turtle. circle(x)

turtle. left(90)

请分析任务,完成下列题目。

  1. (1) 程序中横线处应填写            
    A . Print B . Input C . In D . Colors
  2. (2) 程序中x%4的作用是            
    A . 计算x乘以4的结果 B . 计算x除以4的整数部分 C . 计算x除以4的小数部分 D . 计算x除以4的余数
  3. (3) 执行此程序,绘制出圆形的总颜色数是(________)。
    A . 1 B . 4 C . 5 D . 100
  4. (4) 执行此程序,绘制出圆形的总个数是            
    A . 1 B . 4 C . 99 D . 100
  5. (5) 此程序属于程序设计结构中的            
    A . 顺序结构 B . 分支结构 C . 循环结构 D . 跳转结构
为了响应全民健身计划,某高中对学生进行了体质健康测评,并用Excel软件进行数据处理,如图a所示。

图a

请回答下列问题:

  1. (1) 区域M2:P15 的数据是通过公式计算得到的,在M2单元格中输入公式后,再使用自动填充功能完成该区域的计算,则N3单元格中的公式是“=SUMPRODUCT(()*($I$3:$I$553=N$1))”。

    (提示:M2单元格输入公式=SUMPRODUCT((A1:A100=“2”)*(I1:I100=“优秀”)),表示同时满足A1:A100是2班和I1:I100是优秀这两个条件的情况有几个,也就是进行条件计数。)

  2. (2) 根据图a中的数据制作的图表如图b所示。创建该图表的数据区域是

    图b

  3. (3) 对图a工作表进行相关数据分析,下列说法正确的是                    (多选,填字母)。
    A . 以“总分等级”为依据进行升序排序,选择的区域是A3:I553 B . 选择“A3:I553”按照“总分等级”升序排序后,图b的图表不会发生改变 C . 现需要选出总分等级为“不及格”的学生,可选择区域A3:I553,以“总分等级”为“不及格”进行筛选并保留结果 D . 为了显示男生立定跳远得分最高的3位学生数据,可先对“性别”为“男”进行筛选,再对“立定跳远”进行筛选,选择最大的3项
如图所示的图表是(    )

A . 柱形图 B . 面积图 C . 折线图 D . 饼图
某汽车研发团队在对社交媒体(论坛、微信等)的关注和分析中,发现很多人都在谈论自动开启方式影响到后备箱开启的问题,但在此前定期的网上问卷调查中却没有发现。围绕上述事例,下列描述不正确的是(   )
A . 相对于网上问卷数据,分析社交媒体数据的复杂度更高 B . 社交媒体数据体量大、类型多、价值密度低,符合大数据特征 C . 问卷调查数据库中的数据可共享,数据缺乏独立性 D . 定期调查问卷数据,采用数据库技术进行管理,属于结构化数据
下列对大数据特点的说法中,错误的是(    )
A . 数据规模大 B . 数据类型多样 C . 数据处理速度快 D . 数据价值密度高
图为2020年2月3日-4月15日我国工程建设领域复工率(含新建项目)、复工强度变化的图标表达,下面说法正确的是(        )

A . ①②④⑤ B . ①②③ C . ③④⑤ D . ①④⑤
2020年年初一场突如其来的新冠疫情袭击全球。在我国,为了更加快速、精准、高效地遏制疫情的扩散,各种高科技纷纷登场,疫情实时报告新冠肺炎,确诊患者同行查询、健康码为疫情的联防联控、疫情形势判断提供了重要保障。智能机器人多种应用、核酸检测试剂盒的研发,无接触电梯按钮的使用,红外电子测温门的使用,降低了交叉感染的风险。下图是在商场和学校等非常集中的场所安装的红外电子测温门。

  1. (1) 阅读以上资料,你认为疫情防控中采用的主要技术手段包括(   )。(多选)
    A . 人工智能技术 B . 大数据技术 C . 3D技术 D . 多媒体技术 E . 物联网技术
  2. (2) 从疫情防控中的疫情实时报告,新冠肺炎确诊患者同行查询、健康药等信息技术的新应用可以看出,信息技术的发展进入了以(   )为核心的发展阶段。
    A . 计算机 B . 互联网 C . 数据 D . 人工智能
  3. (3) 红外测温门作为一个小型的物联网信息系统是通过传感器来获取体温信息,通过传感器来识别二维码的颜色。
  4. (4) 请你为小区设计一款智能检测门,能够实现自动测温和验证苏康码,如果体温异常或非绿码的人员,采用人工查看核酸检测结果的处理方式,若核酸检测结果为阴性,方可进入小区,否则进行隔离治疗。流程图如下图所示。

    根据以上要求,请你从下列选项中选择相应的选项来完善“智能检测门”的流程图。

    A.  是

    B.   否

    C.  体温正常并且绿码

    D.  体温正常或者绿码

    E.   留观区

    F.进入小区

    你的选择是

以下哪一个选项不是数据分析主要用于的场景(       )
A . 现状分析 B . 数据运算 C . 原因分析 D . 预测分析