数据整理及其目的 知识点题库

下列关于数据整理目的的描述,错误的是(    )
A . 减少数据量 B . 检测和修正错漏的数据 C . 整合数据资源 D . 提高数据质量
下列关于数据整理的说法,正确的是(    )
A . 数据集中的缺失值一般用任意值填充 B . 数据集中的异常数据须直接删除或忽略 C . 数据集中的重复数据可进行合并或删除 D . 数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
数据在采集、存储、管理与使用的过程中面临诸多安全风险,为避免风险,通常需要进行数据备份。
下列关于数据整理的说法错误的是(    )
A . 数据整理的目的是对数据进行校验和标准化 B . CSV文件将数据表格存储为纯文本 C . 采集的数据只能保存为CSV文件 D . 整理数据可以通过编写程序实现
以下关于数据的说法,正确的是(    )
A . 数据处理的速度主要取决于计算机硬件设备,软件影响不大 B . 大数据中,每个数据的价值都非常大,不能随意处理 C . 在计算机中,所有的数据都是结构化的 D . 数据安全不仅是保障数据不损坏,也要考虑数据被入侵偷窃的情况
综合题
  1. (1) 关于数据整理的说法,正确的是                 (单选)
    A . 格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据 B . 某人的出生日期数据为“2000/11/32”,是一种逻辑错误 C . 数据整理的目的包括,减少数据量,检测和修正错漏的数据,整合数据资源和提高数据质量 D . 要探究若干数据系列中各数值之间的关系,可采用散点图、柱形图
  2. (2) 小张从网上下载了第六次人口普查的相关数据,并用Excel软件进行数据处理,如图所示,区域E4:G14的数据是通过公式计算得到的,在E4单元格中输入公式,再使用自动填充功能完成区域E5:E14和F4:G14的计算。

    (提示:占总人口比重=年龄段人口数/总计人口数×100) )

  3. (3) 若要建立一张各年龄段人口比重图,合理的图表类型为(选填:柱形图/条形图/饼图)
下列关于数据整理的说法,错误的是(     )
A . 数据集中缺失的数据可以采用中间值来填充 B . 数据集中异常数据可能包含重要信息 C . 数据集中的重复数据可进行合并删除处理 D . 数据集中格式不一致的数据,一般保留一种格式的数据,删除其他格式的数据
小明收集了本周信息技术学科学习评价的数据,如图所示。

  1. (1) 观察上表小明做了如下操作,其中属于数据整理的是             (多选,填字母)
    A . 删除重复行第五行 B . 验证并修改D2单元格数据  C . 通过公式计算全班平均分 D . 重新设置C3单元格格式
  2. (2) 为了分析每个组的平均分,设计了如下Python程序。                    

    import pandas as pd

    import matplotlib.pyplot as plt

    df=pd.read_excel("成绩表.xlsx")

                

    print(df1)

    划线处的代码应为           (单选,填字母)

    A . df1=df.groupby("平均分").mean() B . df1=df.mean() C . df1=df.groupby("小组").mean() D . df1=df["小组"].mean()
  3. (3) 利用Python程序绘制各小题得分率图表,如图所示:

    请在划线处填写合适的代码。

    num=int(input("请输入小组:"))

    plt.figure(figsize=(10,5))

    list=[]

    for i in range(12):

        s="题"+str(i+1)

        list.append(df1.at[num,s]*50)

    plt.bar(range(1,13),list)

    plt.title(str(num)+" ")

    plt.xlabel("question number")

    plt.ylabel("correct rate")

    plt.show()