第四章 数据处理与应用 知识点题库

图表能非常直观、生动、形象的表示数据,下图为:(   )

A . 柱形图 B . 折线图 C . 条形图 D . 饼图
下面"学生健康情况调查表"中的数据是按什么规则排序的?(   )

健康情况调查表

A . 身高升序   B . 体重  C . 身高降序  D . 视力
小王收集了2017年1月农产品市场价格变动的一些数据,并用Excel软件对数据进行了分析。界面如图1所示,请回答有关问题:

  1. (1) H3单元格的计算公式是通过G3单元格的自动填充功能得到的,则H3单元格的计算公式为

  2. (2) 为了更直观地查看三大主粮的市场价格涨跌幅,制作了如图2所示的图表,该图表的类型是,生成该图表的数据区域是

  3. (3) 对所有的农产品进行如图3所示的两次筛选操作后,筛选出的数据共有行。

在WPS表格的B1、B2、B3单元格中都偶数值,下列与公式“=(B1+B2+B3)/3”等价的选项是(     )
A . = SUM(B1:B3) B . = SUM(B1:B3) /B3  C . = AVERAGE(B1:B3) D . = AVERAGE(B1:B3)/3
在Excel 中,分类汇总时默认的汇总方式是(    )。
A . 求和 B . 计数 C . 平均值 D . 最大值
使用百度搜索关键词“春节”,将采集到的结果数据存储为chj.txt文件,如图1所示。处理chj.txt文件中的数据后生成chjfc.txt文件,如图2所示。

请回答下列问题:

  1. (1) 文件chj.txt中的数据为(选填:“结构化数据”或“非结构化数据”)。
  2. (2) 处理文件chj.txt中的数据生成chjfc.txt文件的过程,一般称为 。
  3. (3) 编写如下Python程序,读取chjf.txt文件中的数据,并统计其中各词语(2个及以上文字构成)出现的次数。在划线处填写合适代码,完善程序。

    txt = open('chjfc. txt', 'r', encoding='utf-8'). read( )

    words-txt. split( )

    word_ counts={ }

    for word in words:

        if len(word)==1:

        continue

    else:

              ①            #可以为1行或多行代码

        #使用word_counts计算词语word在words中出现的次数

    word_ list=list(word_counts. items( ))      #返回所有键值对信息,生成列表

    word_ list. sort(key-lambda x:x[1], reverse=True)     #按词语出现次数降序排序

    for i in range(20):

        word, times=      ②       

        print(word, times)

    程序中划线①处应填写的代码是

    程序中划线②处应填写的代码是

  4. (4) 去除步骤(3)程序的统计结果中的非特征词(如代词介词连词等)后,制作的标签云如图所示,标签云中最能表现文件chj.txt中文本特征的词有(写出3~5个)。

函数 pyplot.figure的功能是(     )
A . 显示图片 B . 读入文件 C . 设置字体 D . 创建绘图区
在Excel中,关于自动填充下列正确的有(      )
A . 初值为纯数字的数值型数据时,向下直接拖动填充柄则自动加1 B . 初值为纯数字的数值型数据时,右击拖动填充柄可实现等比填充 C . 初值为日期型数据时,向下拖动填充柄,则复制日期 D . 初值为Excel预设序列中的数据,则按预设序列填充
在Excel中,更改图表位置在“图表工具→”功能区中进行。
在Excel 工作表中,A5的内容是A5,拖动填充柄至C5,则B5,C5单元格的内容分别为(    )。
A . B5,C5 B . B6,C7 C . A6,A7 D . A5,A5
在Excel中,不可以对数据进行的操作是(    )。
A . 索引 B . 排序 C . 筛选 D . 分类汇总
在Excel“排序”对话框中,如果取消勾选“数据包含标题”复选框,则表示表格中的标题行 排序。(请填写参加/不参加)
Excel中,规定公式必须以开头。
学校计划根据学生的兴趣设立并开展学生社团活动,其中“后期处理技巧提升”方向的呼声很高,为了更具体的了解学生的喜好,学校按照“图片后期处理”、“视频后期处理”和“音频后期处理”三个方面进行了分类统计。如图所示为高一年级的调查情况统计。

后期处理技巧提升

班级

人数

图片后期处理(人)

视频后期处理(人)

音频后期处理(人)

参与度

热度

高一一班

35

7

10

5

高一二班

40

12

10

11

高一三班

33

8

9

10

高一四班

38

10

12

0.8

高一五班

40

9

8

12

请分析任务,完成下列题目。

  1. (1) 要计算高一班学生“后期处理技巧提升”调查的参与度,应该在F3单元格中输入的计算公式是               
    A . =C3+D3+E3/B3 B . (C3+D3+E3)/B3 C . =(C3+D3+E3)/B3 D . SUM(C3+D3+E3)/B3
  2. (2) 想要快速计算其他班级的“参与度”,按住F3单元格的               向下拖动即可。
    A . 边框 B . 自动填充句柄 C . 数据 D . 边框中间区域
  3. (3) 现约定每个班级的“热度”就是该班“参与度”在年级中由高到低排序的序号。要得出“热度”榜单,需要以               为主要关键字进行降序排序。
    A . 班级 B . 人数 C . 参与度 D . 热度
  4. (4) 为了直观反映出各班级参与度的高低,将数据可视化,最适合的图表类型是          
    A . 雷达图 B . 柱形图 C . 折线图 D . 饼图
  5. (5) 高一四班的“音频后期处理”统计处目前显示“0.8”,该数据出现的问题应属于             
    A . 数据异常 B . 数据重复 C . 数据缺失 D . 格式不一致
学校对各班级的文艺汇演成绩做了评分,并利用Excel 软件进行数据处理,部分界面如图1所示。

图1

  1. (1)    用公式计算出各班级得分,可在I3 单元格输入公式,再利用自动填充得到其他班级得分,则I6 单元格上的公式为
  2. (2)    若将I3:I17单元格的数值小数位数设置为0,则I3单元格中的值(单选:填字母:A .变大/B .不变/C .变小)

    图2

  3. (3)    根据数据表中的数据制作的图表如图2所示,创建该图表的数据区域为
  4. (4)    若只对“高二”年级以“最后得分”为主要关键字降序排序,则排序时选择的数据区域是
  5. (5) 将各年级最后得分最高的班级设为该年级的一等奖,下列方法可得到高二年级一等奖班级的是            (多选,填字母)。
    A . 选择区域B8:I12,再按“列I”为关键词进行降序排序后,该区域的第1 条记录为高二年级一等奖班级 B . 先筛选出“班级”开头是“高二”的记录,再筛选出“最后得分”为最大1 项的记录,筛选结果即为高二年级一等奖班级 C . 先筛选出“最后得分”为最大1 项的记录,再筛选出“班级”包含“高二”的记录,筛选结果为高二年级一等奖班级 D . 先按“最后得分”升序排序,再筛选出“班级”包含“高二”的纪录,最后一条记录为高二年级一等奖班级
如图所示,表中数据排序所用的关键字是(    )

A . 金牌 B . 银牌 C . 铜牌 D . 总计
小明编写了一个保护照片隐私部分的程序。功能如下:依次输入左上角和右下角的坐标值(x1,y1,x2,y2,),对这块区域的像素进行加工处理。实现上述功能的Python程序如下,请回答下列问题:
  1. (1) 请在划线处填入合适代码。

    from PIL import Image

    import numpy as np

    import matplotlib.pyplot as plt

    from random import random

    s=input("依次输入左上角和右下角的坐标值(以‘,’分隔,以‘,’结尾):")

    w=[];h=[];k=0;t=0

    for i in s:

        if i==",":

            if k%2==0:

                w.append(t)    #append方法用于在列表末尾添加新元素

            else:

                h.append(t)

            t=0;k=k+1

        else:

           

    print(w,h)

    im =  #打开图像y.jpg

    pix=im.load()

    for i in range():

        j= h[0]

        while j<=h[1]:

            R,G,B=pix[i,j]

              pix[i,j]=(int(random()*0.8*R),int(random()*0.8*G),int(random()*0.8*B))

            j+=1

    plt.figure("y1")          #指定当前绘图对象

    plt.imshow(im)            #显示图像

    plt.axis("off")           #关闭图像坐标

    plt.show()                #弹出包含了图片的窗口

  2. (2) 调试程序时,输入数据“10,10,90,90”,能调试成功吗?(选填:能/不能)
在excel2007中,文字数据默认的对齐方式是(   )
A . 左对齐 B . 右对齐 C . 居中对齐 D . 两端对齐
很多情况下,我们需要把表格数据转换成图表数据,这样看上去对比效果更好要直观。下列类型的统计图表中,具备X轴、Y轴的是(     )
A . 饼形图 B . 圆环图 C . 条形图 D . 雷达图
电子表格软件Excel是一种(    )
A . 大型数据库系统 B . 大型操作系统 C . 应用软件 D . 系统软件