数据分析 知识点题库

小李收集了2015年浙江省全社会就业人数情况数据,并使用了Excel软件进行数据处理。如图a所示。

图a

请回答下列问题:

  1. (1) 当前工作表中仅区域A1:G14   有数据,其中G4单元格正确计算了杭州市占全省就业总人数比例。小李通过G4单元格中的公式对区域G5:G14进行自动填充,则G14单元格中显示的计算结果是(选填:0.00/17.89/100.00)。
  2. (2) 上述操作后,小李发现区域G5:G14计算结果不符合要求。若要正确计算“占全省就业总人数比例(%)”列的数据,可先修改G4单元格中的公式,在进行自动填充。修改后G4单元格的公式为(公式中要求保留使用SUM函数)。
  3. (3) 根据如图a中数据制作的图表如图b所示,创建该图标的数据区域是A3:A4,

    图b

  4. (4) 将区域A3:F14的数据复制到新工作表,在新工作表中对数据进行筛选操作,筛选设置如下图所示,则按此设置筛选出的城市有个。

下图表格是某校对高一学生进行“七选三”选课意向调查后得到的统计结果,请分析后回答下列问题:

  1. (1) 表格中,区域C17:I17是通过公式计算得到的,则C17单元格输入的公式是,然后利用自动填充功能完成区域内其他单元格的计算。上述计算完成后,要求保留两位小数,可以通过下图中选项卡进行设置。(提示:各科选课人数比例(%)=各科选考人数/年级总人数*100)

  2. (2) 为了更直观的观察各科选考人数比例,王老师制作了如下图所示图表,该图表选择的数据区域为。当对表中数据进行筛选时,图表发生变化。

  3. (3) 小明同学想在物理、地理和政治中选择一门作为自己的选考科目,他将自己历次的统测成绩与年级平均分比较后,绘制出如下折线图,你认为小明应当选考

小李收集了2018年1月部分地市网络零售统计数据,并使用Excel软件进行数据处理,如图a所示。

  1. (1) 如图a所示,当前已选中D3:E3单元格,要实现与B3:C3一样的格式,则可直接点击工具栏中按钮(填字母:A.    B.    C.    D.
  2. (2) 要统计“消费额”与“零售额”都超过50亿元的城市个数,小李想到以下两种方式:

    方式一:在F14单元格中输入公式: = COUNTIF(b5:B12, “>50”)+ COUNTIF(D5:D12, “ > 50”)(提示:COUNTIF函数用于统计某个区域满足条件的单元格个数。例如:= COUNTIF(C5:C12, “ < 10”)表示在数据区域C5:C12中数值小于10的单元格个数)。

    方式二:在“消费额”与“零售额”单元格中分别以大于50为条件进行自定义筛选,观察得到。

    你认为可实现的操作是。(单选,填字母:A .方式一 /B .方式二 /C .方式一、方式二都可以)

  3. (3) 要想以“顺差”为主要关键字进行升序排序,下列方式可行的是________。(多选,填字母)

    A . 选择区域A3:F12,执行自定义排序指令,并以图b设置完成排序 B . 选择区域A4:F12,执行自定义排序指令,并以图b设置完成排序 C . 选择区域A3:F12,执行自定义排序指令,并以图c设置完成排序 D . 选择区域A4:F12,执行自定义排序指令,并以图c设置完成排序
李明同学想比较一下前3次单元测试中自己的成绩是进步了还是退步了,他应使用( )图表进行成绩分析会比较直观。
A . 柱形图 B . 条形图 C . 线形图 D . 饼形图
小王收集了2017年8月我国50个城市部分食品平均价格变动情况,使用Excel软件对数据进行处理,界面如图所示。请回答下列问题:

图a

  1. (1) 已知 E14 单元格是由 C14 单元格复制公式得到的,则 E14 单元格中的公式为
  2. (2) 小米在操作时,不小心将 E3:E12 的数据删除,则 E14 单元格的值为(单选,填字母:A .“10”/ B .“0”/ C .“#DIV/0!”/ D .“#VALUE!”)
  3. (3) 如图 a 所示,若要将数据按照“食品名称”进行升序排序,应该选择的区域为           
  4. (4) 小王创建了如图 b 所示的图表,该图表的数据区域为

    图  b

小王收集了学校教师欢乐四项赛得分的相关数据,并使用Excel软件进行数据处理,如图a所示。

图a

请回答下列问题:

  1. (1) 小王要通过自动填充将“报名号”的值填充为如图a所示的序列“01,02,……,18”,则可先将该区域单元格格式设置为(单选,填字母:A .数值/B .货币/C .百分比/D .文本)。
  2. (2) 在L5单元格中使用SUMIF函数计算高三年级所有选手总分之和,则L5单元格中的公式是

    (提示:SUMIF函数用于对以域中满足条件的单元格求和。例如:=SUMIF(B3:B20,"高二",I3:I20)表示高二年级所有选手总分之和)

  3. (3) 根据图a中数据制作的图表如图b所示,创建图表的数据区域是

    图b

  4. (4) 市教育工会将举行“巾帼杯”欢乐四项赛,比赛项目为上述四项,计分规则不变。比赛规则:每校由2名女教师参加;每项每校由1名教师参赛;每名教师参赛项目不限;比赛成绩为4项得分的总和。以本次教师欢乐四项赛的结果为依据,从林雅璇、郦佳玲和董雯静中选择2名选手代表学校参加比赛。为使学校取得最高总分,你的选择是(单选,填字母:A .林雅璇与郦佳玲/B .林雅璇与董雯静/C .郦佳玲与董雯静)。
阅读试题,请在相应位置写出问题的答案。

某银行国际业务部通过折线图比较业务处理效率情况,可掌握业务效率变化,及时发现业务延迟和低效率,提高服务水平。下面是汇入汇款,汇出汇款,电子转发,分报四种业务 折线图,请根据该折线图分析并回答以下问题。

  1. (1) 从折线图可以看出,汇入汇款,汇出汇款,电子转发,分报四种业务所耗时间变化波动最小的是
  2. (2) 02年第三季度,服务时间最短的业务是
  3. (3) 四种业务中,业务所耗时间容易反弹,需要加强控制。
下列有关数据关联分析的说法正确的是(    )
A . 对数据进行预处理,发现和处理缺失值,异常数据、绘制直方图,观察数据分布的特征,求最大值、最小值、极差等描述性统计量。 B . 分析发现存在于大量数据之间的关联性和相关性,从而描述一个事物的共同规律和模式。 C . 是一种探索性的分析。不必事先给出一个分类标准,而是让其自动分类。 D . 是数据分析中最基本的方法。先基于样本数据构建分类器,然后进行预测。
以下数据为1945年—2015年间登陆我国的台风数据记录。按数据流计算,尝试使用数据分析的方法,建立模型推测下一次台风登陆我国的地点及时间,并阐述你的理由。

图1

图2

图3

根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(    )。
A . 数据管理人员 B . 数据分析员  C . 研究科学家 D . 软件开发工程师
数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值、异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。
下列不是数据分析类型的是(     )
A . 有关趋势的分析 B . 有关比例的分析 C . 有关大小的分析 D . 有关关系的分析
小河收集了“2019年中国一线城市与部分新一线城市指数”数据,并使用Excel软件进行数据处理,如图a所示。

  1. (1) 将单元格H9中的公式向上自动填充至H3,依次出现#VALUE!和#REF!的错误提示,其中,显示为#REF!的错误原因是(单选,填字母:A .除数为0/B .引用地址出错/C .引用单元格内容出错)。
  2. (2) 为了避免出现以上错误,应将单元格H9中的公式修改为
  3. (3) 根据图a中的数据制作的图表如图b所示,下列描述正确的是          (多选,填字母)。

    A . 建立图b所示的图表数据区域为A2:G2,A7:G9 B . 图b所示的图表系列产生在列 C . 对新一线城市以“城市人活跃度”为关键字从大到小进行排序,则排序的数据区域是B7:H9,排序后图表发生相应改变 D . 筛选“未来可塑性”最高的20%后,显示的城市为北京,图表不会发生变化 E . 将C3:C9区域单元格格式设置为保留1位小数后,图表不会发生改变
数据分析的方法中,下列(    )不是。
A . 特征探索 B . 建立模型 C . 线性分析 D . 聚类与分类
某超市统计了特价商品的相关信息,用Excel软件对商品数据进行处理,如图a所示。

  1. (1) 要通过自动填充将“编号”列的值填充为如图a所示的序列“01,02,……,74”,则可先将该区域单元格格式设置为(单选,填字母:A .数值/B .货币/C .百分比/D .文本)。
  2. (2) 图a中区域H4:H75的折扣率是根据H3单元格自动填充得到,则H3单元格中的公式(折扣率=(零售价–特价)/零售价×100)
  3. (3) 对区域A2:H75进行相关数据分析,下列说法错误的是       (多选,填字母)。
    A . 删除了“单位”列,“折扣率%”列数据不会发生变化 B . 若要找出所有名称中含“茶”的饮料,可对“名称”列按图b条件进行筛选 C . 为找出“产地”为浙江,折扣率最大的商品,可以“产地”等于“浙江”为条件进行筛选,再对“折扣率%”进行筛选,选择“10个最大的值”,并显示为最大的1项 D . 为找出“产地”为广州,零售价格最高的商品,可以“零售价格”为关键字降序排序,再对“产地”进行筛选,条件为“广州”
某国的一家大型连锁超市通过利用信息系统对大量的销售数据进行了特定的分发现一个“奥秘”,于是这家超市就把尿布和啤酒这两种看起来没有关联的商品摆放在一起销售,结果销售量大幅增加。原来,超市经营者从数据分析中发现,婴儿尿布通常是男人们下班时购买的,而他们在购买尿布时又会顺便购买自己爱喝的啤酒。这个案例中的超市信息系统应用了大数据分析中的技术。
2020年双十一期间,甲电商平台销售额超过4900亿元,同比增长26.7% ;乙电商平台销售额超过2700亿元,同比增长33%。对此数据进行分析,下列正确的是(    )
A . 通过分析可知,乙电商平台销售额增速低于甲电商平台 B . “双十一”、“电商平台” 等文字不是数据 C . 4900亿、 2700亿仅为大约数值,并不是数据 D . 面对电商平台每天产生的海量数据,需运用大数据技术来分析,挖掘其中蕴藏的价值
某校位于水果之乡,区域内有规模化的水果基地。为增进学生对家乡的认识,培养学生实践能力,学校决定结合地方区域优势,设立百果园。为研究种植哪些果树,学校成立了果树种植可行性研究性学习小组。果树的成长离不开土壤、气温、降水量、日照、风等自然条件,同学们根据需求分析。设立了方案,将分成3组分开进行研究。

组1:利用网络调查本校所处的经纬度、温度带和气候带,调查适合种植哪些水果

组2:利用传感器采集土壤的样本,了解百果园的种植条件。

组3:实地调查,了解附近果农们种植了哪些水果,不同水果的生长条件以及管理方法。

  1. (1) 按照获取数据的渠道,可以将数据分为两类:A、直接数据和B、间接数据。

    指出下列三个小组获得的数据分别属于哪一种,组1通过搜索引擎检索获得的数据属于;组2通过传感器获得的数据属于;组3与果农交流获得的数据属于

  2. (2) 组1利用网络获取信息的资源丰富,覆盖面广,但是在搜集数据时我们也要考虑一些因素,下列选项中,不是本案例需要考虑的因素是:(   )
    A . 时效性 B . 合法性 C . 权威性 D . 数据大小
  3. (3) 组2要了解百果园的土壤的种植条件,需要借助传感器,现在请根据需求选择合适的传感器。 土壤的温湿度,土壤的酸碱性;土壤的光照度;土壤的肥力状况

    A.光敏传感器   B.土壤氮磷钾传感器    C.PH值传感器     D.温湿度传感器土壤的温湿度

  4. (4) 直接数据的搜集方法有很多,组3通过实地观察了解各种水果在本区域的生长情况,这种研究方法属于(   )。
    A . 调查法 B . 访谈法 C . 观察法 D . 实验法
  5. (5) 通过小组成员的努力,进行了数据的采集与分析,并形成可行性报告,展示图文资料,下列不适合制作可行性报告的是(   )。
    A . Word B . PPT C . 记事本 D . 网页
使用Excel软件,处理浙江省2020年各行业、各类型就业人员人数相关数据,如图a所示。请回答下列问题:

  1. (1) D4单元格正确计算了国有单位就业人数占比,通过复制D4单元格中的公式粘贴到F4和H4,并对区域F5:F23和H5:H23进行自动填充,发现计算结果不符合要求。若要正确计算F列和H列的数据,应将D4单元格的公式修改为 。
  2. (2) 根据图a中数据制作的图表如图b所示,创建该图表的数据区域是

  3. (3) 结合图a和图b进行相关数据分析,下列说法正确的是              (多选,填字母)。;
    A . 图b柱形上方的数值可以通过数据标签进行添加。 B . 对“合计”列设置筛选条件为最大3项,则筛选出的行号为7、9、20。 C . 对数据区域A3:H23以“合计”为主要关键字进行降序排序,则图b会发生改变。 D . 在图a所示工作表的“合计”列前插入一列,D列的数值会发生改变。
收集某校高二(7)班2022年4月校园消费数据,并使用Excel软件进行处理,如图a所示。

请回答下列问题:

  1. (1) 区域G4:I42的数据是通过公式计算得到的,在G4单元格中输入公式,然后使用自动填充功能完成区域G4:I42的计算。(提示:各项消费占比是指该学生相应项目的消费金额占该学生三项消费总金额的百分比)
  2. (2) 为直观反映该月高二(7)班校园各项消费的占比情况,根据图a中的数据制作的图表如图b所示。创建该图表的数据区域为D3:F3,

  3. (3) 对图a中的数据进行分析,下列说法正确的有            (多选,填字母)。
    A . 当前选中的单元格是通过合并区域A1:I1得到的,单元格名称为A1 B . 设置区域F4:F42的单元格格式为“数值”、1位小数,区域I4:I42中数据会发生改变 C . 以“性别”为男、“食堂消费”小于400进行筛选,可以找出该班食堂消费低于400元的男生 D . 选中区域D3:I42,按“超市消费”降序排序后,该班超市消费金额最高的学生姓名显示在B4单元格中