大数据处理类型与计算方式 知识点题库

下列关于分布式数据库HBase的理解,不正确的是(    )
A . HBase是谷歌BigTable数据库的开源实现 B . 建立在HDFS提供的底层存储基础上 C . 采用基于行的存储方式,可管理PB级的大数据 D . 主要用于存储非结构化数据和半结构化数据
实时处理与批处理整合的优势有(    )

①增加了系统开销

②有利于降低使用成本

③可以在同一个平台做批处理计算和流计算

④缩短了批处理计算和流计算之间的切换延时

A . ①②③ B . ①②④ C . ①③④ D . ②③④
下列关于流数据的描述,不正确的是(    )
A . 数据必须采集完成后处理 B . 数据价值随着时间的流逝降低 C . 可以采用流计算进行实时分析 D . 实时分析流数据可以得到更有价值的结果
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然(     )的计算机进行处理,必须采用分布式架构。
A . 单台计算机 B . 超运算 C . 无法用超运算 D . 无法用单台计算机
采用(      )可以分担负荷,均衡负载,提高处理问题的实时性,提高系统的可靠性和可用性。
A . 数据传输 B . 资源共享 C . 分布式处理 D . 集中式管理
下列关于大数据处理的说法,错误的是 (     )
A . 处理大数据一般采用分治思想 B . 数据采集只能收集结构化数据  C . 图计算主要针对图数据 D . 并行处理能节省复杂问题的处理时间
某大型购物网站收集了用户浏览网站的数据用于广告个性化实时推荐,下列处理方式中合理的是(         )
A . 应当使用统计分析软件进行数据分析 B . 应当选用针对流数据的实时计算 C . 应当选用针对图结构数据的图计算 D . 应当选用针对静态数据的批处理计算
大数据由于数据量大,服务器一般采用分布式文件存储或数据库存储。
关于大数据处理,下列说法正确的是(     )
A . 大数据必须采集完成后才能处理 B . 大数据包括对静态数据的批处理、对流数据的实时计算和对图结构数据的图计算 C . 大数据只能处理结构化数据不能处理非结构化的数据 D . 数据的可视化可以增强数据的解释力与吸引力
下列有关大数据及其处理的说法,错误的是(     )
A . 大数据的四个特征:数据规模大、处理速度快、数据类型多、价值密度低 B . 对大数据进行处理时,必须保证每个数据都准确无误 C . 批处理计算适合处理静态数据 D . 流计算适合处理实时更新的数据
下列描述的场景与处理方法使用不恰当的是(  )
A . 分析前一年的高铁客流数据优化高铁运行采用批处理计算 B . 京东网双12通过实时分析用户行为实现商品的推荐采用流计算 C . 图计算为腾讯超大规模社交网络图数据的各类计算提供支撑 D . 分析近五年的信息技术选考试卷梳理高频考点采用流计算
关于大数据处理,下列说法正确的是
A . 处理大数据时, 一般采用分治思想 B . 对图结构的数据一般采用流计算模式进行处理 C . 文本数据处理时需要将非结构化的文本原始状态转化成结构化数据 D . 数据的可视化可以帮助用户更快捷观察与追踪数据
某购物网站收集了用户浏览和搜索的数据,用于广告个性化实时推荐,下列处理方式中合理的是(     )
A . 选用针对流数据的实时计算 B . 选用针对图结构数据的图计算 C . 选用针对静态数据的批处理计算  D . 采用Hadoop计算平台进行数据分析