您的浏览器过于古老 & 陈旧。为了更好的访问体验, 请 升级你的浏览器
j0785 发布于2023年11月03日 12:04 最近更新于 2023年11月10日 10:27

原创 大数据挖掘:试题与答案二

932 次浏览 读完需要≈ 61 分钟 试题

内容目录

当前社会中,最为突出的大数据环境是( )

选择一项:

a. 自然资源

b. 互联网 

c. 综合国力

d. 物联网

正确答案是:互联网

 

可以对大数据进行深度分析的平台工具是( )

选择一项:

a. 未来机器学习工具

b. 第二代机器学习工具 

c. 第一代机器学习工具

d. 传统的机器学习和数据分析肛具

正确答案是:第二代机器学习工具

 

关于大数据在社会综合治理中的作用,以下理解不正确的是( )。

选择一项:

a. 大数据的运用能够维护社会治安

b. 大数据的运用能够加强交通管理

c. 大数据的运用能够杜绝抗生素的滥用 

d. 大数据的运用有利于走群众路线

正确答案是:大数据的运用能够杜绝抗生素的滥用

 

关于推荐系统的说法错误的是

选择一项:

a. 推荐系统的常见表现形式有猜你喜欢、买了又买、精品推荐等

b. 推荐系统经历了很短的时间形成 

c. 推荐系统的架构为离线计算-在线计算-推荐引擎APP

d. 推荐系统的相关技术包括机器学习及数据挖掘算法等

正确答案是:推荐系统经历了很短的时间形成

 

以下关于搜索引擎说法错误的是

选择一项:

a. 是能依据用户需求查找相应信息的在线搜索系统

b. 是基于web相关技术为基础的

c. 是对网络信息资源进行抓取和采集建立索引数据库

d. 呈现的搜索结果是凌乱无序的 

正确答案是:呈现的搜索结果是凌乱无序的

 

大数据可能带来( ),但未必能够带来( )。

选择一项:

a. 精确度;多样性

b. 准确度;精确度

c. 精确度;准确度

d. 多样性;准确度 

正确答案是:精确度;准确度

 

根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( )。

选择一项:

a. 数据分析员 

b. 软件开发工程师

c. 数据管理人员

d. 研究科学家

正确答案是:研究科学家

 

以下选项中,不属于信息时代的定律的是( )。

选择一项:

a. 摩尔定律

b. 达律多定律 

c. 吉尔德定律

d. 麦特卡尔夫定律

正确答案是:达律多定律

 

第一个提出大数据概念的公司是

选择一项:

a. 脸谱公司

b. 麦肯锡公司 

c. 微软公司

d. 谷歌公司

正确答案是:麦肯锡公司

 

以下选项中,不属于大数据对人才能力的要求是

选择一项:

a. 逻辑思维能力

b. 数学统计能力

c. IT技术能力

d. 业务能力 

正确答案是:逻辑思维能力

 

Web2.0强调()。

选择一项:

a. 个人

b. 网站 

c. 机构

d. 单位

正确答案是:个人

 

根据周琦老师所讲,高德交通日均采集数十亿定位请求,系统处理月均()公里驾驶里程覆盖。

选择一项:

a. 80亿

b. 100亿 

c. 150亿

d. 50亿

正确答案是:100亿

 

大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()。

选择一项:

a. 新一代信息技术

b. 新一代服务业态

c. 新一代技术平台

d. 新一代信息技术和服务业态 

正确答案是:新一代信息技术和服务业态

 

大数据整合要保证各个数据源之间的( )。

选择一项:

a. 一致性、相容性

b. 一致性、差异性

c. 一致性、协调性 

d. 差异性、协调性

正确答案是:一致性、相容性

 

在数据生命周期管理实践中,( )是执行方法。

选择一项:

a. 数据价值发觉和利用

b. 数据管理和维护 

c. 数据应用开发和管理

d. 数据存储和备份规范

正确答案是:数据管理和维护

 

下列国家的大数据发展行动中,集中体现"重视基础、首都先行”的国家是( )。

选择一项:

a. 美国

b. 日本

c. 中国

d. 韩国 

正确答案是:韩国

 

购物篮分析属于( )。

选择一项:

a. 关联分析

b. 分类与预测

c. 描述性统计

d. 聚类分析 

正确答案是:关联分析

 

美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。

选择一项:

a. 在分析效果上更追究效率而不是绝对精确

b. 在分析方法上更注重相关分析而不是因果分析

c. 在数据基础上倾向于全体数据而不是抽样数据 

d. 在数据规模上强调相对数据而不是绝对数据

正确答案是:在分析方法上更注重相关分析而不是因果分析

 

下列关于舍恩伯格对大数据特点的说法中,错误的是( )。

选择一项:

a. 数据处理速度快

b. 数据规模大

c. 数据价值密度高

d. 数据类型多样 

正确答案是:数据价值密度高

 

当前社会中,最为突出的大数据环境是( )。

选择一项:

a. 综合国力

b. 自然资源 

c. 互联网

d. 物联网

正确答案是:互联网

 

一切皆可试,大数据分析的效果好坏,可以通过模拟仿真或者实际运行来验证, 这体现了大数据思维维度中的( )

选择一项:

a. 因果思维 

b. 实验思维

c. 定量思维

d. 相关思维

正确答案是:实验思维

 

下列企业中,最有可能成为典型的数据资产动营商的是( )

选择一项:

a. 物联网企业

b. 电信运营商 

c. 云计算企业

d. 互联网企业

正确答案是:电信运营商

 

根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( )。

选择一项:

a. 数据分析员 

b. 软件开发工程师

c. 数据管理人员

d. 研究科学家

正确答案是:研究科学家

 

智能健康手环的应用开发,体现了( )的数据采集技术的应用。

选择一项:

a. API接口

b. 网络爬虫

c. 传感器 

d. 统计报表

正确答案是:传感器

 

智慧城市的构建,不包含( )。

选择一项:

a. 云计算

b. 物联网 

c. 数字城市

d. 联网监控

正确答案是:联网监控

 

K均值算法的缺点()①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量

选择一项:

a. ①③⑤ 

b. ①③

c. ①②③④⑤

d. ②④

正确答案是:①②③④⑤

 

关于内容深度理解建立索引说法正确的是

选择一项:

a. 内容索引与客观因素有很大关系

b. 内容索引又可以分为单索引和双索引

c. 索引分为客观索引和主观索引 

d. 客观索引与文档内容有关

正确答案是:索引分为客观索引和主观索引

 

中国的网络消费者比线下消费者更( )。

选择一项:

a. 年老和贫困

b. 年老和富裕

c. 年轻和贫困

d. 年轻和富裕 

正确答案是:年轻和富裕

 

大数据获取的个人信息比传统调研获得的个人信息真实性( )。

选择一项:

a. 不确定 

b. 相同

c. 更高

d. 更低

正确答案是:更高

 

DMP分为( )和( )。

选择一项:

a. 单一式DMP;多元式DMP

b. 开放式DMP;私有式DMP 

c. 单一式DMP;封闭式DMP

d. 开放式DMP;封闭式DMP

正确答案是:开放式DMP;私有式DMP

 

阿里巴巴旗下的数据管理平台,被称为:

选择一项:

a. 蚂蚁花呗

b. 支付宝

c. 达摩盘 

d. 招财宝

正确答案是:达摩盘

 

万维网之父是( )。

选择一项:

a. 彼得•德鲁克

b. 舍恩伯格

c. 斯科特•布朗

d. 蒂姆•伯纳斯-李 

正确答案是:蒂姆•伯纳斯-李

 

Mac OS系统的开发者是()。

选择一项:

a. 惠普公司

b. 微软公司

c. 苹果公司 

d. IBM公司

正确答案是:苹果公司

 

下列论据中,能够支撑"大数据无所不能”的观点的是( )。

选择一项:

a. 互联网金融打破了传统的观念和行为 

b. 大数据存在泡沫

c. 个人隐私泄露与信息安全担忧

d. 大数据具有非常高的成本

正确答案是:互联网金融打破了传统的观念和行为

 

Spark生态图中,()提供了一个机器学习的算法库

选择一项:

a. SharkSQL

b. GraphxGraphParallel

c. MLBaseMachineLearning 

d. Tachyon

正确答案是:MLBaseMachineLearning

 

Hive2也被称为Stringer,底层的计算引擎由()替换()

选择一项:

a. MapReduce,Tez 

b. Pig,Tez

c. Tez,Hdfs

d. Tez,MapReduce

正确答案是:Tez,MapReduce

 

支撑大数据业务的基础是( )。

选择一项:

a. 数据科学 

b. 数据人才

c. 数据应用

d. 数据硬件

正确答案是:数据应用

 

在数据生命周期管理实践中,( )是执行方法。

选择一项:

a. 数据应用开发和管理 

b. 数据价值发觉和利用

c. 数据管理和维护

d. 数据存储和备份规范

正确答案是:数据管理和维护

 

下列关于网络用户行为的说法中,错误的是( )。

选择一项:

a. 网络公司能够捕捉到用户在其网站上的所有行为 

b. 用户的隐私安全很难得以规范保护

c. 用户离散的交互痕迹能够为企业提升服务质量提供参考

d. 数字轨迹用完即自动删除

正确答案是:数字轨迹用完即自动删除

 

下列关于计算机存储容量单位的说法中,错误的是( )。

选择一项:

a. 基本单位是字节(Byte)

b. 一个字节能够容纳一个英文字符

c. 一个汉字需要一个字节的存储空间 

d. 1KB<1MB<1GB

正确答案是:一个汉字需要一个字节的存储空间

 

下列关于聚类挖掘技术的说法中,错误的是( )。

选择一项:

a. 与分类挖掘技术相似的是,都是要对数据进行分类处理 

b. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

c. 要求同类数据的内容相似度尽可能小

d. 要求不同类数据的内容相似度尽可能小

正确答案是:要求同类数据的内容相似度尽可能小

 

下列国家的大数据发展行动中,集中体现"重视基础、首都先行”的国家是( )。

选择一项:

a. 韩国 

b. 中国

c. 日本

d. 美国

正确答案是:韩国

 

()充分利用了MapReduce和HDFS的扩展性和容错性,是基于MapReduce开发的数据挖掘,机器学习库

选择一项:

a. YARN 

b. STORM

c. MAPREDUCE

d. MaHout

正确答案是:MaHout

 

特征抽取常用算法的互信息,互信息值()表示词条和类别的共现程度()

选择一项:

a. 越大,越小 

b. 越小,越大

c. 越小,越小

d. 越大,越大

正确答案是:越大,越大

 

根据PageRank算法的基本思想,以下哪种情况说明了页面的重要性

选择一项:

a. 被非重要的页面引用的页面 

b. 被多次引用的页面

c. 没有被多次引用的页面

d. 页面的重要性无法传递

正确答案是:被多次引用的页面

 

Web应用挖掘中最有效而且简单的分析方法是

选择一项:

a. 数据挖掘

b. 结构分析 

c. 内容分析

d. 点击流分析

正确答案是:点击流分析

 

Hadoop生态系统中,集群的资源管理系统是()

选择一项:

a. YARN

b. STORM 

c. HDFS

d. MAPREDUCE

正确答案是:YARN

 

Hadoop提供的MapReduce的编程方式中,()是最原始的方式

选择一项:

a. Java 

b. PHP

c. HadoopPipes

d. HadoopStreaming

正确答案是:Java

 

大数据的起源是( )

选择一项:

a. 互联网 

b. 电信

c. 公共管理

d. 金融

正确答案是:互联网

 

假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是( )关系,而吸烟和肺癌则是()关系

选择一项:

a. 相关因果 

b. 因果相关

c. 因果并列

d. 并列相关

正确答案是:因果相关

 

下列关于数据交易市场的说法中,错误的是( )

选择一项:

a. 商业化的数据交易活动催生了多方参与的第三方数据交市场 

b. 数据交易市场是大数据资源化的必然产物

c. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助

d. 数据交易市场是大数据产业发展到一定程度的产物

正确答案是:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助

 

当前大数据技术的基础是由( )首先提出的

选择一项:

a. 阿里巴巴 

b. 微软

c. 百度

d. 谷歌

正确答案是:谷歌

 

下列演示方式中,不属于传统统计图方式的是( )

选择一项:

a. 曲线图 

b. 饼状图

c. 柱状图

d. 网络图

正确答案是:网络图

 

支撑大数据业务的基础是( )。

选择一项:

a. 数据科学 

b. 数据人才

c. 数据应用

d. 数据硬件

正确答案是:数据应用

 

下列关于舍恩伯格对大数据特点的说法中,错误的是( )

选择一项:

a. 数据规模大

b. 数据类型多样

c. 数据处理速度快

d. 数据价值密度高 

正确答案是:数据价值密度高

 

下列关于大数据的分析理念的说法中,错误的是( )

选择一项:

a. 在数据规模上强调相对数据而不是绝对数据 

b. 在分析效果上更追求效率而不是绝对精确

c. 在数据基础上倾向于全体数据而不是抽样数据

d. 在分析方法上更注重相关分析而不是因果分析

正确答案是:在数据规模上强调相对数据而不是绝对数据

 

下列关于聚类挖掘技术的说法中,错误的是( )

选择一项:

a. 要求不同类数据的内容相似度尽可能小

b. 要求同类数据的内容相似度尽可能小 

c. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

d. 与分类挖掘技术相似的是,都是要对数据进行分类处理

正确答案是:要求同类数据的内容相似度尽可能小

 

智慧城市的构建,不包含( )

选择一项:

a. 数字城市

b. 云计算

c. 联网监控 

d. 物联网

正确答案是:联网监控

 

传统数据密集型行业积极探索和布局大数据应用的表现是( )。

选择一项或多项:

a. 实现科学决策与运营 

b. 提高分析挖掘能力 

c. 自行开发数据产品 

d. 投资入股互联网电商行业 

e. 打通多源跨域数据

正确答案是:打通多源跨域数据, 提高分析挖掘能力, 实现科学决策与运营

 

中国电信把自己的大数据开发分为:

选择一项或多项:

a. 服务类应用 

b. 媒体类应用 

c. 广告类应用

d. 商品类应用

正确答案是:商品类应用, 媒体类应用

 

百度大数据的特点有哪些?

选择一项或多项:

a. 具有大量搜索数据 

b. 具有大量移动端数据 

c. 具有大量网购数据

d. 具有消费者位置数据 

正确答案是:具有大量搜索数据, 具有大量移动端数据, 具有消费者位置数据

 

下列各项表述中正确的有哪些?

选择一项或多项:

a. 中央网络安全和信息化领导小组组长是习近平。 

b. 我国中央网络安全和信息化领导小组宣告成立是在2013年。 

c. 我国中央网络安全和信息化领导小组宣告成立是在2014年。

d. 中央网络安全和信息化领导小组组长是李克强。

正确答案是:中央网络安全和信息化领导小组组长是习近平。, 我国中央网络安全和信息化领导小组宣告成立是在2014年。

 

贵州发展大数据的"八个一”建议包括()。

选择一项或多项:

a. 培养一批干部、出台一批政策 

b. 引入一批人才、聚集一批创客

c. 谋划一批产业、引进一批项目

d. 制定一个工作计划、建立一个领导机构

正确答案是:制定一个工作计划、建立一个领导机构, 培养一批干部、出台一批政策, 引入一批人才、聚集一批创客, 谋划一批产业、引进一批项目

 

云计算使得使用信息的存储是一个()的方式,它会大大地节约网络的成本,使得网络将来越来越泛在、越来越普及,成本越来越低。

选择一项或多项:

a. 分布式 

b. 共享式

c. 密集式

d. 密闭式

正确答案是:分布式, 共享式

 

零售数据的线上来源包括( )。

选择一项或多项:

a. 利用大数据对非合作电商的推算

b. 合作电商的数据

c. 产品条目

d. 全渠道覆盖 

正确答案是:合作电商的数据, 利用大数据对非合作电商的推算

 

贵州发展大数据的顶层设计是要逐步建成三个中心,即()。

选择一项或多项:

a. 大数据人才中心

b. 大数据金融中心

c. 大数据服务中心

d. 大数据内容中心

正确答案是:大数据金融中心, 大数据内容中心, 大数据服务中心

 

云计算的特点包括以下哪些方面?

选择一项或多项:

a. 低使用度

b. 服务可租用

c. 服务可计算

d. 高性价比

正确答案是:服务可计算, 高性价比, 服务可租用

 

根据下图判断是聚类分析的哪种数据源

选择一项或多项:

a. 相异度矩阵

b. 数据矩阵

c. 二模矩阵

d. 距离矩阵

正确答案是:二模矩阵, 相异度矩阵, 距离矩阵

 

数据挖掘面临的问题有哪些

选择一项或多项:

a. 挖掘方法与用户交互

b. 算法的有效性和可伸缩性

c. 数据缺失

d. 噪声处理

正确答案是:噪声处理, 数据缺失, 算法的有效性和可伸缩性, 挖掘方法与用户交互

 

以下Web信息特点的是

选择一项或多项:

a. 信息复杂

b. 信息量庞大

c. 信息使用者复杂

d. 垃圾信息特别多

e. 信息是动态的

正确答案是:信息量庞大, 信息复杂, 信息是动态的, 垃圾信息特别多, 信息使用者复杂

 

可视化高维展示技术在展示数据之间的关系以及数据分析结果方面作( )

选择一项或多项:

a. 能够直观反映成对数据之间的空间关系

b. 能够直观反映多维数据之间的空间关系

c. 提供高性能并行计算技术的强力支撑

d. 能够动态演化事物的变化及变化的规律

e. 能够静态演化事物的变化及变化的规律

正确答案是:能够直观反映多维数据之间的空间关系, 能够动态演化事物的变化及变化的规律

 

下列关于计算机存储容量单位换算关系的公式中,正确的是( )

选择一项或多项:

a. 1KB=1012Byte

b. 1GB=1024KB

c. 1KB=1024Byte

d. 1GB=1024MB

e. 1GB=1012KB

正确答案是:1KB=1024Byte, 1GB=1024MB

 

下列各国大数据发展路径的描述中,对应关系正确的是( )

选择一项或多项:

a. 澳大利亚:原则先行、谨慎发展

b. 日本:走尖端IT路线

c. 韩国:重视基础、首都先行

d. 印度:以IT外包转型为突破口若悬河

e. 英国:视大数据为新的自然资源

正确答案是:日本:走尖端IT路线, 韩国:重视基础、首都先行, 印度:以IT外包转型为突破口若悬河, 澳大利亚:原则先行、谨慎发展

 

宁家骏委员指出,我国民生领域信息化服务水平显著提升。

选择一项:

正确答案是“对”。

 

1997年,1GB闪存的价格将近8000美元,现在是25美分。

选择一项:

正确答案是“对”。

 

在大数据的荡畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行

选择一项:

正确答案是“错”。

 

第三方数据处理模式表现为:服务商通过软件即服务或平台即服务形式主义为用户提供自己的数据上服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果?

选择一项:

正确答案是“错”。

 

下列关于云计算和数据库的说法中,错误的是( )

选择一项或多项:

a. 获取足够大的样本数据乃至全体数据非常容易

b. 比抽样调查数据更全面

c. 以为发现新的商业机会提供决策支持

d. 比抽样调查更能反映整个群体的特征与规律

e. 获取样本的代价很高

正确答案是:获取样本的代价很高, 以为发现新的商业机会提供决策支持

 

国务院办公厅关于深入实施"互联网+流通”行动计划的意见》要求:支持建设农产品流通全程冷链系统?

选择一项:

正确答案是“对”。

 

移动互联网实现了人人相连、人物相联、物物相连?

选择一项:

正确答案是“对”。

 

奥巴马认为,对大数据的占有与控制,反映的是一个国家的核心能力之大小。因此,他已经将大数据上升到国家战略高度?

选择一项:

正确答案是“对”。

 

具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求?

选择一项:

正确答案是“错”。

 

在噪声数据中,波动数据比离群点数据偏离整体水平更大?

选择一项:

正确答案是“错”。

  • CodePlayer技术交流群1
  • CodePlayer技术交流群2

0 条评论

撰写评论