您的浏览器过于古老 & 陈旧。为了更好的访问体验, 请 升级你的浏览器
j0785 发布于2023年11月07日 09:57 最近更新于 2023年11月10日 10:31

原创 大数据挖掘:试题与答案三

1833 次浏览 读完需要≈ 54 分钟 试题

内容目录

在网络爬虫的爬行策略中,应用最为基础的是( )。

选择一项或多项:

a. 大站优先策略

b. 反向链接策略

c. 高度优先遍历策略

d. 广度优先遍历策略

e. 深度优先遍历策略

正确答案是:深度优先遍历策略, 广度优先遍历策略

 

当前,大数据产业发展的特点是( )。

选择一项或多项:

a. 规模较小

b. 规模较大

c. 多产业交叉融合

d. 增速缓慢

e. 增速很快

正确答案是:规模较大, 增速很快, 多产业交叉融合

 

下列关于数据生命周期管理的核心认识中,正确的是( )。

选择一项或多项:

a. 数据生命周期管理旨在产生效益的同时,降低生产成本

b. 根据数据价值的不同应该对数据采取不同的管理策略

c. 数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段

d. 数据生命周期管理最终关注的是社会效益

e. 在不同的数据存在阶段,数据的价值是不同的

正确答案是:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段, 在不同的数据存在阶段,数据的价值是不同的, 根据数据价值的不同应该对数据采取不同的管理策略

 

下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( )。

选择一项或多项:

a. 传统营销模式比基于大数据的营销模式投入更小

b. 传统营销模式比基于大数据的营销模式转化率低

c. 基于大数据的营销模式比传统营销模式实时性更强

d. 传统营销模式比基于大数据的营销模式针对性更强

e. 基于大数据的营销模式比传统营销模式精准性更强

正确答案是:传统营销模式比基于大数据的营销模式投入更小, 传统营销模式比基于大数据的营销模式针对性更强

 

按照涉及自变量的多少,可以将回归分析分为( )。

选择一项或多项:

a. 非线性回归分析

b. 一元回归分析

c. 多元回归分析

d. 综合回归分析

e. 线性回归分析

正确答案是:多元回归分析

 

传统数据密集型行业积极探索和布局大数据应用的表现是( )。

选择一项或多项:

a. 打通多源跨域数据

b. 自行开发数据产品

c. 投资入股互联网电商行业

d. 实现科学决策与运营

e. 提高分析挖掘能力

正确答案是:提高分析挖掘能力, 实现科学决策与运营

 

下列关于大数据的说法中,错误的是( )。

选择一项或多项:

a. 大数据的应用注重因果分析而不是相关分析

b. 处理大数据需采用新型计算架构和智能算法等新技术

c. 大数据的目的在于发现新的知识与洞察并进行科学决策

d. 大数据具有体量大、结构单一、时效性强的特征

e. 大数据的应用注重相关分析而不是因果分析

正确答案是:大数据具有体量大、结构单一、时效性强的特征, 大数据的应用注重因果分析而不是相关分析

 

数据建立信心的作用需具备的条件包括( )。

选择一项或多项:

a. 多方的数据源

b. 信得过的第三方单位

c. 可靠数据源

d. 合适的数据分析

正确答案是:可靠数据源, 信得过的第三方单位

 

数据只有在与( )的交互中才能发挥作用。

选择一项或多项:

a. 消费者

b. 物

c. 人

d. 企业

正确答案是:人, 消费者, 企业

 

大数据的定义是:

选择一项或多项:

a. 商业

b. 技术

c. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合

d. 任何超过了一台计算机处理能力的数据量

正确答案是:指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合, 任何超过了一台计算机处理能力的数据量

 

大数据五大类应用方向是:

选择一项或多项:

a. 查询

b. 统计

c. 预警

d. 预测

e. 触达

正确答案是:查询, 触达, 统计, 预警, 预测

 

以下属于推荐系统算法的是

选择一项或多项:

a. 关联规则算法

b. 基于知识推理算法

c. CF协同过滤算法

d. 聚类及相似度算法

正确答案是:CF协同过滤算法, 聚类及相似度算法, 基于知识推理算法, 关联规则算法

 

传统大数据质量清洗的特点有:

选择一项或多项:

a. 非确定性

b. 确定性

c. 强类型性

d. 协调式的

正确答案是:确定

 

以下选项中属于数据的作用的是( )。

选择一项或多项:

a. 欣赏

b. 建立信心

c. 验证假设

d. 沟通

正确答案是:沟通, 验证假设, 建立信心

 

( )反映数据的精细化程度,越细化的数据,价值越高。

选择一项:

a. 关联度

b. 规模

c. 颗粒度 

d. 活性

正确答案是:颗粒度

 

面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是( )

选择一项:

a. 大数据信息分类模式

b. 大数据解决方案模式

c. 大数据处理服务模式

d. 大数据资源提供模式 

正确答案是:大数据解决方案模式

 

对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。

选择一项:

对 

正确答案是“错”。

 

"大数据”一词,最早出现于20世纪90年代,当时的数据仓库之父比尔.恩门经常提及Big Data。

选择一项:

对 

正确答案是“对”。

 

1997年,1GB闪存的价格将近8000美元,现在是25美分。

选择一项:

对 

正确答案是“对”。

 

具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响, 从而说服决策者信服并采纳其建议, 是数据分析能力对大数据人才的基本要求。

选择一项:

对 

正确答案是“错”。

 

简单随机抽样,是从总体 N个对象中任意抽取 n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。

选择一项:

对 

正确答案是“错”。

 

属于高质量聚类分析的要求:①可扩展性 ②处理相同类型数据的能力 ③发现任意形状的能力 ④领域知识参数输入的最大化 ⑤处理噪声数据的能力 ⑥数据输入顺序敏感

选择一项:

a. ①③⑥

b. ①②③④⑤⑥

c. ②④⑥

d. ①③⑤

正确答案是:①③⑤

 

社群结构聚合探测算法的步骤中,()条件满足时,算法会停止并输出探测结果。

选择一项:

a. 0

b. maxφpq≤0

c. maxφpq

d. maxφpq≥0

e. maxφpq<0

正确答案是:maxφpq≤0

 

以下说法错误的是

选择一项:

a. 关联规则在使用时的两个指标是支持度和置信度

b. FP-树频集算法虽然克服了Apriori算法复杂度的问题,但是获得的结果却是不靠谱的

c. FP-树频集算法是针对Apriori算法缺点进行改进后的算法

d. APRIORI算法最大的缺点是复杂度太高

正确答案是:FP-树频集算法虽然克服了Apriori算法复杂度的问题,但是获得的结果却是不靠谱的

 

关联规则的基本概念中错误的是

选择一项:

a. K项集指的是K个项的集合

b. 项集频率指的是项集所有交易中出现的次数

c. 相对支持度指的是项集出现次数除以总的交易次数

d. 置信度是项集出现次数除以总的交易次数

正确答案是:置信度是项集出现次数除以总的交易次数

 

K均值算法的缺点():①经常终止于局部最优解②需要先验的领域知识③对噪声和离群点比较敏感④不能发现任意类型的类⑤不能处理分类变量

选择一项:

a. ②④

b. ①②③④⑤

c. ①③

d. ①③⑤

正确答案是:①②③④⑤

 

下列关于数据重组的说法中,错误的是( )。

选择一项:

a. 数据重组是数据的重新生产和重新采集

b. 数据重组能够使数据焕发新的光芒

c. 数据重组实现的关键在于多源数据融合和数据集成

d. 数据重组有利于实现新颖的数据模式创新

正确答案是:数据重组是数据的重新生产和重新采集

 

大数据的最显著特征是( )。

选择一项:

a. 数据价值密度高

b. 数据规模大

c. 数据处理速度快

d. 数据类型多样

正确答案是:数据规模大

 

美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的( )。

选择一项:

a. 在分析效果上更追究效率而不是绝对精确

b. 在数据基础上倾向于全体数据而不是抽样数据

c. 在数据规模上强调相对数据而不是绝对数据

d. 在分析方法上更注重相关分析而不是因果分析

正确答案是:在分析方法上更注重相关分析而不是因果分析

 

下列关于舍恩伯格对大数据特点的说法中,错误的是( )。

选择一项:

a. 数据价值密度高

b. 数据规模大

c. 数据类型多样

d. 数据处理速度快

正确答案是:数据价值密度高

 

当前社会中,最为突出的大数据环境是( )。

选择一项:

a. 互联网

b. 自然资源

c. 物联网

d. 综合国力

正确答案是:互联网

 

根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种( )

选择一项:

a. 数据分析员

b. 研究科学家

c. 数据管理人员

d. 软件开发工程师

正确答案是:研究科学家

 

下列论据中,能够支撑"大数据无所不能”的观点的是( )

选择一项:

a. 大数据存在泡沫

b. 互联网金融打破了传统的观念和行为

c. 大数据具有非常高的成本

d. 个人隐私泄露与信息安全担忧

正确答案是:互联网金融打破了传统的观念和行为

 

下列国家的大数据发展行动中,支持原则先行、谨慎发展的国家( )

选择一项:

a. 澳大利亚

b. 印度

c. 英国

d. 韩国

正确答案是:澳大利亚

 

医疗健康数据的基本情况不包括以下哪项?

选择一项:

a. 健康档案数据

b. 公共安全数据

c. 个人健康管理数据

d. 诊疗数据

正确答案是:公共安全数据

 

美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大网点,这体现了大数据分析理念中的( )

选择一项:

a. 在数据规模上强调相对数据而不是绝对数据

b. 在分析效果上更追求效率而不是绝对精确

c. 在数据基础上倾向于全体数据而不是抽样数据

d. 在分析方法上更注重相关分析而不是因果分析

正确答案是:在分析方法上更注重相关分析而不是因果分析

 

数据仓库的最终目的是( )

选择一项:

a. 开发数据的应用分析

b. 建立数据仓库逻辑模型

c. 为用户和业务部门提供决策支持

d. 收集业务需求

正确答案是:为用户和业务部门提供决策支持

 

大数据的最显著特征是( )

选择一项:

a. 数据规模大

b. 数据类型多样

正确答案是:数据规模大

 

智慧城市的构建,不包含( )。

选择一项:

a. 联网监控

b. 物联网

c. 云计算

d. 数字城市

正确答案是:联网监控

 

根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国10万公里15万处更新。

选择一项:

a. 2008年

b. 2006年

c. 2014年

d. 2010年

正确答案是:2014年

 

以下选项中,不属于大数据对人才能力的要求是

选择一项:

a. 数学统计能力

b. 逻辑思维能力

c. 业务能力

d. IT技术能力

正确答案是:逻辑思维能力

 

根据周琦老师所讲,高德交通报告针对全国()个城市交通状态进行挖掘分析。

选择一项:

a. 21

b. 38

c. 25

d. 30

正确答案是:38

 

以下选项中,不属于大数据对人才能力的要求是( )。

选择一项:

a. IT技术能力

b. 业务能力

c. 数学统计能力

d. 逻辑思维能力

正确答案是:逻辑思维能力

 

Web2.0强调()。

选择一项:

a. 个人

b. 单位

c. 机构

d. 网站

正确答案是:个人

 

根据周琦老师所讲,高德交通日均采集数十亿定位请求,系统处理月均()公里驾驶里程覆盖。

选择一项:

a. 150亿

b. 50亿

c. 100亿

d. 80亿

正确答案是:100亿

 

大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()。

选择一项:

a. 新一代信息技术和服务业态

b. 新一代信息技术

c. 新一代服务业态

d. 新一代技术平台

正确答案是:新一代信息技术和服务业态

 

大数据整合要保证各个数据源之间的( )。

选择一项:

a. 一致性、差异性

b. 差异性、协调性

c. 一致性、协调性

d. 一致性、相容性

正确答案是:一致性、相容性

 

医疗健康数据的基本情况不包括以下哪项?

选择一项:

a. 健康档案数据

b. 公共安全数据

c. 个人健康管理数据

d. 诊疗数据

正确答案是:公共安全数据

 

美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大网点,这体现了大数据分析理念中的( )

选择一项:

a. 在数据规模上强调相对数据而不是绝对数据

b. 在分析效果上更追求效率而不是绝对精确

c. 在数据基础上倾向于全体数据而不是抽样数据

d. 在分析方法上更注重相关分析而不是因果分析

正确答案是:在分析方法上更注重相关分析而不是因果分析

 

数据仓库的最终目的是( )

选择一项:

a. 开发数据的应用分析

b. 建立数据仓库逻辑模型

c. 为用户和业务部门提供决策支持

d. 收集业务需求

正确答案是:为用户和业务部门提供决策支

 

按照服务目的不同,数据流通平台可分为( )

选择一项或多项:

a. 企业数据开放平台 

b. 数据交易市场

c. 政府数据开放平台 

d. 数据废气交易市场

e. 数据研发市场

正确答案是:政府数据开放平台, 数据交易市场

 

大数据的价值体现在( )

选择一项或多项:

a. 大数据实现了精准营销

b. 大数据给思维方式带来了冲击

c. 大数据的发力点在于预测

d. 大数据为政策制定提供科学论据

e. 大数据助力智慧城市提升公共服务水平

正确答案是:大数据给思维方式带来了冲击, 大数据为政策制定提供科学论据, 大数据助力智慧城市提升公共服务水平, 大数据实现了精准营销, 大数据的发力点在于预测

 

大数据有哪些价值?

选择一项或多项:

a. 生产数据的价值

b. 描述价值

c. 实时价值

d. 预测价值

e. 用户身份识别

正确答案是:用户身份识别, 描述价值, 实时价值, 预测价值, 生产数据的价值

 

大数据的预测价值体现在:

选择一项或多项:

a. 预测经营趋势

b. 预测热卖品及交易额

c. 预测用户的偏好、流失

d. 评价

正确答案是:预测用户的偏好、流失, 预测热卖品及交易额, 预测经营趋势

 

大数据是描述( )所发生的行为。

选择一项或多项:

a. 现在

b. 过去

c. 实时

d. 未来

正确答案是:现在, 过去

 

传统研究中数据采集的方法包括:

选择一项或多项:

a. 对面访谈

b. 网络监测

c. 线上互动

d. 电话访谈

正确答案是:电话访谈, 对面访谈, 线上互动

 

以下属于能产生大数据,即大数据的源头的有

选择一项或多项:

a. 移动互联网

b. 电子商务

c. 搜索引擎

d. 社交网络

e. 互联网电视

f. 游戏

正确答案是:社交网络, 电子商务, 搜索引擎, 移动互联网, 互联网电视, 游戏

 

数据挖掘常用的工具有

选择一项或多项:

a. Photoshop

b. Clement

c. Gephi

d. R

正确答案是:Gephi, R

 

中心性研究的意义是在于衡量节点的

选择一项或多项:

a. 影响力

b. 约束力

c. 权力

d. 控制力

正确答案是:权力, 控制力, 影响力

 

属于社交网络的表达形式

选择一项或多项:

a. 网论

b. 矩阵论

c. 点阵论

d. 图论

正确答案是:图论, 矩阵论

 

以下哪些指标是衡量大数据应用成功的标准?

选择一项或多项:

a. 风险更低

b. 成本更低

c. 速度更快

d. 质量更高

正确答案是:成本更低, 质量更高, 速度更快, 风险更低

 

我国国内行业之间的信息化发展水平差距比较大,农业信息化属于短板。

选择一项:

正确答案是“对”。

 

吴军博士认为凡是简单、重复的工作,在未来的时代里一定是机器做得比人更好。

选择一项:

正确答案是“对”。

 

20世纪50年代-80年代,第一代信息传输技术只能传输4380路信号。

选择一项:

正确答案是“对”。

 

大数据的价值重在挖掘,而挖掘就是分析。

选择一项:

正确答案是“对”。

 

物联网的处理技术应用于农业上,可以对动物疾病、植物病虫害,通过传感器进行远程诊断。

选择一项:

正确答案是“对”。

 

数据资产型企业产品线的盈利,主要通过提供收费服务来获取

选择一项:

正确答案是“错”。

 

在大数据的荡畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行

选择一项:

正确答案是“错”。

 

第三方数据处理模式表现为:服务商通过软件即服务或平台即服务形式主义为用户提供自己的数据上服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果

选择一项:

正确答案是“错”。

 

在美国的大数据大棋中,"五眼”是指配合美国进行全球监控的包含美国、英国、加拿大兰在内的五个国家

选择一项:

正确答案是“对”。

 

当前,企业提供的大数据解决方案大多基于 Ha doop 开源项目

选择一项:

正确答案是“对”。

 

澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府

选择一项:

正确答案是“错”。

 

大数据可以分析与挖掘前之前人们不知道或者滑注意到的模式, 可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值

选择一项:

正确答案是“对”。

 

大数据最早由麦肯锡在编写《大数据时代》中提出,指不用随机分析法(抽样调查)的捷径,而是采用所有数据进行分析处理。 ()

选择一项:

正确答案是“错”。

 

"大数据”是需要新处理模式才能具有强大的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

选择一项:

正确答案是“对”。

 

大数据的数据类型包括网络日志、音频、视频、图片、地理位置信息等等。 ()

选择一项:

正确答案是“对”。

 

大数据的起始计量单位至少是 MB。()

选择一项:

正确答案是“错”。

  • CodePlayer技术交流群1
  • CodePlayer技术交流群2

0 条评论

撰写评论