大数据分析与预测技术(山东财经大学)中国大学mooc慕课答案2024版100分完整版

仿瓮疾逢淀僧韶努跋啥堪题彪

对应课程:点击查看
起止时间:2020-07-27到2020-08-17
更新状态:已完结

第一章 理解大数据 第一章 理解大数据单元测试

1、 有关大数据分析与预测的过程认识正确的是?

A:大数据分析与预测一般需要人的参与,只要把数据输入合适的算法就可以得到有用的结果。
B:A零售企业的客户行为数据分析得到的规律也可以直接用于B零售企业。
C:大数据分析与预测得到的结果需要通过检验样本的测试,甚至需要在现实中实验才能投入使用。
D:大数据分析与预测的问题一般都是用户给定的,因此不需要与用户交流和调研。
答案: 大数据分析与预测得到的结果需要通过检验样本的测试,甚至需要在现实中实验才能投入使用。

2、 有关数据质量的认识正确的是?

A:数据质量一般可以由机器自动完成,不需要数据分析人员参与。
B:数据预处理就是删除有问题的数据。
C:各种数据质量问题对机器学习算法的影响很大,因此需要充分预处理才能进入建模阶段。
D:有些机器学习算法具有比较强的抗噪型,因此不需要预处理也能得到有用的规律。
答案: 各种数据质量问题对机器学习算法的影响很大,因此需要充分预处理才能进入建模阶段。

3、 如果以药品B来代替药品A的使用,那么这个病人生存的几率有多大?这种分析属于:

A:描述性分析
B:诊断性分析
C:预测性分析
D:规范性分析
答案: 预测性分析

4、 组织通过销售数据或洞察以创造新的收入来源,这属于大数据应用成熟度的哪一个阶段?

A:业务监控
B:业务优化
C:业务转型
D:数据货币化
E:业务洞察
答案: 数据货币化

5、 根据患者的视网膜图像等相关医疗信息,使用机器学习算法进行建模,预测患者患糖尿病的可能性。这个任务需要以下使用哪一类机器学习算法?

A:监督学习
B:无监督学习
C:统计分析
D:诊断性分析
答案: 监督学习

6、 以下哪些情景可以使用大数据分析与预测建模技术?

A:统计某零售超市一个月内哪类牛奶的销量最大
B:保险公司的骗保分析
C:预测电商网站某商品未来的销售量
D:预测某移动运营商客户转移到竞争对手的可能性
答案: 保险公司的骗保分析;
预测电商网站某商品未来的销售量;
预测某移动运营商客户转移到竞争对手的可能性

7、 下面有关机器学习正确的说法是?

A:机器学习可以从有限的样本数据中得到有用的规律,并能对新样本进行一定的泛化预测。
B:机器学习就是简单的统计分析。
C:每种机器学习算法都有一定的使用范围,只能处理某类数据和问题。
D:在机器学习过程中,需要人的经验指导数据的选择、噪声的消除、合适算法的选择以及调参等工作。
答案: 机器学习可以从有限的样本数据中得到有用的规律,并能对新样本进行一定的泛化预测。;
每种机器学习算法都有一定的使用范围,只能处理某类数据和问题。;
在机器学习过程中,需要人的经验指导数据的选择、噪声的消除、合适算法的选择以及调参等工作。

8、 大数据分析的预测建模任务主要包括哪几大类问题?

A:关联分析
B:回归
C:模式发现
D:分类
答案: 关联分析;
模式发现;
分类

9、 下列哪些分析需要机器学习?

A:预测移动运营商用户未来使用的网络流量
B:比较不同移动运营商用户对漫游业务的使用量
C:寻找移动运营商用户对某类套餐使用的潜在客户
D:统计移动运营商的用户在某段时间对短信的使用数量
答案: 预测移动运营商用户未来使用的网络流量;
寻找移动运营商用户对某类套餐使用的潜在客户

10、 NoSQL数据库作为非关系型数据库,只能够用来存储非结构数据。

A:正确
B:错误
答案: 错误

11、 构建模型后使用标准指标来评估模型性能,确定其是否符合业务目标,成为大数据的模型评估。

A:正确
B:错误
答案: 正确

12、 关联规则的评价标准有准确性,精确度和召回率等。

A:正确
B:错误
答案: 错误

第二章 大数据预处理 第二章 大数据预处理单元测试

1、 将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?

A:频繁模式挖掘
B:分类和预测
C:数据预处理
D:数据流挖掘
答案: 数据预处理

2、 下面哪个步骤不属于数据预处理的过程?

A:数据清洗
B:数据转换
C:数据归约
D:分类和预测
答案: 分类和预测

3、 下面哪种不属于数据预处理的方法?

A:变量代换
B:离散化
C:聚集
D:估计遗漏值
答案: 估计遗漏值

4、 以下哪种方法不属于特征选择的标准方法

A:嵌入
B:过滤
C:包装
D:抽样
答案: 抽样

5、 下面不属于创建新属性的相关方法的是

A:特征提取
B:特征修改
C:映射数据到新的空间
D:特征构造
答案: 特征修改

6、 数据清洗包括以下哪几个方面?

A:缺失数据处理方法
B:噪声数据平滑技术
C:时间相关数据的处理
D:按标准差进行的标准化
答案: 缺失数据处理方法;
噪声数据平滑技术;
时间相关数据的处理

7、 以下哪几个是数据归约的策略?

A:离散化和概念分层产生
B:数值归约
C:数据压缩
D:维度归约
E:数据立方体聚集
答案: 离散化和概念分层产生;
数值归约;
数据压缩;
维度归约;
数据立方体聚集

8、 以下哪些是数据离散化技术?

A:ChiMerge技术
B:基于熵的离散化
C:分箱技术
D:饼图分析
答案: ChiMerge技术;
基于熵的离散化;
分箱技术

9、 特征选择的目标有哪些?

A:提高数据挖掘模型的性能
B:提供更快、性价比更高的学习过程
C:更好地理解生成数据的基本过程
D:挖掘多个抽象层上的数据
答案: 提高数据挖掘模型的性能;
提供更快、性价比更高的学习过程;
更好地理解生成数据的基本过程

       

如需购买完整答案,请点击下方红字:

点击这里,购买完整答案

获取更多中国大学mooc慕课答案,请点击这里,进入mooc.mengmianren.com

犯稼管康哩拢圭虹躺娩导啊襄