如果题目顺序不一样,请用CTRL+F来搜索试题
确定好题一样,再下载
点击支付下载即可看见答案
大数据分析与挖掘技术· 形考任务1
一、单项选择题
1.请问在Python中缺失值通常用( )来记号。
单选题
A.NaN
B.?
C.NA
D.na
2.请问不是缺失值通常用的处理方式是( )。
单选题
A.填补
B.删除
C.插补
D.提取
3.数据整合后( )。
单选题
A.数据量会增加
B.数据量会不变
C.数据的波动性增加
D.数据波动性减小
4.数据离散化可以采用( )方式。
单选题
A.等宽或者等频
B.插补
C.抽样
D.查询
5.下面关于主成分分析说法错误的是( )。
单选题
A.主成分是相互正交(垂直)的
B.主成分捕获了数据差异最大的方向
C.是线性降维方法
D.是非线性降维方法
6.数据经过标准化处理后( )。
单选题
A.数据的波动性将会增加
B.数据的波动单位为1
C.数据的波动性将会减小
D.数据值将被放大
7.白化是指( )。
单选题
A.从相关矩阵出发求解主成分
B.从协方差矩阵出发求解主成分
C.将数据进行标准化
D.剔除数据中的异常值
8.分类模型评价时,通常采用( )损失。
单选题
A.0-1损失
B.指数
C.绝对值
D.平方
9.不是回归模型常采用的评价指标是( )。
单选题
A.MAE
B.MSE
C.R2
D.准确率
10.期望预测误差是指( )。
单选题
A.真实值与预测值在某种损失函数下的平均值
B.真实值与预测值之差
C.真实值与预测值在某种损失函数下的值
D.真实值与预测值之比
二、多项选择题
11.缺失数据的处理方法包括( )。
多选题
A.填补
B.删除
C.插补
D.提取
12.数据抽样后( )。
多选题
A.数据量会增加
B.数据量会减少
C.数据的波动性可能增加
D.数据波动性可能减小
13.下面关于主成分分析说法正确的是( )。
多选题
A.主成分是相互正交(垂直)的
B.主成分捕获了数据差异最大的方向
C.是线性降维方法
D.是非线性降维方法
14.期望预测误差中的方差部分是由( )带来的。
多选题
A.最优解所在空间假设失误
B.数据的随机性
C.估计值自身的波动
D.估计值的平均可能偏离了真实值
15.聚类分析的外部评价指标通常有( )。
多选题
A.DBI
B.兰德指数
C.Jaccard系数
D.FM指数
E.DI
16.分类任务的评价指标通常采用( )。
多选题
A.准确度
B.ROC曲线
C.特效度
D.灵敏度
E.错分成本
三、判断题
17.主成分分析中最大的特征值对应的特征向量也就是是数据差异最大的的方向。( )
判断题
A.对
B.错
18.白化是指将数据进行标准化。( )
判断题
A.对
B.错
19.数据经过标准化处理后,数据的波动性将会减小。( )
判断题
A.对
B.错
20.在Python中缺失值通常用NA来记号。( )
判断题
A.对
B.错
21.主成分是相互正交(垂直)的。( )
判断题
A.对
B.错
22.回归模型评价时,通常采用0-1损失。( )
判断题
A.对
B.错
23.兰德指数是聚类分析的内部评价指标。( )
判断题
A.对
B.错
24.期望预测误差中的偏差部分是由估计值的平均可能偏离了真实值带来的。( )
判断题
A.对
B.错
25.分类模型评价时,通常采用平方损失。( )
判断题
A.对
B.错
26.由于最优解所在空间假设失误将会造成期望预测误差中的方差部分。
判断题
A.对
B.错