单选题 下列关于数据标准化的说法中,不正确的是()
A、Z-Score标准化适用于特征最大值和最小值未知,数据较分散的情况
B、聚类算法要求数据集无量纲化
C、Logistic标准化函数σ(x)满足σ(0)=1
D、Min-Max标准化易受离群值影响
单选题 熵是为消除不确定性所需要获得的信息量,投掷均匀正六面体骰子的熵是:
A、1比特
B、2.6比特
C、3.2比特
D、3.8比特
单选题 ()的主要目的是提升数据质量,将数据形态更加符合某一算法需求,进而提升数据计算的效果和降低其复杂度。
A、数据加工
B、数据分析
C、数据挖掘
D、数据处理
单选题 建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?
A、根据内容检索
B、建模描述
C、预测建模
D、寻找模式和规则
单选题 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归直线方程为y=7.19x+73.93,据此可以预测这个孩子10岁时的身高,则正确的叙述是()
A、身高一定是145.83cm
B、身高超过146.00cm
C、身高低于145.00cm
D、身高在145.83cm左右
单选题 关于数据清洗,不正确的说法是()
A、单数据源,主键取值不能重复
B、多数据源会存在数据重复,单位不一致的问题
C、连续型数据不存在冗余问题
D、缺失值可以采用删除和填补等方法处理
单选题 下列哪个不是专门用于可视化时间空间数据的技术:
单选题 下列关于特征编码的叙述中,不正确的是()
A、特征编码是将非数值型特征转换成数值型特征的方法
B、数字编码与特征的排序无关
C、One-Hot编码中,原始特征有n种取值,转换后就会产生n列新特征
D、哑变量编码解决了One-Hot编码中存在线性关系的问题