单选题 在 k 折交叉验证中,随着 K 值的增大,以下说法正确的是?( )

A、 模型训练时间减少
B、 模型评估结果的方差增大
C、 每个训练集包含的样本数量减少
D、 模型评估的偏差增大
下载APP答题
由4l***sj提供 分享 举报 纠错

相关试题

单选题 以下关于朴素贝叶斯算法的描述,正确的是?( )

A、 朴素贝叶斯假设特征之间存在强依赖关系
B、 朴素贝叶斯在训练时需要估计每个特征的条件概率分布
C、 当训练数据量较少时,朴素贝叶斯算法性能一定比决策树差
D、 朴素贝叶斯只能处理二分类问题

单选题 在 K-means 聚类算法中,下列说法错误的是( )

A、 算法通过不断更新聚类中心,使样本到所属聚类中心的距离平方和最小
B、 若初始聚类中心选择不当,算法可能收敛到局部最优解
C、 当数据集中存在噪声点和离群点时,对聚类结果没有影响
D、 算法的计算复杂度与样本数量和迭代次数相关,适合处理中小规模数据集

单选题 在使用朴素贝叶斯进行文本分类时,若采用多项式模型处理单词特征,以下说法正确的是?( )

A、 每个单词的出现次数被视为二值特征(出现或不出现)
B、 特征向量维度等于训练集中所有文档的单词总数
C、 计算条件概率时,会考虑单词在文档中出现的频率
D、 当某个单词在训练样本中未出现时,其条件概率直接设为

填空题 决策树中,ID3 算法使用(   )作为分裂标准,C4.5 算法改用(   ),CART 算法则采用(   )。

填空题 决策树的每个节点表示一个(   )的测试,每个分支表示一个(   )的结果,每个叶节点表示一个(   )或回归结果。

填空题 均方误差是(   )和(   )之差的平方和的平方值,(均方误差 )越小,说明模型的预测效果越好。

填空题 数据挖掘的四大主要任务是(   )、(   )、(   )和异常检测。

单选题 关于支持向量机( ),以下说法正确的是( )

A、 SVM寻找的最优超平面是使所有训练样本到超平面的平均距离最大的平面
B、 对于线性不可分的数据,SVM 通过增加多项式特征来进行分类
C、 软间隔 SVM 中,惩罚参数C值越大,模型对误分类样本的惩罚越重,模型越容易过拟合
D、 核函数的作用是将数据从高维空间映射到低维空间,便于寻找最优超平面