单选题 自然语言处理工作中,在自动建构关键词(非控制字汇)时,经常采用的方法是?
A、Controlled Vocabulary (控制字汇
B、Inversion of Terms (逐项反转)
C、Inverse Document Frequency (IDF)
D、Full-Text Scanning
单选题 以下哪个选项是分割式聚类算法?
A、K-Means
B、Centroid Method
C、Ward's Method
D、以上皆非
单选题 自然语言处理工作中,在关键词提取的时候,有一类叫“Stop Words”的词语,其含义是什么?
单选题 在Transfrmer架构中,以下哪个组件负责捕获输入序列中的位置信息?
A、Multi-headAttentin
B、Feed-frwardNeuralNetwrk
C、PsitinalEncding
D、LayerNrmalizatin
单选题 监督特征学习中,被标记过的数据被当做特征用来学习,以下不属于监督特征学习的是
A、神经网络
B、多层感知器
C、监督字典学习
D、矩阵分解
单选题 作为一个重要的由大语言模型驱动的框架,LangChain框架中的“代理(agents)”是指什么?
A、使模型能够自动执行任务
B、使模型能够自我修复错误
C、使模型能够自动更新
D、使模型能够自动回答问题
单选题 关于Skip-Gram模型,以下说法正确的是?
A、属于词袋模型的一种
B、模型的目标是最大化用当前的词预测上下文的词的生成概率
C、模型的目标是最大化通过上下文的词预测当前词生成概率
D、属于词集模型的一种
单选题 序列模式挖掘(sequence pattern mining ) 是指挖掘相对时间或其他模式出现频率高的模式,!典型的应用还是限于离散型的序列。序列模式中关于序列的说法不正确的是??
A、
一般地,序列是元素 (element) 的有序列表
D、
序列模式的讨论主要考虑时间事件,不可以将它推广到事件具有空间次序的情况