使用当前浏览器访问考试宝,无法享受最佳体验,推荐使用 Chrome 浏览器进行访问。
相关试题
单选题 关于语言模型,“天气预报:大风降温,我明天要____”例子说明什么?
单选题 在大语言模型的训练过程中,预训练之后的第一步(SFT)是做什么?
单选题 幻觉是一把双刃剑,其正面作用是什么?
单选题 “幻觉问题”指的是什么?
单选题 “鹦鹉学舌”和“熟读唐诗三百首”来比喻预训练,其核心意思是?
单选题 用谓词逻辑表示“Tom的所有同学都喜欢他”,下列公式正确的是?
单选题 第三步(PPO/GRPO)中,如何优化模型使其与人类偏好对齐?
单选题 第二步(奖励建模)中,标注人员需要做什么工作?