公司岗位题库

快手 C/C++面经

6 道题 14 个标签 6 条出现记录

C/C++ 工程师相关题目

大模型后训练投入成本如何决策,怎样用效果收益、训练成本、推理成本和风险指标做取舍?

这题考的是大模型后训练的工程 ROI 判断。好答案不能只说效果好就继续训,而要把收益、训练成本、推理成本、数据和安全风险放到同一张决策表里,用离线评测、线上指标、成本模型和风险阈值决定做 SFT、DPO/RL、数据修复、提示词优化、RAG、蒸馏还是不做。