AI 产品复杂交互界面的认知负荷如何用行为和生理指标评估？｜百度产品面经解析

60 秒回答模板

我会先明确认知负荷指用户完成任务时需要投入的理解、记忆、决策和纠错成本。评估时不能只问用户“累不累”，要把复杂 AI 交互拆成任务链路，比如理解系统能力、输入需求、阅读结果、追问修正、确认执行。行为指标包括任务完成时间、成功率、错误率、回退和反复修改次数、帮助入口点击、停顿时长、放弃率和路径复杂度。主观指标可以用 NASA-TLX 思路拆成心理负担、时间压力、努力程度、挫败感和自信度，也可以在关键节点做简短评分。生理或眼动指标只能在合适研究场景中作为辅助，比如注视分布、扫视路径、瞳孔变化、心率变异等，但要取得授权并控制干扰。最后通过对照实验比较不同界面版本，在相同任务难度、样本结构和设备环境下分析，结论要落到简化信息层级、减少决策点、优化默认值和错误恢复。

考点 负荷来源

难度 真实面经题

回答目标 量化 AI 界面认知负荷

深入解析

先定义 AI 界面的认知负荷来源

AI 产品的复杂交互常来自能力边界不清、输入要求不明确、结果信息密度高、可选动作太多、错误反馈难理解和用户需要判断答案可信度。回答时要先把负荷来源拆出来，避免泛泛说界面要简单。

行为指标看用户完成任务的成本

行为层可以记录任务完成率、完成时间、错误率、回退次数、重复输入次数、停顿时长、帮助入口点击、放弃率和路径长度。复杂 AI 交互还要看用户是否反复改 prompt、是否不知道下一步做什么、是否因为结果太多而无法决策。

主观量表补足内在感受

认知负荷有很多是用户内在感受，行为日志不一定能完全看出。可以用 NASA-TLX 类似思路，衡量心理负担、时间压力、努力程度、挫败感、自信度和可控感。量表最好绑定具体任务后填写，而不是让用户事后笼统回忆。

生理指标只能作为辅助证据

眼动、瞳孔、心率变异、皮电等指标可以辅助判断注意分散、压力或视觉搜索成本，但它们对设备、场景和个体差异很敏感。使用时要获得授权、控制环境、保护隐私，并和任务行为及主观评分一起解释，不能单独下结论。

实验结论要回到界面改造

评估最好采用对照实验或可用性测试，保持任务、样本和环境一致，比较不同界面方案。分析时按新手和熟练用户、任务复杂度、入口路径分层。最终建议应落到信息层级、默认值、步骤拆分、反馈文案、错误恢复和确认机制。

易错点

只回答满意度或留存，没有评估认知负荷本身。
只看任务耗时，不看错误、回退、停顿、放弃和主观负担。
把眼动或生理指标当成万能答案，忽略授权、噪声和解释边界。
没有控制任务难度和用户结构，导致版本对比不可信。
评估结果没有落到界面信息层级和交互流程优化。

面试官追问

认知负荷高一定意味着界面不好吗？

不一定。复杂任务本身可能需要较高投入，关键是区分必要负荷和界面造成的额外负荷，后者才是优化重点。

如何发现用户不知道下一步该做什么？

可以看长时间停顿、鼠标或视线游移、反复返回、帮助点击、放弃率，也可以在可用性测试中让用户边操作边表达思路。

为什么生理指标不能单独作为结论？

它们受个体差异、设备、环境和情绪影响很大，只能和任务表现、主观评分、访谈解释一起使用。

新手和熟练用户需要分开看吗？

需要。新手负担通常来自理解能力和入口，熟练用户更在意效率、控制和批量操作。混在一起会掩盖真实问题。