60 秒回答模板

我会先明确认知负荷指用户完成任务时需要投入的理解、记忆、决策和纠错成本。评估时不能只问用户“累不累”,要把复杂 AI 交互拆成任务链路,比如理解系统能力、输入需求、阅读结果、追问修正、确认执行。行为指标包括任务完成时间、成功率、错误率、回退和反复修改次数、帮助入口点击、停顿时长、放弃率和路径复杂度。主观指标可以用 NASA-TLX 思路拆成心理负担、时间压力、努力程度、挫败感和自信度,也可以在关键节点做简短评分。生理或眼动指标只能在合适研究场景中作为辅助,比如注视分布、扫视路径、瞳孔变化、心率变异等,但要取得授权并控制干扰。最后通过对照实验比较不同界面版本,在相同任务难度、样本结构和设备环境下分析,结论要落到简化信息层级、减少决策点、优化默认值和错误恢复。

考点 负荷来源
难度 真实面经题
回答目标 量化 AI 界面认知负荷

深入解析

01

先定义 AI 界面的认知负荷来源

AI 产品的复杂交互常来自能力边界不清、输入要求不明确、结果信息密度高、可选动作太多、错误反馈难理解和用户需要判断答案可信度。回答时要先把负荷来源拆出来,避免泛泛说界面要简单。

02

行为指标看用户完成任务的成本

行为层可以记录任务完成率、完成时间、错误率、回退次数、重复输入次数、停顿时长、帮助入口点击、放弃率和路径长度。复杂 AI 交互还要看用户是否反复改 prompt、是否不知道下一步做什么、是否因为结果太多而无法决策。

03

主观量表补足内在感受

认知负荷有很多是用户内在感受,行为日志不一定能完全看出。可以用 NASA-TLX 类似思路,衡量心理负担、时间压力、努力程度、挫败感、自信度和可控感。量表最好绑定具体任务后填写,而不是让用户事后笼统回忆。

04

生理指标只能作为辅助证据

眼动、瞳孔、心率变异、皮电等指标可以辅助判断注意分散、压力或视觉搜索成本,但它们对设备、场景和个体差异很敏感。使用时要获得授权、控制环境、保护隐私,并和任务行为及主观评分一起解释,不能单独下结论。

05

实验结论要回到界面改造

评估最好采用对照实验或可用性测试,保持任务、样本和环境一致,比较不同界面方案。分析时按新手和熟练用户、任务复杂度、入口路径分层。最终建议应落到信息层级、默认值、步骤拆分、反馈文案、错误恢复和确认机制。

易错点

  • 只回答满意度或留存,没有评估认知负荷本身。
  • 只看任务耗时,不看错误、回退、停顿、放弃和主观负担。
  • 把眼动或生理指标当成万能答案,忽略授权、噪声和解释边界。
  • 没有控制任务难度和用户结构,导致版本对比不可信。
  • 评估结果没有落到界面信息层级和交互流程优化。

面试官追问

认知负荷高一定意味着界面不好吗?

不一定。复杂任务本身可能需要较高投入,关键是区分必要负荷和界面造成的额外负荷,后者才是优化重点。

如何发现用户不知道下一步该做什么?

可以看长时间停顿、鼠标或视线游移、反复返回、帮助点击、放弃率,也可以在可用性测试中让用户边操作边表达思路。

为什么生理指标不能单独作为结论?

它们受个体差异、设备、环境和情绪影响很大,只能和任务表现、主观评分、访谈解释一起使用。

新手和熟练用户需要分开看吗?

需要。新手负担通常来自理解能力和入口,熟练用户更在意效率、控制和批量操作。混在一起会掩盖真实问题。