客服外呼质检分析报告 · 2026.Q1
AI外呼挽留ETC注销用户
通话数据综合评估报告
基于 107 条通话记录 · 大模型意图识别与对话能力评分
2026.03.11 — 03.18
107 条
V1.1
01 核心数据总览
总外呼通话量
107
覆盖 5 个工作日
平均通话时长
42
中位数 39 秒 · 最长 278 秒
用户明确拒绝率
13 %
14 条 / 107 条
有意向转化率
0.9 %
仅 1 条明确表示有意向
各日外呼量与平均通话时长
5 个测试日的外呼量分布及单日平均通话时长对比
外呼量(条)
03-11
14
03-12
28
03-13
18
03-17
27
03-18
20
平均通话时长(秒)
03-11
51.6
03-12
34.6
03-13
53.6 ▲
03-17
37.4
03-18
42.2
数据洞察:平均通话时长在各日之间呈现非线性波动,并无单向趋势。3月13日均时最高(53.6秒),与当日负面情绪通话集中(3条,占当日16.7%)密切相关,情绪化沟通拉高了整体均值;3月12日均时最低(34.6秒),该日「留言/通话助手」占比高(6条),短时无效通话拉低均值。整体外呼质量主要受当日用户样本构成影响,而非系统性改善或退化。
各日用户意图分布(堆叠构成)
每日通话按用户意图分类,颜色反映意图构成比例
弱意向/敷衍 留言/通话助手 明确拒绝 直接挂断 负面情绪 有意向
03-11
14
03-12
28
03-13
18
03-17
27
03-18
20
关键观察:3月12日是唯一出现「有意向」用户的日期(1条),同日也是明确拒绝最多的一天(7条),反映该批次用户态度分化最为明显。3月13日负面情绪集中(3条,占当日16.7%),是整个测试周期中情绪风险最高的一天,该日均时最长(53.6秒)亦印证了复杂情绪对话更耗时。3月17日直接挂断偏多(5条,18.5%),该日弱意向比例也最高(63%),整体用户配合度较低。

02 用户意图分布分析
用户意图分类占比
107 条通话按大模型识别的用户意图分类
弱意向/敷衍
55 51.4%
留言/通话助手
22 20.6%
明确拒绝
14 13.1%
直接挂断
11 10.3%
负面情绪
4 3.7%
有意向
1 0.9%
各意图类型平均通话时长(秒)
时长越长反映对话深度越高,不代表挽留成功
负面情绪
97.0
明确拒绝
51.8
留言/助手
42.8
弱意向/敷衍
37.9
直接挂断
32.5
有意向
12.0
用户意图类型详解与挽留策略评估
意图类型通话量占比均时(秒)挽留难度AI表现
弱意向 / 敷衍5551.4%37.9中等部分应对
留言 / 通话助手2220.6%42.8识别不足
明确拒绝1413.1%51.8多次仍强推
直接挂断1110.3%32.5极高未有效识别
负面情绪43.7%97.0极高处理能力弱
有意向10.9%12.0表现良好

03 AI 对话能力综合评估
52
/ 100 分
【待改进】
AI外呼整体能力评级:C 级(及格线以下)
综合意图理解、话术执行、拒绝处理、情绪感知、对话灵活性五大维度
意图识别能力
65
话术执行质量
60
拒绝应对能力
40
情绪感知与共情
35
对话灵活性
48
AI对话能力问题关键词频次统计
基于大模型对 107 条通话的质检评语提取,反映核心能力缺陷分布
自说自话
49次
强行推销
35次
重复/生硬
33次
答非所问
22次
理解准确
22次
逻辑自然
8次
尊重用户
5次
核心问题:「自说自话」出现频率最高(49次,占比45.8%),说明 AI 普遍存在无视用户真实反馈、机械执行话术的问题,这是外呼挽留场景中最致命的缺陷。
49 / 107
🔴 自说自话(最高频缺陷)
AI 在用户明确表达拒绝、挂断或无回应时,仍持续输出营销话术,完全忽视用户的实际反馈信号,导致用户体验极差,甚至引发投诉。
35 / 107
🔴 强行推销(用户反感)
用户已表达「不需要」「我已经办了」「帮我注销吧」等明确拒绝后,AI 仍多次重复介绍优惠内容,不仅未能挽留,反而加深负面印象。
33 / 107
🟡 话术重复生硬(体验差)
AI 多轮对话中重复使用相同的「129元」「识别更灵敏」等固定句式,缺乏动态调整能力,用户明显感受到「机器感」,降低沟通信任度。
22 / 107
🟡 答非所问(上下文理解弱)
当用户提出具体问题(如「哪个省的ETC?」「充电口坏了怎么办?」)时,AI 未能准确提取关键信息,而是将话题绕回到优惠方案介绍,逻辑断层明显。
22 / 107
🔵 意图理解基本到位(优势)
部分通话中 AI 能准确理解用户意图,在用户已办理其他ETC、或已决定注销等场景中,能较快识别并适时终止推销,体现了一定的基础对话能力。
5 / 107
🟢 少量通话表现良好(标杆)
极少数通话中,AI 能尊重用户选择、不强行推销、自然收尾,反映其在「低难度拒绝场景」下具备正确执行能力,可作为优化基准参考。

04 典型通话场景分析
以下选取五种具有代表性的通话场景进行对话行为深度分析,覆盖正负两类极端表现,旨在为优化方向提供具体依据。
场景类型用户意图通话时长AI核心表现评价
设备故障投诉型
ETC损坏,充电口故障
负面情绪 278 秒 捕捉部分需求但多次重复推销,用户表达困惑时仍强推,未有效化解"苏通卡贵、售后差"等核心疑虑 较差
已办理其他渠道型
已换新ETC设备
明确拒绝 78 秒 识别用户已办理其他设备,未强行推销,及时终止营销并礼貌收尾,无生硬重复 良好
转告机主型
非车主本人接听
弱意向 160 秒 回应紧扣问题,但多次重复优惠信息,未察觉用户"转告机主"的意图变化,未做跟进策略调整 一般
通话助手拦截型
发送请按1…
留言助手 69 秒 完全未识别接通的是通话助手,将录音提示词当作用户回应,继续执行推销话术,属严重识别失误 严重缺陷
语义混乱干扰型
借钱/箱数等无关内容
弱意向 187 秒 上下文理解极差,多次答非所问,用户聊无关话题时 AI 仍机械绕回 ETC 推销,逻辑断裂严重 较差

05 AI 外呼工具专业能力结论
✅ 能力优势
  • 开场话术结构清晰,场景切入准确
  • 基础意图识别(明确拒绝)有效
  • 在低复杂度场景能自然收尾
  • 产品利益点表达流畅、逻辑完整
❌ 核心缺陷
  • 无法识别通话助手/留言信号
  • 拒绝后仍强推,不尊重意愿
  • 情绪感知与共情能力极弱
  • 上下文动态理解不足
⚠️ 待提升项
  • 话术多样性不足,重复率高
  • 打断与让步时机把握不准
  • 无法处理偏离主题对话
  • 货车ETC等细分场景适配弱
综合结论:当前 AI 外呼工具处于「基础可用、远未成熟」阶段。其在标准化流程的话术执行上具备一定能力,但在真实外呼场景中最关键的「拒绝处理」「情绪识别」「场景自适应」三项核心能力上均存在明显短板。特别是在 20.6% 的通话(22条)中,AI 无法区分真人与通话助手,属于基础识别错误,需优先修复。整体来看,该工具目前适合用于简单挽留场景,不适合独立承担高价值、高情绪复杂度用户的外呼任务。

06 优化建议与行动计划
01
增加通话助手 / 留言系统识别能力
当检测到「发送请按1」「我正在开车」「留言后请挂断」等典型留言系统关键词时,AI 应立即识别并终止推销,避免向无效信道浪费通话资源(当前造成20.6%通话浪费)。
紧急
02
建立「拒绝后停止推销」的硬性规则
用户明确说出「不需要」「不换」「帮我注销」等表述后,AI 最多再补充一句关键利益点,若二次拒绝则应优雅收尾。严禁三次以上重复相同优惠内容,降低用户反感风险。
紧急
03
提升情绪感知能力,负面情绪触发安抚话术
当用户出现抱怨、质疑、提高音量、使用负面词汇等信号时,AI 应切换至「先安抚、再说明」模式,避免在用户情绪化时继续推销。可设计「情绪冷却期」逻辑分支。
高优先
04
丰富话术库,增加上下文动态应对能力
针对用户提出的具体问题(如设备型号、省份归属、手续费标准),AI 应能准确提取并给予对应解答,而非强行跳回优惠介绍。建议构建「问题-应答」知识库,覆盖高频疑问。
中优先
05
增加货车 ETC 细分场景适配话术
货车用户月通行费高、对手续费敏感,不适合使用与私家车相同的129元优惠话术。建议针对货车用户设计专属话术脚本,突出长期使用成本优势,规避手续费敏感点。
中优先
06
建立 AB 测试机制,持续迭代话术效果
建议按日/批次追踪「有意向率」「明确拒绝率」「负面情绪率」三项核心指标,每周进行话术版本迭代,通过对照实验验证优化效果,形成数据驱动的持续改进闭环。
常规