下载客户端

防患未然—— 基于人工智能的电话反欺诈行动指南

2020-11-18 16:10

来源：澎湃新闻·澎湃号·湃客

一通电话、一条短信，一个链接，一不小心，钱可能就没了; 欠费了、中奖了、退税了、口罩来了，电信诈骗的骗术层出不穷。

尤其是在 2020 年上半年，受疫情影响，就业压力加大，有的资金短缺的用户，被贷款诈骗;有的找不到工作的用户，被兼职刷单诈骗;一些经常网购的用户，被冒充客服和虚假购物诈骗;一些有投资意愿的用户，被引诱参与虚假投资理财和网络赌博;冒充公检法实施的诈骗案件也时有发生。

公安部通报，2019 年全国共破获电信网络诈骗案件 20 万起、抓获犯罪嫌疑人 16.3 万人，同比分别上升 52.7%、123.3%。2020 年上半年全国共破获电信网络诈骗案件 10.1 万起，抓获犯罪嫌疑人 9.2 万名，同比分别上升73.7%、78.4%。

诈骗电话的治理已成为电信运营商不可忽视的工作重点。虽然三大运营商也都进行了诈骗活动识别的探索，但因其复杂性，仍是电信行业的顽疾之一:

诈骗内容花样繁多，严重影响用户满意度。疫情期间“新热点 +旧诈骗手法”的出现也告诉我们，与诈骗内容的对抗将是一场持久而关键的战斗。如何在覆盖现有诈骗方式的基础上，利用数据与 AI 技术的力量，与时俱进，及时有效地识别新的诈骗内容 ?

现有的分析手段效果不佳。传统的黑名单模式的时效性和准确率不足，且需要持续运维投入，难以及时有效地识别并干预电话诈骗行为。如何加大对电话渠道的监控，实现联动分析，及早识别并预警劝阻?

整体解决方案不清晰，不知从何入手。反欺诈领域的技术能力已初步形成，如何综合成本、反欺诈准确率、法律风险、处理能效等关键要素，形成整体的解决方案?

2020 年 8 月 19 日工信部印发了《关于运用大数据推进防范治理电信网络诈骗长效机制建设工作方案》。《方案》明确，按照“整体推进、分步实施、数据驱动、技管结合、务求实效” 的总体思路，坚持数据融合、数据驱动和数据共享，加快推进大数据反诈长效机制建设。

电信运营商应充分利用手中的通信渠道和通信内容等数据资源，结合 AI 分析手段，建立和完善电信反欺诈预警系统，不断提升精准预警尽早干预的能力，以最大程度降低用户损失，提升用户满意度。

诈骗电话识别与干预

人工智能在反欺诈领域的技术能力已经初步形成并在生产应用中不断迭代更新。在电话反欺诈建设领域，需要考虑以下四点:

综合成本:包括软件成本(反欺诈平台)、硬件成本等

反欺诈准确率:要求在尽可能抓住坏人的同时尽量少的冤枉

法律风险:在法律支持的数据、操作范围内进行处理，不触犯红线

处理能效:满足一定量的并发能力支撑以及平台横向扩展要求以及满足单次判断处理时间要求

然而，目前不存在满足综合成本、反欺诈准确率、法律风险、处理能效四个关键要素的完美解决方案。业界方案普遍需要在关键要素中取舍平衡。

目前主流方案分为三种:离线反哺方案、在线实时方案、离线准实时方案(见图 1)。

图1三种主流反欺诈方案

这三种主流的反欺诈方案，各有优劣，电信运营商可以根据自身的需求进行选择:

在与电信运营商的合作过程中，我们发现离线方案反应较慢，无法及时止损，事后欺诈分子转移较快;在线实时反欺诈可形成电信服务产品，供个人进行开通选择，避免法律风险。鉴于以上原因，电信运营商纷纷开始实时电话反欺诈建设。

欺诈话术套路分析与洞察

在电信反欺诈领域，与短信欺诈、网络欺诈相比，电话欺诈的核心在于复杂的欺诈话术套路能迷惑人心。所谓的欺诈话术套路，是指欺诈分子在电话中首先说了什么方面的内容，然后又说了什么方面的内容，接着又采取了什么样的话术技巧迷惑对方，直至最后成功拿到对方关键信息。正是套路的复杂性，容易让人上当受骗。

实际上，电话反欺诈并不是一个新鲜的课题，一些电信运营商在过去多年通过敏感关键词列表(如“我是公安局的”) 等方式也进行过尝试。

根据多年反欺诈的经验，电信欺诈分子常以团伙的形式出现，欺诈分子集中培训欺诈话术套路。故而，欺诈分子可在同一个欺诈话术套路下通过变换关键词等绕开此反诈机制。同时，因为语音转写质量的问题，往往个别错别字的出现，也会造成此反诈机制失效。电信运营商通过人力维护更新反诈关键词列表费事费力且反应滞后。

因此，对频繁出现的欺诈套路进行挖掘，不但能够揭露隐藏的欺诈团伙，同时，将这些典型的欺诈套路加入反欺诈机制中，也可以增加欺诈分子未来欺诈的难度。

除了已发现的复杂欺诈套路外，发现欺诈分子也在原有的话术套路上迭代更新使套路更复杂。通过对欺诈套路的分析，还可以提前洞察未来欺诈套路的可能变化，提前预防。

电话反欺诈行动指南

1. 明确反欺诈建设方向

在电话欺诈高发的省份，建议电信运营商与公安、通信管理局充分做好反欺诈建设的沟通。根据公安和通信管理局的要求进行建设。同时，对反欺诈模型的要求应遵循“尽量在不冤枉好人的情况下抓住坏人“这一原则，减少对正常电话的干扰。

若公安选择电话欺诈监测但事后核实查证再采取行动，对反欺诈模型的要求应遵循“可以暂时冤枉一批好人，但应尽量覆盖更多的坏人”的原则。此原则保证了在事后的检查证核实中，“好人”会被排除掉，而“坏人”可以一网打尽。

另外，欺诈分子往往不会只尝试一次就停止欺诈行为。而且电信欺诈往往以团伙的形式存在。离线的大数据结合人工智能可以对实时反欺诈起到很好的反哺作用。通过电话主叫被叫大数据记录，可以构建人际关联网络，挖掘出欺诈分子、骚扰者等。

2. 保护个人隐私是应尽的义务和责任

反欺诈的建设，往往绕不开对个人隐私保护这一大前提。保护个人隐私不但要满足监管机构的要求，而且，从架构设计的角度，也不允许设计任何数据库来留存数据。当通话内容经过 AI 模型判断是否欺诈后就会自动丢失，不会保留下来，从而实现对个人隐私的保护。技术测试成熟后，反欺诈业务可作为一项订购业务，由用户自己进行选择是否打开反欺诈功能。

3. 高质量的语音转写是高效识别欺诈的必要条件之一

当前，主流的语音转写提供商多是在极其理想的环境(无噪声、标准普通话等)下测试语音转写质量。但这样的假设往往不现实。当在真实外部世界中，并且有较严重口音的情况下，语音转写质量就会大打折扣，甚至出现转写出来的绝大多数内容都是错别字，人类无法理解。

在当地口音较严重的省份，语音转写提供商应根据运营商的要求，在真实的环境中完成测试，优化语音转写质量。甚至在有的省份，各地级市各区县也有不同的方言口音。即使在同一个省，也因根据地区的不同，进行语音转写质量的优化工作。

4. 丰富的反欺诈模型构建经验是项目成功的必要保证

在电话反欺诈领域，往往极少量欺诈样本隐藏在海量普通的通话样本中，利用人工逐条听录音并不现实，这就对建模效果造成了很大的挑战。对此，数据科学家应结合自然语言处理手段与外部公开数据，将那些极少量的欺诈样本挖掘出来，形成建模基础。

另外，数据科学家应对电信反欺诈有深刻的理解和认识，利用 AI 技术更好地识别出欺诈分子的复杂欺诈套路。所谓“魔高一尺，道高一丈”，欺诈与反欺诈永远是在相互博弈的过程中进化。故而，反欺诈系统应形成定期迭代更新机制，能够识别最新的欺诈套路。

来源:IBM 商业价值研究院

报告为公开版，版权归原创作者所有，如有侵权请联系删除。

原标题：《防患未然—— 基于人工智能的电话反欺诈行动指南》

阅读原文

特别声明

本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。