企业电话呼叫方案

智能AI+电话语音平台建设方案


系统现状
 
随着人工智能技术的不断进步,及近年来保险、证券等行业的飞速发展,传统金融服务模式已经难以全方位满足用户需求。为更好的满足用户多样化的金融服务需求,提升用户体验,实现降本增效,引入智能语音交互技术已成为行业趋势。用户可以使用语音进行交互,并获得其所需的服务结果。
 
AI语音即为人和人工智能进行语音的交互,通过对话的方式获取信息,和机器进行交互。ai语音通过以下四个技术模块实现:
1、自动语音识别(AutomaticSpeechRecognition,ASR)
2、自然语言理解(NaturalLanguageUnderstanding,NLU)
3、自然语言生成(NaturalLanguageGeneration,NLG)
4、文字转语音(TexttoSpeech,TTS)。
 
为打造智能语音交互新功能,实现机器“听懂”人类语言,将语音信号转变为相应文本,需引入智能语音技术与自身业务及智能服务相结合,建立智能语音平台。
 
AI+语音平台
 
建设目标

AI+语音平台整体分为平台接入层、平台能力层和平台服务层,其中平台接入层和平台服务层面向客户提供能力和服务的整体集成解决方案。AI+语音平台可提供统一的AI能力,实现共享和按需配置,以及产品应用和能力的解耦,方便部署和灵活对接。同时,智能语音技术平台统一建设和规划,可以起到统一优化资源、统一发布服务、统一进行业务接入的益处,做到一次建设,多处受益,构建新型的服务能力平台。结合实际业务状况,重点提供语音识别、语音合成核心能力。
 
建设内容整体包括AI+语音平台软件的搭建部署,平台能支撑客户系统在ASR语音识别和TTS语音合成等方面的需要。以云服务的方式为应用终端提供语音服务,通过集成标准的SDK控件,为最终用户提供语音、自然语言理解、图像等人工智能应用。
 
构建AI+语音平台,提供语音识别、语音合成等实现与多种人工智能能力的灵活组合与挂接,并提供丰富的接口与客户系统进行平滑对接,实现量身定制的语音交互平台级系统服务,方便各渠道前端敏捷迭代开发调用。
 
AI+语音平台将语音合成、语音识别和声纹识别等无缝的集成在同一个系统架构中,降低运维成本,提高利用率。通过语音识别、语音合成等能力,实现对接客户系统实现高频业务改造,支持客户以语音方式进行交互,实现各种智能化业务应用。

 
从上述图中可以看到,用户的请求进入AI+语音平台时,首先防火墙要对其进行安全性检查,以保证系统的正常稳定运行。之后用户的请求将送至接入服务器,接入服务器会根据用户请求的业务类型,如语音合成、语音识别等,并结合系统负载均衡策略,将请求分发至业务服务器。业务服务器先解析用户请求,将用户请求和业务相关的信息存储至数据库,加载业务资源,调用相应的语音引擎服务器,将请求响应结果返回给接入服务器,接入服务器进一步返回给用户。在此架构中,系统运行管理服务器会实时监测到所有服务器节点的运行状态。
 
核心效果优化主要包含对智能语音平台语音合成、语音识别、语义和声纹效果优化等几个方面。
 
1、语音识别优化:主要是对实测数据进行详尽分析,扩展测试集、训练集,扩充说法、提升语料覆盖度等方法,重点解决反馈的一些单点问题,分析影响识别效果的原因,若是声学层面导致的,则补充进行音频数据标注和优化训练,若是语言层面,则通过扩充覆盖度、增大句式概率等进行效果调优。
 
2、合成效果优化:通过对发言参数的调整,可以对语速、流程性等一系列关键参数进行调整,结合预录音等方式,使语音合成播报效果更加流畅饱满,贴合满足业务应用要求。

再一次了解: 智能AI+电话语音平台建设方案