当前位置:清远传媒网 > 科技 > 业界 > 正文

马上金融自主研发ASR技术,可识别多种方言

清远传媒 www.gdqynews.com   发布时间:2020-06-15 17:03:11   作者:yejie

  自动语音识别技术(Automatic Speech Recognition)也称“ASR”,是一种将人的语音转换为文本的技术。此项技术是通过“声音”到“文字”的转换,能让机器就像耳朵一样能够“听懂”人说话。这一技术已经在很多场景中广泛应用,比如通过语音可以对手机发出指令,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能,以及智能电话机器人、智能外呼系统、智能电话客服系统等都需要应用ASR技术。在呼叫中心领域实际应用场景中,自动语音识别技术在应用方面比起一般PC系统的应用来说更具挑战。比如复杂的噪声环境、各种方言交杂,再加上不同行业有着大量的专有句式和专业词汇,使得语音识别存在技术难题和误识情况。基于这些痛点,马上消费金融(以下简称“马上金融”)打造了自主研发的语音识别模型,不仅能够有效地解决上述难题,还在识别准确率上得到大幅提升。

  目前,该模型已经在马上金融的智能外呼、智能客服、电话录音质检等多个业务场景落地。经实测,在电话场景、各种噪声环境下,马上金融ASR的字准率达到88%,在业界处于领先水平。马上金融凭借自身在金融科技领域的深耕和垂直电话场景数据的大量积累,语音识别技术已在信托领域智慧双录、重庆百货等商家落地应用。

  马上金融ASR技术具有多种方言识别能力。为满足不同客户群体需求,马上金融的语音识别技术在语种丰富度上持续发力,在原有常见语种基础上,开放了四川话、重庆话的识别能力,后续还会陆续开放对粤语等方言的语音识别能力。经过长期的打磨训练和效果调优,目前重庆方言语种的语音识别技术已在重庆百货应用于电话录音质检等业务场景。

  得助-智能语音质检系统是马上金融自主研发的集成语音识别(ASR)、声纹识别、情绪识别、自研语言处理(NLP)等多种先进的人工智能(AI)技术于一体的智能语音质检系统。该系统采用先进算法,充分利用上下文信息提升模型识别效果,目前已应用于马上金融呼叫中心场景,覆盖58个节点,34条流转路径等高度复杂业务,召回率达到90%,识别正确率达到86.5%。

  据马上金融2019年度数据统计,得助-智能语音质检系统的智能质检单项违规检出率比人工抽检的检出率提升最高可达36倍,其中,7个智能质检项是人工抽检效率的5倍以上,14个智能质检项的结果全部优于人工抽检,违规质检—虚假承诺还款效率提升13倍。

  据悉,目前马上金融已经自主研发了700余套涵盖消费金融全业务流程、全生命周期的核心技术系统,累计提交专利申请220余件。作为长期深耕消费金融领域的科技驱动型金融机构,未来马上金融将通过一系列以科技为驱动的服务模式来满足客户多样化金融需求,持续拓展新的发展空间,打造行业领先的金融科技服务能力。