【论文摘要】语音控制是智能化设备的重要控制手段,而语音识别是实现语音控制的关键技术。为了设计一种可靠的、抗干扰性强的产品,提出了一种基于双麦克风降噪技术的语音识别系统。该设计运用ROHM公司的BU8332KV芯片作为语音识别前端处理的核心,利用其双麦克风降噪技术来解决语音识别中的噪声问题,结合单片机和语音识别芯片,应用于按摩椅的语音控制系统中。经过非特定人的语音识别系统的静态和噪声环境下测试,结果表明在噪声环境下,该系统有较高的识别率,适用于按摩椅的应用环境,也适合在其他有环境噪声干扰的语音识别系统中推广应用。 【论文关键词】语音识别;语音控制;双麦克风降噪;BU8332KV Speech recognition system based on dual?microphone noise reduction technology PAN Lijie, XU Benliang, ZHU Qi, WANG Lifeng, MIAO Huigen Abstract: With the speech control as an important control means of intelligent device, and speech recognition as a key technology to realize the speech control, a speech recognition system based on double?microphone noise reduction technology is proposed for the design of a reliable, strong anti?interference product. In the design of a voice control system in massage chair, BU8332KV chip of ROHM Company is taken as the core of speech recognition front?end processing, the dual?microphone noise reduction technology is adopted to solve the problem of noise in speech recognition, and MCU and speech recognition chip are combined. The testing result of speaker independent speech recognition system in static and noise environment test proves that the system has a high recognition rate, and is suitable for the application environment of massage chair. It is also suitable for popularization and application to other speech recognition systems working in environmental noise interference. Keywords: speech recognition; speech control; dual?microphone noise reduction; BU8332KV 0引言 近年来,随着语音识别技术的日益发展,语音输入系统广泛应用于以汽车导航仪及智能手机为首的移动设备上,今后还将要扩展到其他智能电气产品。语言是人类传递信息的主要手段,语音识别技术是目前世界上最热门和最具发展前景的新型信息技术之一[1?2]。采用语音识别作为人机接口的设备能够具有简便、快捷、灵活的优点,其在军事、民用和商业领域都发挥了巨大的作用,在未来会成为新一代操作系统的接口[3?5]。 在语音识别过程中,不可避免会受到其他噪声影响,比如周围环境中的噪声,别人讲话的声音等,这样,最终接收到的已经不是纯净的语音信号,而是有干扰的带噪语音,常规的做法就是通过增强、增大语音信号来解决,比如提高嗓门,或近距离说话,这样极大地影响了使用效果。所以在前端对语音进行降噪处理非常必要,也是语音识别的最重要部分,能够为整个语音识别系统提供可靠的稳定性,提高其识别率。 本文以ROHM公司的BU8332KV芯片作为语音识别前端处理的核心,利用其双麦克风降噪技术来解决语音识别中的噪声问题。 1双麦克风降噪技术 1.1技术原理 BU8332KV芯片采用波束赋形技术形成指向性,因为将指向轴转向声源的方向,所以大大降低了环境噪音。这里的波束赋形技术是利用多个麦克风的相位差,降低目标方向以外的语音的技术。其降低了环境噪音,提高了目标声源的清晰度。通过噪音抑制的功能,进一步降低残留在指向轴方向的固定噪音。这个技术和仅仅使用噪音消除的技术不同,可以更加强调声源。而且,由于它能够在仅仅10mm的窄间距上安装2个麦克风,所以能够内置于以智能手机为代表的各种小型设备上。通过最优化处理,波束赋形技术可以将使用时的处理延迟时间控制在10ms以下,使得将其他应用程序的影响控制在最小限度内。通过这些措施,有助于提高各种设备的语音识别率和改善免提的通话质量,双麦克风降噪工作示意图如图1所示。 图1双麦克风降噪工作示意图 使用两个麦克风形成指向性的技术早已被应用,但现有技术为了提高指向性,必须拉长麦克风间距,所以不能适应小型便携式设备的搭载要求。另外,数字信号处理的延迟时间及音质劣化,也是今后继续要攻克的研究课题。而如今,利用波束赋形技术形成指向性,并且通过把指向轴转向声源方向,从而衰减了声源以外的语音。在指向轴方向残留的固定噪音通过噪音抑制的功能得以降低,因而使得声源变得清晰。其结果是使得背面方向的衰减量较传统的麦克风改善30dB以上。 |