一种用于无线通信的数字语音识别系统设计

时间：2021-03-27 08:12:04　来源：达达文档网本文已影响人

打开文本图片集

摘要：数字语音录制过程中存在的环境、用户口音和非目标词汇等干扰，使以往开发出的无线通信数字语音识别系统准确性较低、可移植性较差。因此，对无线通信的数字语音识别系统进行优化设计，设计系统的核心元件为C6727DSP芯片、QGDH710 语音识别芯片和CC2520射频收发器。C6727DSP芯片进行数字语音的前期处理工作；QGDH710 语音识别芯片对处理后的数字语音进行识别，并将其识别出的指令反馈到CC2520射频收发器；CC2520射频收发器进行指令的格式转换工作，并将指令传输到用户无线通信设备中，最终实现数字语音识别系统在无线通信中的有效利用。为了方便用户进行系统操作，软件给出用户无线通信设备虚拟功能图。经实验验证可知，该设计系统准确性较高，具有高度可移植性。

关键词：无线通信；数字语音识别系统；系统设计；虚拟功能图

中图分类号： TN915⁃34； TN912.34 文献标识码： A 文章编号： 1004⁃373X（2016）16⁃0151⁃04

Abstract： The interference such as environment， user accent and non⁃target vocabulary exists in digital voice recording process， which makes the developed digital speech recognition systems used for wireless communication low accuracy and poor portability. Therefore， the optimization design of the digital speech recognition system used for wireless communication was performed. The core components of the system are chip C6727DSP， speech recognition chip QGDH710 and CC2520RF transceiver. The chip C6727DSP is used for early stage processing of the digital speech. The speech recognition chip QGDH710 is used to recognize the processed digital speech， and feed the recognized instruction back to the CC2520 RF transceiver. The CC2520 RF transceiver is used to convert the instruction format， and transmit the instructions to the user’s wireless communication equipment to realize effective utilization of the digital speech recognition system in wireless communication. To perform system operation conveniently for the users， a virtual function diagram of user’s wireless communication equipment is given by means of software. The experimental verification results show that the designed system has high accuracy and good portability.

Keywords： wireless communication； digital speech recognition system； system design； virtual function diagram

0 引言

近年来，数字语音识别技术在人们日常生活中得到了广泛应用。无线通信作为当今社会利用率最高的通信科技，极大地方便了人们的生活。将数字语音识别技术应用于无线通信中，是一项具有较高实用价值的科研项目[1⁃3]。由于用户在录制数字语音的过程中常常存在环境、用户口音和非目标词汇等多方干扰，不但降低了数字语音识别系统的准确性，也加重了无线通信的传输压力，导致系统可移植性较差。因此，开发出一种能够有效解决上述问题的无线通信数字语音识别系统，在科技发展中显得尤为重要[4⁃5]。

曾开发出的用于无线通信的数字语音识别系统均存在一定缺陷，基于LP技术的无线通信数字语音识别系统[6]，在用户个人计算机基础上，利用LP技术很好地解决了数字语音传输易丢失和易变音的现象，为语音识别系统的开发奠定了基础，但该系统的准确性和可移植性均不高，只能在处于安静环境下的特定计算机上使用；基于DTW技术的无线通信数字语音识别系统[7]，在LP技术的基础上开发出DTW技术，并得到了较高的数字语音识别能力，系统的准确性较高，但可移植性不高；基于ANN的无线通信数字语音识别系统[8]，利用ANN强大的计算能力和存储效率，实现了系统对数字语音的完美识别，但其无线通信的传输安全能力却差强人意；基于HMM的无线通信数字语音识别系统[9]，将HMM的强大计算能力纳入到软件中进行设计，利用软件控制数字语音识别和无线通信，其准确性高、可移植性强，但仍存在可优化空间。

准确性是评价无线通信数字语音识别系统性能的“说明书”，可移植性则是判断所设计的系统能否有效连接用户无线通信设备的凭证。为了解决上述无线通信数字语音识别系统的缺陷，开发准确性高、可移植性强的无线通信数字语音识别系统。经实验验证可知，所设计的系统准确性较高，并具有高度可移植性。

1 无线通信数字语音识别系统设计

1.1 系统整体设计

无线通信数字语音识别系统由数字语音处理模块、数字语音识别模块和无线通信模块组成，该系统的核心组成元件为C6727DSP芯片、QGDH710 语音识别芯片和CC2520射频收发器，保证了无线通信数字语音识别系统的准确性和高度可移植性，如图1所示。

1.2 数字语音处理模块设计

DSP是一种能够通过运算进行数字语音处理的芯片，其运算速度快，使用简便且灵活，并具有较强的稳定性和可移植性，在复杂的数字集成系统中应用较广。

无线通信数字语音识别系统选用由TI公司设计生产的C6727DSP芯片，作为数字语音处理模块的处理核心。C6727DSP芯片功能为：

（1）为用户提供并行和串行外设接口两种通信方法，无需外界存储器；

（2）写入数据的安全性和灵活性非常高，可同步开启多条指令的实施通道；

（3）为更加高效地进行数字语音的处理工作，设计者为C6727DSP芯片添加了引脚复用功能，并利用计时器、掉电逻辑、逻辑控制和各种指令为处理工作提供实时管控。图2是C6727DSP芯片的配置图。

由图2可知，C6727DSP芯片的核心元件为中央处理器和存储器。中央处理器中涵盖了多个数字语音数据处理平台和数据缓冲区。处理平台能够进行数字语音数据的运算、存取、逻辑推理和定位，定位可实现数据缓冲区和存储器间的数据相互调用。数据缓冲区位于中央处理器的两端，C6727DSP芯片利用总线将其相连。处理平台指引数据缓冲区进行数据的收发工作，方便数据缓冲区中数据互相调用和置换。

中央处理器和存储器的连接采用0805封装，并在连接电线上安装特定阻值的电阻，以增强数据传输稳定性。这一方法同样适用于C6727DSP芯片中其他元件间的连接。在中央处理器向存储器传递数字语音处理数据前，应先经由高达分频，缩减数字语音数据频率，保留其中的重要波形。

高达分频不但可以减轻存储器的存储压力，也为无线通信数字语音识别系统节约了识别时间。存储器接收到已处理的数字语音数据，并存储成功后，数字语音处理模块会将存储数据传输到数字语音识别模块。

1.3 数字语音识别模块设计

通过数字语音处理模块对数字语音进行一系列处理工作，为用户提供更准确的数字语音识别。

无线通信数字语音识别系统利用可编程中断控制器进行数字语音的识别工作。数字语音识别的难点在于如何有效避免环境噪音、用户口音和非目标词汇对识别工作的干扰。为此，可编程中断控制器选用国内某科技公司开发的QGDH710 语音识别芯片。

QGDH710芯片采用可外设接口的双向16 b语音转换器，并配置了高效能的数字语音功率放大器，可对多因素干扰下的数字语音进行有效识别。QGDH710芯片的接口类型多种多样，可给予无线通信数字语音识别系统较强的可移植性。

可编程中断控制器将数字语音处理模块传输来的数字语音数据转换成语音格式。与初始语音相比，经处理过的语音更加清晰、占用内存更小、语调更为标准，能够保障无线通信数字语音识别系统的准确性。

数字语音识别模块能够通过可编程中断控制器将数字语音准确识别出来，进而获取到用户所需的控制指令。该指令通过QGDH710芯片提供的数据传输接口反馈到无线通信模块。图3是可编程中断控制器中QGDH710芯片串口通信电路图。

由图3可知，可编程中断控制器利用QGDH710芯片为用户提供APP调试接口，用户可将其自主编辑的APP纳入到QGDH710芯片中进行调试。数字语音识别模块通过上述电路与无线通信模块进行数据传输。

1.4 无线通信模块设计

无线通信模块利用ZigBee通信技术，把无线通信数字语音识别系统与用户的无线通信设备连接起来，实现数字语音对无线通信的准确控制。

无线通信模块采用CC2520射频收发器，其传输安全性较高并可为用户提供帧管控和指令缓冲等功能。图4是CC2520射频收发器结构图。

由图4可知，当CC2520收到数字语音识别模块发送的指令后，先将指令低频放大至中频，再经数字调节器将指令的语音格式转换为数字格式。其转换过程主要包括信号增益、通信通道筛选、解扩和数据对应等。

指令经上述处理后，CC2520射频收发器将开始指令的无线通信。其先进行指令再处理，随后将指令传输到用户无线通信设备中。数字格式指令中具有相同向量值的频率可经数/模转换输出语音模拟信号，而向量值不同的数字指令将进行频率合成。因频率合成操作受逻辑控制，故合成后的向量值应是相等的，此时再将其转换成语音模拟信号。

CC2520射频收发器选用的传输方法是差分法。差分法对电路负载具有一定的要求，若CC2520射频收发器接收到的指令会造成电路负载超标，差分法将自动关闭CC2520射频收发器，这样则会影响整个无线通信数字语音识别系统的传输效率。为此，在无线通信模块电路中加入了指令转换电路，该电路内置单相接收天线、单片微控制器和计时器，严格限制指令的超负载传输。

2 无线通信数字语音识别系统实现

无线通信数字语音识别系统的功能实质为虚拟流程识别系统，其数字语音处理模块、数字语音识别模块和无线通信模块，可被分别看作标准虚拟流程识别系统的特性炼化、标准匹配和标准传输三项虚拟处理功能，这些功能将在用户无线通信设备的软件中显示。为了更好地便于用户理解和使用，无线通信数字语音识别系统还将系统中的一些重要处理流程编制成功能列表，其虚拟功能图如图5所示。

由图5可知，无线通信数字语音识别系统为用户无线通信设备软件提供了8种处理功能，这8种处理功能相互套用处理，为用户提供了较好的服务。

（1）特性炼化、标准匹配、标准传输。此三者是功能主项，可满足用户80%的使用需求；

（2）语音预处理。反复进行数字语音指令的去噪、格式转换、滤波等操作；

（3）端点检测。实现用户对无线通信数字语音识别系统的硬件检测和软件清理；

（4）识别决策、指令输出。为用户提供个性化决策控制，用户可经由这两个功能预设数字语音所对应的指令；

（5）数字语音加重。在无线通信数字语音识别系统成功获取到初始数字语音后，此时用户可通过数字语音加重功能重复播放数值语音指令。虚线框代表待选添加功能。由于这一功能并不常用，故将其自动隐藏，缩减用户无线通信设备软件的内存占用率。

由于数字语音在重复播放中会消耗一定的能量，致使播放效果逐渐降低，故在每一次重复播放前，系统软件将对数字语音进行加重处理，其数学表达式为：

[H（Z）=1-uZ-1]

式中：[H（Z）]是数字语音加重标准值；[u]是加重因子，取值0.938；[Z]是初始数字语音声音值。

3 实验分析

系统的准确性通过基于HMM的无线通信数字语音识别系统和本文系统的两项对比实验验证。准确性验证实验1在安静环境中以无口音朗读数字的条件下进行，准确性验证实验2则在嘈杂环境中以有口音朗读数字的条件下进行。两实验结果如表1和表2所示。

由表1和表2中的数据可知，本文系统在安静环境、嘈杂环境和用户口音存在的情况下，均能对数字语音进行较好识别，其识别准确率均维持在98.3%以上；而基于HMM的无线通信数字语音识别系统在嘈杂环境和用户口音存在的情况下，识别准确率明显下降，但识别准确率也可维持在91.5%以上，证明该系统存在较大的可优化余地。以上结果能够验证本文系统具有较高的准确性。

可移植性是判断本文系统能否有效连接用户无线通信设备的凭证，可移植性高的无线通信数字语音识别系统也是该领域的发展趋势。图6是本文系统、基于HMM的无线通信数字语音识别系统可移植曲线图。

由图6可知：基于HMM的无线通信数字语音识别系统可移植性曲线一直低于本文系统，可见本文系统具有较高的可移植性。

4 结论

本文开发一种准确性较高、可移植性较强的无线通信数字语音识别系统，该系统的核心元件为C6727DSP芯片、QGDH710 语音识别芯片和CC2520射频收发器。C6727DSP芯片进行数字语音的前期处理工作。QGDH710 语音识别芯片对处理后的数字语音进行识别，并将其识别出的指令反馈到CC2520射频收发器。CC2520射频收发器进行指令的格式转换工作，并将指令传输到用户无线通信设备中，最终实现数字语音识别系统在无线通信中的有效利用。为方便用户进行系统操作，给出用户无线通信设备虚拟功能图。经实验验证可知，所设计系统准确性较高，具有高度可移植性。

参考文献

[1] 王威，胡桂明，杨丽，等.基于ELM和PCA的汉语数字语音识别研究[J].电声技术，2015，39（11）：49⁃53.

[2] 陈孟元.基于改进型DTW算法和MFCC的语音识别[J].安徽工程大学学报，2014，29（1）：53⁃57.

[3] 陈斌，张连海，牛铜，等.基于MCE准则的语音识别特征线性判别分析[J].自动化学报，2014，40（6）：1208⁃1215.

[4] 李余芳，苏洁，胡文君，等.基于HTK的普米语孤立词的语音识别[J].云南民族大学学报（自然科学版），2015，24（5）：426⁃430.

[5] 赵海峰，毛文博，凌花，等.指挥员命令语音识别算法[J].指挥信息系统与技术，2014，5（2）：31⁃35.

[6] 陈可新，黄伟民.基于Asterisk的语音识别技术研究和实现[J].长春师范大学学报（自然科学版），2015，34（3）：44⁃46.

[7] 栗小艳，唐杰，王旸，等.超声语音识别系统的研发及临床应用[J].临床医学工程，2015，22（9）：1133⁃1135.

[8] 吴蔚澜，蔡猛，田垚，等.低数据资源条件下基于Bottleneck特征与SGMM模型的语音识别系统[J].中国科学院大学学报，2015，32（1）：97⁃102.

[9] 张毅，黎小松，罗元，等.基于人耳听觉特性的语音识别预处理研究[J].计算机仿真，2015，32（12）：322⁃326.

相关热词搜索： 无线通信 识别系统 语音用于数字

一种用于无线通信的数字语音识别系统设计

最新文章

热门文章