智能语音控制系统

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

作品说明书

题目:智能语音控制系统

目录

1. 开发背景 (2)

2. 原理 (2)

3. 设计方案 (2)

4. 硬件电路设计 (3)

5. 软件程序设计 (5)

6.理论分析与算法 (5)

1.开发背景

20世纪80年代初,随着大量采用电子技术的家用电器面市,家居系统电子化(HE,Homen Electronics),智能化越来越多。然而当今人们对日常设备的智能化控制要求越来越高,从原来的复杂化到简单话,在由简单化到傻瓜化,但是现在人们还是不满足,他们还想要更简单的更方便的更智能的方法来控制自己拥有的设备,这就是语音控制系统为什么会在现代社会如此流行,如此受到大家的欢迎,让语音控制系统成为当今最前沿的民用控制技术。

2. 原理

本系统采用r8c瑞萨单片机采集语音信号,再把语音信号通过通信传到电脑上去,通过电脑的高述的CPU对你说的话就是语音进行分析与计算,最终达到对语音识别的目的,当上位机识别到你说发出的语音后把信号通过通信传回单片机,通过单片机在来控制所有你想控制的设备,如电视、空调、冰箱、电饭锅、洗衣机等家用电器的工作。本系统运用了很多前沿性的技术,通信,单片机控制,对语音的分析,是本系统的三大主要内容,特别是对语音的分析才是本系统的灵魂。

3.设计方案

单片机经过一个音频接收电路把音频(声音)信号采集进单片机机系统中,在通过选用TL064CN语音芯片把音频信号转换成对应的电压值,再通过瑞萨单片机(16位)的AD采样把电压采集进来,同时为了提高采样频率,就采用直接把未处理的数据通过RS232接口上传到上位机软件中;在上位机程序中通过一定的算法处理采集到的数据流,然后把这些数据对应的“写”到窗体显示程序中(既分析仪界面),以实现音频信号的采集工作进行分析。最后得出结果,再由上位机传送控制信号回单片机,让单片机进行控制.

4. 硬件电路设计

硬件电路由R8C瑞莎单片机最小系统和RS232串口通讯,语音接收电路以及电源和设备控制电路组成。

其中瑞萨单片机最小系统版电路包括电器设备指示灯等。

图2.单片机最小系统原理图

因为电脑用以RS232通讯的高电平-12V,低电平+12V,所以采用MAX232芯片进行电压转换。MAX232采用+5V供电,其电路原理图如下图3所示。

图3.串口通讯原理图

瑞萨单片机采用5V电源供电,其原理图如下图4所示,220V交流电经过变

压器之后,输出

9V交流电压,再经过四个1N4007全波整流后,经过电容滤波后

进入三端集成稳压管LM780输出直流5V电压。其中C1为滤波电容,C2的作用是防止旁路高频干扰信号,C3的作用是改善负载瞬态响应。

TR

图4.单片机电源原理图

为实现控制额定电压220V家用电器,采用小继电器实施隔离控制。继电器采用三极管S9014驱动,其控制线号由单片机供给。其电路如下图5所示。

R?RE S2

I/O

K1

VCC

D?LE D

R?RE S2

R?RE S2

Q1PNP

图5.继电器控制电路

为了实现对语音信号的接收,我们还需要把语音信号转换为电信号的设备,其电路如下图

6所示。

5.软件程序设计

\

图3:下位机软件流程图

6.理论分析与算法

本系统最主要的工作就在于对语音的分析,这是本系统的难点,也是本系统的重点所在,在对语音的采集与计算中也提到了很多算法,也是其中的精髓所在.

首先对语音幸好数据进行加窗处理,由于发音器官的惯性运动,可以认为在一小段时间里(一般为10ms~30ms)语音信号近似不变,即语音信号具有短时平稳性。这样,可以把语音信号分为一些短段(称为分析帧)来进行处理。

语音信号的分帧实现方法:

采用可移动的有限长度窗口进行加权的方法来实现的。一般每秒的帧数约为33~100帧。分帧一般采用交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性。前一

帧和后一帧的交叠部分称为帧移,帧移与帧长的比值一般取为0~1/2。 图3.3给出了帧移与帧长示意图

加窗常用的两种方法:矩形窗,窗函数如下:

汉明(Hamming)窗,窗函数如下

加窗方法示意图:

窗长的选择

一般选取100~200。原因如下:

当窗较宽时,平滑作用大,能量变化不大,故反映不出能量的变化。

⎩⎨

⎧-≤≤=其它 010 1)(N n n w ()

0.540.46 cos 2π/1 0()

0 n N n N w n ⎧--≤≤⎡⎤⎪⎣⎦=⎨⎪⎩其它,

当窗较窄时,没有平滑作用,反映了能量的快变细节,而看不出包络的变化。

语音信号的分帧处理,实际上就是对各帧进行某种变换或运算。设这种变换或运算用T[ ]表示,x(n)为输入语音信号,w(n)为窗序列,h(n)是与w(n)有关的滤波器,则各帧经处理后的输出可以表示为:

)

()]([m n h m x T Q m n -=

∑∞

-∞

=

1.短时平均能量定义

定义n 时刻某语音信号的短时平均能量En 为:

+∞

-∞

=--=-=-=

m n

N n m n m n w m x m n w m x E )

1(2

2

)]()([)]()([

当窗函数为矩形窗时,有

∑--==

n

N n m n m x E )

1(2

)

(

若令

)

()(2n w n h =

则短时平均能量可以写成:

+∞

-∞

==-=

m n n h n x m n h m x E )(*)()()(2

2

最终算出其中的平均能量En 来反映语音信号的幅度或能量随时间缓慢变化的规律 。得出其分析结果,

2图3.7 语音信号的短时平均能量实现方框图

相关文档
最新文档