用于智能家居语音识别系统设计

wxq362

设计

文件大小79 KB

文件格式doc

分享时间2021-04-13

更多此类文档

立即下载

还剩7页未读，继续阅读

文本内容:

仪器科学与电气工程学院本科毕业论文（设计）开题报告题目用于智能家居的语音识别系统设计学生姓名学号专业电气工程及其自动化指导教师讲师2015年1月3日

1.选题依据

1.1选题背景语言作为人类信息交流中最重要的和最方便的方式人与机器的交流能否像人与人一样自如是人们研究的问题控制论创始人维纳在1950年就曾指出:“通常我们把语言仅仅看作人与人之间的通信手段但是要使人向机器机器向人以及机器向机器讲话那也是完全办得到的”随着现代科学技术的进一步发展和人民生活水平不断的提高人们对家庭住宅需求的概念也发生了彻底的改变人们正在从以往追求房屋空间的宽阔和装饰的亮丽、豪华向着追求品味、安全、舒适、便捷和智能方向发展现在的家庭不仅要满足人们生活、工作、娱乐和交流的需要同时还可以提供充分的安全防护、物业管理等手段智能家居是建筑艺术、生活理念与信息技术、电子技术等现代高科技手段完美结合的产物它的出现满足了人们对住宅高性能、智能化的要求21世纪信息时代的到来IT产业的发展和人们生活水平的提高“智能家居”、“家庭自动化”、“网络家电”、“家庭网络”等技术的推动智能家居的生活已经近在咫尺在智能家居中传统的家用电器的控制无外乎两种控制方式:手动或遥控随着家用电器的增多开关和遥控越来越多使用极不方便这时我们可以釆用语音识别的方式控制例如在观看电视频道时我们可以很方便地直接说出“中央一套”来所以语音识别及控制在智能家居中尤其重要

1.2国内外研究现况

1、语音识别技术的发展就技术而言，目前国内外对语音识别理论及各种实用算法的研究是一热点人们普遍关心的问题是不断提高语音识别的识别率、识别更多的词汇量、扩大语音识别的应用等研究语音识别技术发展到今天，PC机的语音识别系统己经趋于成熟，而且还出现了一些具有实用价值和市场语音识别前景的语音识别芯片近几年来，个人消费类电子产品的广泛使用，使大量的识别系统从实验室PC平台转移到嵌入式平台设备中，现在嵌入式对特定人语音识别系统的识别精度己经达到98%以上嵌入式语音识别系统和PC机的语音识别系统相比，虽然其运算速度和内存容量有一些限制，但是它也有各自的特点嵌入式系统体积小、可靠性高、耗电低、投入小、便于移动等优点，是嵌入式语音识别系统和PC机的语音识别系统相比的最大优势而且嵌入式语音识别系统多为实时系统，当用户讲话后，系统能够立即完成词条识别并作出反应这些特点决定了嵌入式语音识别系统的应用十分广泛可以预测在近几年内，嵌入式语音识别系统的应用将更加广泛各种语音识别系统将出现在市场上根据美国专家预测，具有语音识别功能的产品可达50亿美元在短期内还不可能具有和人相比拟的语音识别系统，要建成这样一个系统仍然是人类面临的一大挑战，我们正一步步朝着改进语音系统的方向迈进我国语音识别研究工作一直紧跟国际水平国家也很重视并把大词汇量语音识别的研究列入“863”计划由中科院声学所、自动化所及北京大学等单位研究开发取得了高水平的科研成果如中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统其字准确率或系统响应率可达90%以上鉴于中国未来庞大的市场国外也非常重视汉语语音识别的研究美国、新加坡等地聚集了一批来自大陆、台湾、香港等地的学者研究成果已达到相当高水平

2、智能家居的发展智能家居起源于上世纪80年代的美国在上世纪末来到中国经过十几年的发展特别是伴随住宅产业的进步智能家居在中国己经显出春笋出露的局面当家庭智能网关将家庭中各种各样的家电通过家庭总线技术连接在一起时就构成了功能强大、高度智能化的现代智能家居系统在国内智能家居作为一项新兴产业发展前景毋庸置疑在2011年;建设部出台的规划中也表示未来60%以上的新房都具有一定的“智能型家居”功能；显然，智能家居正在形成一种产业蕴含着巨大的市场潜力目前的智能家居主要采用国外的一些技术和产品当然也有一些企业推出自己的产品例如海尔公司的“e家庭”和清华同方的“e-home数字家园”

3、发展趋势语音识别技术是非常重要的人机交互技术，有着非常广泛的应用领域和市场前景应用语音的自动理解和翻译，可消除人类相互交往的语言障碍通信技术的飞速发展，语音识别技术将为网上会议、商业管理、医药卫生、教育培训等各个领域带来极大的便利目前语音识别系统主要应用有以下几方面高档智能玩具比如能和儿童交流的语音娃娃、声控玩具汽车等、汽车电子语音导航系统（通过语音实现地名和各种命令的输入）、汽车免提电话（语音拨号），家电语音智能控制（比如空调、冰箱、消毒柜、洗衣机、电灯等）、手机（比如语音拨号）、PDA等

4、存在问题

（1）目前使用的语言模型只是概率模型，所以准确性不会达到百分百；

（2）语音识别受特定人、口音或者方言的影响；

（3）环境杂音或者噪音对语音识别效果影响较大

2.课题基本内容

2.1课题目标以智能家居控制的语音识别为应用背景，利用嵌入式系统开发板硬件平台，设计语音识别算法程序，实现语音识别系统

2.2研究内容

（1）学习掌握基于ARM的嵌入式控制系统；

（2）学习和研究语音识别算法并运用在ARM中进行编程

2.3预期成果提交一套嵌入式（ARM）语音识别系统，包括嵌入式语音识别算法，系统具有较高识别率和识别速度3．开题前期基础及实施方案

3.1了解语音识别原理

（1）语音信号的数学模型语音是由声道激励发生共振而产生的，由于在发声过程中声道是运动的，因此可以用一个时变线性系统来描拟当在一个较短的时间间隔内表示语音信号时，可以采用线性时不变模型，如图1表示信号产生模型图1信号产生模型三部分模型有各自相应表达式，最终的输出信号由各部分模型串联组成2语音信号的处理语音信号中含有丰富的信息，从中提取对语音识别有用信息的过程，就是特征提取特征提取方法是整个语音识别系统的基础，对语音识别率有极其重要的影响它主要分为3类

①基于LPC的倒谱参数分析；

②基于FFT的频谱余弦变换分析；

③采用前沿数字信号处理技术的特征分析手段，如小波分析、时——频域分析、人工神经网络等语音识别的过程可以看作模式匹配的过程，模式匹配是指根据一定的准则，使未知模式与模型库中的某个模型获得最佳匹配的过程模式匹配要用到参考模板，这些模板通过模板训练获得模板训练就是指按照一定的准则，从大量已知模式中获取表征该模式本质特征的模型参数

（3）语音识别原理语音识别属于模式识别，与人的认知过程一样，分为训练和识别两个过程在训练阶段，语音识别系统对人类语言进行学习，学习结束，把学习内容组成语音库存储起来；识别阶段就可以把人们当前输入的语音在语音库中查找相应的词义或语义从信号处理的角度，任何一个语音识别系统都能以图2来表示图2语音识别系统

3.2语音识别模型语音识别基本原理是对语音信号进行特征提取目前常用的语音识别算法有基于模式匹配的动态时间规整法（DTW DynamicTimeWarping），基于统计模型DSP的隐马尔可夫模型法（HMM HiddenMarkovModel）以及基于人工神经网络识别法（ANN）等

（1）隐马尔可夫模型法（HMM）HMM作为语音信号的一种统计模型，在语音处理领域中获得广泛应用HMM是在马尔可夫链的基础上发展起来的由于实际问题比马尔可夫链模型所描述的更为复杂，观察到的事件并不是与状态一一对应，而是通过一组概率分布相联系，这样的模型就称为HMM它是一个双重随机过程，其中之一就是马尔可夫链，这是基本随机过程，它描述状态的转移另一随机过程描述状态与观察值的统计对应关系站在观察者的角度，只能看到观察值，不能直接看到状态，而是通过一个随机过程去感知状态的存在及其特性因而称之为“隐”马尔可夫模型隐马尔可夫模型法可用于大多数大词汇量、连续语音的非特定人语音识别，它很好的模仿了人的发音系统的状态与语音信号这两个随机过程，是一种较为理想的语音模型，但是他的缺点在于统计模型的建立需要依赖一个较大的语音库这在实际工作中占有很大的工作量且模型所需要的存储量和匹配计算包括特征矢量的输出概率计算的运算量相对较大通常需要具有一定容量SRAM的DSP才能完成

（2）人工神经网络（ANN）ANN在语音识别领域的应用是在20世纪80年代中后期发展起来的其思想是用大量简单的处理单元并行连接构成一种信息处理系统这种系统可以进行自我更新且有高度的并行处理及容错能力因而在认知任务中非常吸引人但是ANN相对于模式匹配而言在反映语音的动态特性上存在重大缺陷单独使用ANN的系统识别性能不高所以目前ANN通常在多阶段识别中与HMM算法配合使用

（3）动态时间规整（DTW）语音识别中，不能简单地将输入模板直接比较，因为语音信号具有相当大的随机性，即使同一个人，在不同时刻的同一句话发的同一个音，也不可能具有完全相同的时间长度，因此时间规整必不可少DTW是时间规整与距离测度结合的非线性规整技术假设参考模板特征矢量序列为a1，a2，…，am，…，aM；输入语音特征矢量序列为b1，b2，…，bn，…，bN，M≠N，那么动态时间规整是要寻找时间规整函数m=ωn，它把输入模板的时间轴n非线性地映射到参考模板的时间轴m上式中，d[nωn]是第n帧输入矢量和第m帧参考矢量的距离，D是相应于最优时间规整下一个模板的距离测度DTW是一个典型的最优化问题，它用满足一定条件的时间规整函数ωn描述输入模板和参考模板的时间对应关系，求解两模板匹配时的累计距离最小所对应的规整函数DTW算法通过将待识语音信号的时间轴进行不均匀的扭曲和弯曲，使其特征与模板特征对齐，并在两者之间不断的进行两个矢量最小的匹配路径计算，从而获得两个矢量匹配时累计距离最小的归整函数这是一个将时间归整和距离测度有机结合在一起的非线性归整技术，保证了待识别特征与模板特征之间最大的声学相似特征和最小的时差失真，是成功解决匹配问题的最早、最常用的方法由于DTW模版匹配的运算量不大并且限于小词表一般的应用领域孤立数码、简单命令集、地名或人名集的语音识别，与智能家居的命令相符，所以本次设计采用该算法

3.3处理器与方案设计嵌入式语音系统硬件平台主要包括中央处理器、外围控制电路、只读存储器、可读写存储器和外围设备嵌入式系统体积小、专用性强的特点决定了其硬件必须根据实际需要高效率的设计在设计嵌入式语音识别系统Linux平台硬件环境时，结合芯片的功能、功耗、体积、成本和可靠性等多方面性能要求，综合考虑，最终选择用Samsung公司的高性能S3C2440ARM处理器作硬件开发平台的核心，围绕它搭建外围电路，其所需要的外围电路芯片，购买的开发板就可以满足下图图3为系统的总设计框架图3系统总设计图由相应的语音解码芯片转换语音信号，通过S3C2440的计算和处理，转换成控制指令（可以由数码管或二极管对输出进行检测），最好可以在控制处设立显示界面以便于操作者进行监控

4.重难点

（1）语音信号的数学建模，这是整个系统设计的基础；

（2）基于嵌入式系统的语音识别算法的实现，包含两方面内容一是语音识别算法的学习，二是算法在ARM中的实现；

（3）语音识别算法要有实时性，在保证识别率的前提下，识别速度要快，即语音发出后，应在最短的时间内识别出来，用来发出准确控制命令

5.工作进度安排

（1）2013年12月查阅相关资料，进行翻译英文文献，编写开题报告，明确毕业设计工作的内容，根据资料，设计系统流程图；

（2）2014年1~3月对ARM进行学习，掌握并熟练使用ARM完成简单功能，学习并购置元器件；

（3）2014年4月学习关于语音识别方面算法，实现初步的语音识别功能；

（4）2014年5月实现家居的模型以及语音对家居的控制，对系统进行初步调试，准备中期检查；

（5）2014年6月对该系统进行进一步的调试进一步完善整个系统，测试功能实现情况，优化系统，并尝试制作显示界面；

（6）2014年6月撰写毕业论文，参加答辩

6.参考资料

[1].周冀辉.基于ARM9的语音控制智能终端的设计[D].华中科技大学软件工程学院，

2010.

[2].刘志伟.基于ARM的语音识别研究[D].东华大学模式识别与智能系统，

2010.

[3].肖丽君.基于DTW模型的孤立词语音识别算法实现研究[D].中南大学控制科学与工程，

2010.

[4].刘荣辉.基于智能家居控制的嵌入式语音识别系统研究[D].广东工业大学控制理论与控制工程，

2013.

[5].张雪英.数字语音处理及MATLAB仿真[M].北京:电子工业出版社

2010.

[6].刘文强.语音识别技术在智能家居中的研究与应用[D].大连海事大学计算机科学与技术，

2013.

[7].YeXHuangJ.AframeworkforCloud-basedSmartHome[C].ProceedingsofComputerScienceandNetworkTechnologyICCSNT2011InternationalConferenceonvolume

2.IEEH

2011.

[8].LecouteuxBVacherMPortetFetal.Distantspeechrecognitioninasmarthome:comparisonofseveralmultisourceASRsinrealisticconditions[J].ProceedingsofInter-speech

20112011.

[9].WalkerWLamerePKwokPetal.Sphinx-4:Aflexibleopensourceframeworkforspeechrecognition[J].AutomaticSpeechRecognitionandUnderstandingIEEEWorkshopon

2005.

[10].GiacobelioDChristensenMGMurthiMNetal.Sparselinearpredictionanditsapplicationstospeechprocessing[J].AudioSpeechandLanguageProcessingIEEETransactionson

2012.开题报告评审意见论文题目用于智能家居的语音识别系统设计学生姓名　学号专业电气工程及其自动化指导教师指导教师对学生开题报告的评语指导教师签字年　月日评审组意见组长签字年　月日注用16K纸打印或填写麦克风语音处理芯片UDA1341TSARMS3C2440SDRAM显示屏输出命令。

更多此类文档

关于文档

个人认证

优秀文档

获得点赞 0

文件大小79 KB

文件格式doc

分享时间2021-04-13

更多此类文档

立即下载