如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
内容摘要:与机器进行语音交流,让机器发出需要的声音,这是人们长期以来梦寐以求的事情,文语转换系统就是让机器通过识别和理解文章段落把文字信号转变为相应的声音信号的高技术。文娱转换是一门交叉学科,近二十年来,文语转换技术取得了更加显著的进步,开始从实验室走向市场。热门娱记,未来10年,文语转换系统将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。很多专家都认为文娱转换技术是2000至2010年间信息技术领域十大重要的科技发展技术之一。本文介绍了利用微软的MicrosoftSpeechSDK5.1提供的TTS(text-to-speech)技术开发具有语音朗读功能的应用程序 关键词:文语转换MSSDKCOM Abstract:Andmachineryforvoicecommunication,sothatthemachineneedsavoice,thisiswhatpeoplehavelongdreamedof,text-to-speechsystemistoallowmachinestoidentifyandunderstandtheparagraphsofthearticletextsignalintothevoicesignalsinthecorrespondinghigh-tech.Civicconversionisacross-discipline,thelast20years,text-to-speechconversiontechnologyhavemademoresignificantprogress,startingfromthelaboratorytothemarket.TopYuji,thenext10years,text-to-speechsystemwillentertheindustrial,householdappliances,telecommunications,automotiveelectronics,medicalcare,familyservices,consumerelectronicsandotherfields.Manyexpertsagreethatculturalconversiontechnologyisthe2000-2010fieldofinformationtechnologyamongthe10importantscientificandtechnologicaldevelopmentofthetechnology.thisarticleintroducesHowtoCreatespeech-enableedApllicationsusetheMicrosoftSpeechSDK5.1 Keywords:Test-To-SpeechMSSDKCOM 1绪论 1.1.TTS技术概述 上世纪90年代中期以来,随着个人计算机的硬件和软件功能越来越强,和现代语音技术的发展,以前在科幻电影中才能看到的会说话的电脑已经成为现实.而TTS技术正是电脑能够说话的关键技术之一. TTS是text-to-speech的缩写,英文也称SpeechSynthesis即语音合成.语音合成就是一个将文本转化为语音输出的过程,这个过程的工作主要是将输入的文本按字或词分解为音素,并且对文本中的数字、货币单位、单词变形以及标点等要特殊处理的符号进行分析,以及将音素生成数字音频然后用扬声器播放出来或者存为声音文件以后用多媒体软件播放.图1形象地描述了这个过程. 语音应用程序 “ONEOCLOCK” 应用程序把语言以纯文本的形式输出 语音合成引擎 WAHNWOKLAOKD 语音合成引擎把文本转换为音素和韵律符号并生成连续的数字音频 声卡—扬声器 硬件部分 声卡将数字声音转换为声音信号并由扬声器播放出来 “ONEOCLOCK” 图1.text-to-speech实现过程 当应用程序需要发声的时候就调用语音合成引擎(SPEECHSYNTHESISENGINE)进行语言合成,将文本处理后通过扬声器用近似于人的声音“读”出来,通常还可以通过改变对语音引擎的设置改变“说话”的速度,声音频率(低沉或者尖锐),声音大小,还能模拟口形、唇形和舌位的变化对声音的影响.面前计算机通过语音合成发出的声音效果听起来就象是录音磁带发出的声音. 与一些用预先录制的声音文件实现发声的应用程序相比,TTS的发声引擎只有几兆大小,不需要大量的声音文件支持,因此可以节省很大的储存空间,并且可以朗读预先未知的任何语句.现在已经有许多应用软件应用TTS技术实现语音功能,例如一些播音软件可以用来读小说或作校对工作,还可以朗读电子邮件,一些电子词典可以读出单词,还可以用于查询中心自动播放服务信息等.
my****25
实名认证
内容提供者
最近下载