您所在位置: 网站首页 / 基于MSSDK的文语转换系统 lizheng.doc / 文档详情
基于MSSDK的文语转换系统 lizheng.doc 立即下载
2024-12-06
约1.1万字
约17页
0
111KB
举报 版权申诉
预览加载中,请您耐心等待几秒...

基于MSSDK的文语转换系统 lizheng.doc

基于MSSDK的文语转换系统lizheng.doc

预览

免费试读已结束,剩余 12 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

内容摘要:与机器进行语音交流,让机器发出需要的声音,这是人们长期以来梦寐以求的事情,文语转换系统就是让机器通过识别和理解文章段落把文字信号转变为相应的声音信号的高技术。文娱转换是一门交叉学科,近二十年来,文语转换技术取得了更加显著的进步,开始从实验室走向市场。热门娱记,未来10年,文语转换系统将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。很多专家都认为文娱转换技术是2000至2010年间信息技术领域十大重要的科技发展技术之一。本文介绍了利用微软的MicrosoftSpeechSDK5.1提供的TTS(text-to-speech)技术开发具有语音朗读功能的应用程序
关键词:文语转换MSSDKCOM
Abstract:Andmachineryforvoicecommunication,sothatthemachineneedsavoice,thisiswhatpeoplehavelongdreamedof,text-to-speechsystemistoallowmachinestoidentifyandunderstandtheparagraphsofthearticletextsignalintothevoicesignalsinthecorrespondinghigh-tech.Civicconversionisacross-discipline,thelast20years,text-to-speechconversiontechnologyhavemademoresignificantprogress,startingfromthelaboratorytothemarket.TopYuji,thenext10years,text-to-speechsystemwillentertheindustrial,householdappliances,telecommunications,automotiveelectronics,medicalcare,familyservices,consumerelectronicsandotherfields.Manyexpertsagreethatculturalconversiontechnologyisthe2000-2010fieldofinformationtechnologyamongthe10importantscientificandtechnologicaldevelopmentofthetechnology.thisarticleintroducesHowtoCreatespeech-enableedApllicationsusetheMicrosoftSpeechSDK5.1
Keywords:Test-To-SpeechMSSDKCOM



1绪论
1.1.TTS技术概述
上世纪90年代中期以来,随着个人计算机的硬件和软件功能越来越强,和现代语音技术的发展,以前在科幻电影中才能看到的会说话的电脑已经成为现实.而TTS技术正是电脑能够说话的关键技术之一.
TTS是text-to-speech的缩写,英文也称SpeechSynthesis即语音合成.语音合成就是一个将文本转化为语音输出的过程,这个过程的工作主要是将输入的文本按字或词分解为音素,并且对文本中的数字、货币单位、单词变形以及标点等要特殊处理的符号进行分析,以及将音素生成数字音频然后用扬声器播放出来或者存为声音文件以后用多媒体软件播放.图1形象地描述了这个过程.
语音应用程序

“ONEOCLOCK”

应用程序把语言以纯文本的形式输出
语音合成引擎

WAHNWOKLAOKD

语音合成引擎把文本转换为音素和韵律符号并生成连续的数字音频
声卡—扬声器

硬件部分

声卡将数字声音转换为声音信号并由扬声器播放出来
“ONEOCLOCK”

图1.text-to-speech实现过程
当应用程序需要发声的时候就调用语音合成引擎(SPEECHSYNTHESISENGINE)进行语言合成,将文本处理后通过扬声器用近似于人的声音“读”出来,通常还可以通过改变对语音引擎的设置改变“说话”的速度,声音频率(低沉或者尖锐),声音大小,还能模拟口形、唇形和舌位的变化对声音的影响.面前计算机通过语音合成发出的声音效果听起来就象是录音磁带发出的声音.
与一些用预先录制的声音文件实现发声的应用程序相比,TTS的发声引擎只有几兆大小,不需要大量的声音文件支持,因此可以节省很大的储存空间,并且可以朗读预先未知的任何语句.现在已经有许多应用软件应用TTS技术实现语音功能,例如一些播音软件可以用来读小说或作校对工作,还可以朗读电子邮件,一些电子词典可以读出单词,还可以用于查询中心自动播放服务信息等.
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

基于MSSDK的文语转换系统 lizheng

文档大小:111KB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用