如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110047471A(43)申请公布日2019.07.23(21)申请号201910395636.3(22)申请日2019.05.13(71)申请人深圳市智宇盟科技有限公司地址518052广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人唐远兵(74)专利代理机构北京联瑞联丰知识产权代理事务所(普通合伙)11411代理人赵娜(51)Int.Cl.G10L15/05(2013.01)G10L15/22(2006.01)G10L19/16(2013.01)权利要求书1页说明书3页附图2页(54)发明名称语音唤醒方法(57)摘要本发明公开了一种语音唤醒方法,具体包括以下步骤:开启录音:获取采样pcm音频数据;缓存PCM数据:将采集的pcm音频数据缓存在buffer里;语音端点检测:通过计算一定时间内采样数据的能量值,判断语音的开始点;AMR编码:通过C步骤确定语音的开始点后,将保留当前的缓存PCM音频数据,并对pcm音频数据做AMR编码,直到确定语音结束;上传AMR数据:将D步骤编码后的AMR音频数据上传到服务器;服务器语音识别:服务器识别AMR音频数据,检测是否为预先设定的指令;服务器下发指令:如果F步骤中服务器识别成功并检测为预先设定的指令,向设备发送唤醒指令。设备唤醒:设备收到唤醒指令后唤醒。本发明检测效率较高,占用资源少,同时方便功能扩展,降低了成本。CN110047471ACN110047471A权利要求书1/1页1.一种语音唤醒方法,其特征在于,具体包括以下步骤:A.开启录音:获取采样pcm音频数据;B.缓存PCM数据:将采集的pcm音频数据缓存在buffer里;C.语音端点检测:通过计算一定时间内采样数据的能量值,判断语音的开始点;D.AMR编码:通过C步骤确定语音的开始点后,将保留当前的缓存PCM音频数据,并对pcm音频数据做AMR编码,直到确定语音结束;E.上传AMR数据:将D步骤编码后的AMR音频数据上传到服务器;F.服务器语音识别:服务器识别AMR音频数据,检测是否为预先设定的指令;G.服务器下发指令:如果F步骤中服务器识别成功并检测为预先设定的指令,向设备发送唤醒指令。H.设备唤醒:设备收到唤醒指令后唤醒。2.根据权利要求1所述的语音唤醒方法,其特征在于,步骤B.缓存PCM数据:将采集的pcm音频数据缓存在buffer里具体指的是步骤B.缓存PCM数据:申请系统内存,初始化为ringBuffer,用于缓存PCM数据,将采集的pcm音频数据缓存在ringBuffer。3.根据权利要求2所述的语音唤醒方法,其特征在于,步骤C.语音端点检测:通过计算一定时间内采样数据的能量值,判断语音的开始点和结束点具体包括以下步骤:C1.检测ringBuffer中存入的PCM音频数据的长度是否达到最小能量的检测长度,如果达到则开始检测,如果没达到则继续缓存;C2.根据当前录音的采样率,计算固定时间内PCM音频数据的长度,将这个固定时间的所有采样点的绝对值算出一个平均值,得到上述固定时间的能量值;C3.将步骤C2得到的能量值与设定阈值比较,若大于设定阈值,则判断为语音的开始点,执行步骤D。4.根据权利要求3所述的语音唤醒方法,其特征在于,步骤D中确定语音结束具体包含以下步骤:根据当前录音的采样率,计算固定时间内PCM音频数据的长度,将这个固定时间的所有采样点的绝对值算出一个平均值,得到上述固定时间的能量值;判断得到的能量值是否小于设定阈值,若是,判断当前pcm音频数据是否为AMR编码状态,若是,则确定为语音的结束点,停止AMR编码,若不是AMR编码状态,执行步骤A。5.根据权利要求4所述的语音唤醒方法,其特征在于,步骤D对pcm音频数据做AMR编码具体包括对pcm音频数据分段做AMR编码,每段pcm音频数据编码完成后,清楚ringBuffer中与该段pcm音频数据长度相对应的数据。6.根据权利要求4或5所述的语音唤醒方法,其特征在于,步骤D中,语音结束后,释放ringBuffer。7.根据权利要求1-5任一项所述的语音唤醒方法,其特征在于,步骤A.开启录音:获取采样pcm音频数据具体包括A.开启录音:开启设备的codec芯片,获取采样pcm音频数据。8.根据权利要求7所述的语音唤醒方法,其特征在于,所述设备为嵌入式设备。2CN110047471A说明书1/3页语音唤醒方法技术领域[0001]本发明涉及一种语音唤醒方法。背景技术[0002]现有的语音唤醒功能,将语音的检测和语音识别同时集成在嵌入式设备中。由于需要在vad检测的同时做语音识别,这样加大了算法的复杂性,对cpu和内存的占用会比较高。对于某些低成本,低配置的嵌入式设备,由于cpu处
是浩****32
实名认证
内容提供者
最近下载