您现在的位置:首页 --> 查看专题: 声学
语音是人们沟通交流最直接、最自然的交互方式。自计算机问世以来,人们就一直希望可以通过语音实现人和计算机之间的交互,而语音识别技术,目标就是通过把人类的语音中的词汇内容转换为相应的文本,架起了人机交互的桥梁。对于一个语音识别系统,速度和精度是两个核心指标,直接决定着系统是否可用。其中,识别速度的提升意味着可以降低成本,同时提供更多的语音服务,一直是语音识别技术研究的重点方向。在语音识别系统中,声学模型得分的运算量一般会达到整个系统的40%-70%,因此也是识别速度优化的重点模块。本文就来讲讲如何优化声学模型得分计算。 基本概念介绍特征向量:语音数据在识别前首先会被分成多帧数据,一般帧长为25毫秒,帧移为10毫秒。每一帧语音数据经过特征提取之后,会生成一帧特征,称之为一个特征向量或特征矢量 ,其中n为特征向量的维数。
[ 共1篇文章 ][ 第1页/共1页 ][ 1 ]
近3天十大热文
-
[57] memory prefetch浅析
-
[54] 转载:cassandra读写性能原理分析
-
[47] 深入浅出cassandra 4 数据一致性问
-
[46] MySQL半同步存在的问题
-
[42] 《web前端最佳实践》—高维护性css
-
[41] javascript插入样式
-
[41] 获取Dom元素的X/Y坐标
-
[38] MySQL vs NoSQL 效率与成本之争
-
[36] 不是书评 :《我是一只IT小小鸟》
-
[35] 基本排序算法的PHP实现
赞助商广告