期刊问答网 论文发表 期刊发表 期刊问答

关于语音识别技术的论文摘要

  • 回答数

    2

  • 浏览数

    157

flzml
首页 > 期刊问答网 > 期刊问答 > 关于语音识别技术的论文摘要

2个回答 默认排序1
  • 默认排序
  • 按时间排序

VIP小木虫

已采纳
做好嘈杂环境的语音识别,难点是如何将杂音与人声分离。传统的音频识别需要人工设计模块,并依靠Hidden Markov Models,常常需要大量的人力和经验来调整模型噪音和语音变异。未来的主要研究方向是,通过深度学习来替代Hidden Markov Models,如基于递归神经网络的深度神经网络(DNN)进行声学建模,使得语音识别系统变得更为简单。日立公司宣称自己已经研发出一项新技术,利用对话音量比杂音变化较少的特点,将杂音与话音进行分离。

关于语音识别技术的论文摘要

204 评论(13)

adrianayu

抽象的一个有效的语音活动检测(VAD)算法 提出了提高语音识别性能 嘈杂的环境。该方法是基于对测定 由专门的命令意味着语音/ nonspeech分歧 统计滤波器(性质,OSFS)关于子带日志精力工作。 该算法不同于许多其他的方式的决定 规则的制订。而不是作出决定的基础上 当前帧,它使用的频带数的能量性质,OSFS 大大减少了错误的概率时歧视 从nonspeech讲话在嘈杂的信号。明显改善 在语音/ nonspeech歧视准确性展示 建议VAD方案的有效性。结果表明,增加的一 在OSF秩序导致了更好的语音和噪声分离 分布,从而使一个更加有效的歧视和 复杂性和性能之间的权衡。该算法 还集成了降噪块串联与 VAD与表明的,以进一步提高其准确性。阿前 降噪区块还提高了检测的准确性 言论和nonspeech。实验进行了分析 震旦的数据库和任务提供了广泛的性能 连同一份详尽的评估相比, 例如国际电联G729的,GSM的AMR的,外汇局和ETSI标准威斯为 分布式语音识别(DSR路由),和其他最近报告 威斯。 指数计算,噪声降低,稳健语音识别, 语音/ nonspeech检测,子带顺序统计滤波器。
129 评论(10)

相关问答