推荐专题：

700字范文 > kaldi中文语音识别thchs30模型训练

kaldi中文语音识别thchs30模型训练

时间：2023-07-17 07:56:44

相关推荐

kaldi中文语音识别thchs30模型训练

1.准备thchs30中文数据集

今天开始做语言模型啦，数据集采用的是清华大学的中文数据集thchs30，下载地址在/18/ ，由于是在服务器做训练，以下步骤均采用shell语句进行。

1.1 在服务器上使用shell命令（wget -P 目录网址）下载thchs30,并保存到指定文件（egs/thchs30/s5/thchs30-openslr）

1.2解压在thchs30-openslr下

2.修改脚本

2.1修改thchs30/s5文件夹下的cmd.sh:先找到s5 目录下的cmd.sh，右键编辑，将内容更改为：

2.2修改thchs30/s5文件夹下的run.sh: 先找到s5 目录下的cmd.sh，右键编辑，将内容更改为：

3.开始语言模型训练

Shell语句cd到s5，运行run.sh：

4.总结

以下主要针对run.sh脚本命令及结果进行解读，这个过程主要是：数据准备，特征提取，monophone单音素训练， tri1三因素训练， trib2进行lda_mllt特征变换，trib3进行sat自然语言适应，trib4做quick，后面就是dnn了。目前我只跑到了monophone单音素训练，因此只讲解到monophone单音素训练，后续过程以后再讲。

4.1数据准备

4.2特征提取

梅尔倒谱系数（Mel-scale Frequency Cepstral Coefficients，简称MFCC），对于语音特征参数MFCC提取过程详解，有一位博主写的很详细，这里就不详述了，链接为：/jamesju/blog/193343

4.3准备发音词典和训练语言模型

4.4训练monophone模型和解码

train_mono.sh用法和其中的参数设置，训练单音素的基础HMM模型，迭代40次，并按照realign_iters的次数对数据对齐。

thchs-30_decode.sh测试单音素模型，实际使用mkgraph.sh建立完全的识别网络，并输出一个有限状态转换器，最后使用decode.sh以语言模型和测试数据为输入计算WER.

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

相关阅读

kaldi 的安装和thchs30语音识别测试

2021-05-12

语音识别实践 Kaldi下跑清华30小时例程（thchs30）笔记

2023-10-20

python语音识别库kaldi_Kaldi 使用 DFSMN 训练语音模型

2021-11-10

（八）kaldi thchs30 单音素模型训练（line 62-68)

2024-08-16

扩展阅读

: 腾讯云发布专属语音识别模型支持韩语粤语

: 「NLP」用于语音识别（分词的隐马尔科夫模型HMM）

: OpenAI最新无监督语言模型有助于AI写作助理和语音识别系统

: 超越整句的流式多级Attention：解密百度输入法背后的语音识别模型

: 语音自训练平台正式上线零代码训练提升业务场景语音识别率

: 这款文字转语音工具不仅转换中文还可以识别英文

最近发布

论狼文化的可学之处700字作文素材大全

2024-09-01

传承中华美德共铸精神家园700字作文素材大全

2024-09-01

有关端午节的初一年级精选范文五篇700字

2024-09-01

人生格言警句大全700字

2024-09-01

2篇700字的记叙文

2024-09-01

同学帮助我讲题作文700字

2024-09-01

推荐专题

同学二三事作文700字我的老师700字我的老师700字作文我也是一束阳光700字我的母亲作文700字初二三国演义读后感700字给同学的一封信700字成长的烦恼作文700字告别作文700字看见作文700字我是中学生作文700字陪伴700字作文经历作文700字雷雨读后感700字禁毒作文700字