语音识别之HTK重理解

爆炒小肥牛

发布时间 2024.04.09阅读数 141 评论数 0

语音识别之HTK重理解

趁着没开学，今天把语音识别中的隐马尔可夫模型相关训练重新跑了一遍，结合网络大佬的经验，对HTK工具的继续运行深入理解，重新训练了数据，并结合实际进行了更新和完善。

环境问题我就不说了，我默认已经是配置好的了。
今天还是孤立词，内容呢是
one，two，three，当然，后面自由发挥
首先进行数据的采集

rec -b 8 data/train/speech/01.wav
rec -b 8 data/train/speech/02.wav.....1

我这里录了十个one十个two十个three，保存在train的speech文件夹下
然后进行训练数据更改，结合前几篇的内容看
修改grammer为所需类别
修改codetrain.scp为训练文件路径和生成mfc路径
修改train.scp为为mfc路径
修改wordlist内容为训练文本列表
修改trainprompts训练所对应的文本，这个就相当于标注。

完成之后直接运行以下所有命令：

HParse ./config/grammer ./config/wordnet
HDMan -m -w ./lists/wordlist -n ./lists/monophones -g ./config/global.ded ./dict/dict_color ./dict/beep ./dict/otherDict
perl ./scripts/prompts2mlf ./labels/trainwords.mlf ./labels/trainprompts
HLEd -l '*' -d ./dict/dict_color -i ./labels/phones_color.mlf ./config/mkphones_color.led ./labels/trainwords.mlf 
HCopy -T 1 -C ./config/config_HCopy -S ./config/codetrain.scp
HCompV -C ./config/config_color -f 0.01 -m -S ./config/train.scp -M ./hmm0 ./config/proto
perl scripts/makeMacros hmm0/vFloors hmm0/macros
perl scripts/makeHmmdefs hmm0/proto lists/monophones hmm0/hmmdefs
perl scripts/makeMonoOffsp ./lists/monophones ./lists/monoOffSP
HERest -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm0/macros -H ./hmm0/hmmdefs -M ./hmm1/ ./lists/monoOffSP
HERest -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm1/macros -H ./hmm1/hmmdefs -M ./hmm2/ ./lists/monoOffSP
HERest -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm2/macros -H ./hmm2/hmmdefs -M ./hmm3/ ./lists/monoOffSP
perl ./scripts/fixSil hmm3/hmmdefs hmm4/hmmdefscp hmm3/macros ./hmm4/macros
HHEd -H ./hmm4/macros -H ./hmm4/hmmdefs -M hmm5/ config/sil.hed ./lists/monophones
HLEd -l '*' -d ./dict/dict_color -i ./labels/phones_color.mlf ./config/mkphones_color_HLEd.led ./labels/trainwords.mlf
HERest -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm5/macros -H ./hmm5/hmmdefs -M ./hmm6/ ./lists/monophones
HERest -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm6/macros -H ./hmm6/hmmdefs -M ./hmm7/ ./lists/monophones1234567891011121314151617

Hparse命令进行创建一个词网络，用以描述词与词之间的转移，grammer为修改后的语法，wordnet为生成的网络
HDMan建立词典，基于前面的beep和otherDict，生成了dict_color字典
HLEd转换成mlf
HCopy提取特征参数
HCompV扫描所有的训练数据，得到均值方差
训练0-7
HERest进行重估
完成之后，在相关文件夹里会有新生成文件。
接下来进行测试
我在这里改成了先录音，在转mfc，在测试然后显示
录音

rec -b 8 data/test/speech/test.wav

转换

HCopy -T 1 -C ./config/config_HCopy -S ./config/codetest.scp

识别

HVite -H ./hmm7/macros -H ./hmm7/hmmdefs -C ./config/config_color -S ./config/test.scp -l '*' -i ./results/recout.txt -w ./config/wordnet -p 0.0 -s 5.0 ./dict/dict_color ./lists/monophones

显示

cat ./results/recout.txt |tail -n +3|head -n 3

最终可以看到，显示识别结果是two，是没有问题的。

语音识别模型训练 HTK

转载原出处：

打赏 0

上一篇：Opencv3从头开始（十）Harris角点检测

下一篇：蓝桥杯单片机学习过程记录（二）独立按键

语音识别之HTK重理解

爆炒小肥牛

语音识别之HTK重理解

为你推荐

精选python 弧度制和角度制相互转换（math库和numpy库）；计算反正余弦正切值

【openwrt学习笔记】dnsmasq源码阅读

2 Go语言JSON与XML解析与表单操作

SOCKET,TCP,HTTP之间的区别与联系

精选观世界赛事，品足球人生--2022世界杯

Linux系统下imx6ull QT编程—— C++继承（五）

关于作者

爆炒小肥牛

41

0

300

3

Ardupilot之Gazebo仿真实现及控制

Opencv3从头开始（一）图像读取、保存、显示

精选Opencv3从头开始（二）图像的线性混合

相关推荐

工业机器人（5）-串口通信技术与MODBUS协议

关于freeRTOS的准备工作——freeRTOS学习记录001

【Spring源码】@Import注解探究（加载配置类、ImportSelector、ImportBeanDefinitionRegistrar）

Python开发手机App——（一）环境配置

Numpy从入门到精通——详解广播机制

精选免费可用的GPU

热门泡泡

30积分失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

语音识别之HTK重理解

爆炒小肥牛

语音识别之HTK重理解

为你推荐

精选python 弧度制和角度制相互转换（math库和numpy库）；计算反正余弦正切值

【openwrt学习笔记】dnsmasq源码阅读

2 Go语言JSON与XML解析与表单操作

SOCKET,TCP,HTTP之间的区别与联系

精选观世界赛事，品足球人生--2022世界杯

Linux系统下imx6ull QT编程—— C++继承（五）

评论（0）

关于作者

爆炒小肥牛

41

0

300

3

Ardupilot之Gazebo仿真实现及控制

Opencv3从头开始（一）图像读取、保存、显示

精选Opencv3从头开始（二）图像的线性混合

相关推荐

工业机器人（5）-串口通信技术与MODBUS协议

关于freeRTOS的准备工作——freeRTOS学习记录001

【Spring源码】@Import注解探究（加载配置类、ImportSelector、ImportBeanDefinitionRegistrar）

Python开发手机App——（一）环境配置

Numpy从入门到精通——详解广播机制

精选免费可用的GPU

热门泡泡

30积分 失眠，聊聊自己搞ROS的心得体会吧

ros学习路线

30积分 TF_REPEATED_DATA ignoring data错误

各位大佬，有什么ROS定位算法推荐吗

5积分 想买能用ROS2的开发套件。或者开发板

5积分 ros中启动gazebo时报错

给作者打赏

忘记密码

修改头像

添加你感兴趣的标签

举报类型（必选）

举报详情（选填）

30积分失眠，聊聊自己搞ROS的心得体会吧

5积分想买能用ROS2的开发套件。或者开发板