700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > linux系统(ubuntu)调用科大讯飞SDK实现语音识别及语音合成

linux系统(ubuntu)调用科大讯飞SDK实现语音识别及语音合成

时间:2023-08-06 10:27:37

相关推荐

linux系统(ubuntu)调用科大讯飞SDK实现语音识别及语音合成

1.语音识别

登录科大讯飞官网,注册账号后转到“语音识别”栏目,下载SDK,如图:

我选择了 语音听写和语音合成,都是在线的。选好后生成SDK,下载到本地,然后在linux系统中解压,并进入sample目录的iat_online_record_sample目录下。

执行 source 64bit_make.sh

此时会提示“alsa/asound.h:没有那个文件或目录”。解决办法:

sudo apt-get install libasound2-dev

然后就可以去../../bin目录下执行对应的可执行文件了。

ubutnu18的检查麦克风是否可用的设置在这里:

可以通过说话检测input level是否会随之变化。

2.语音合成

进入到sample目录的tts_online_sample目录下。

执行 source 64bit_make.sh

然后就可以去../../bin目录下执行对应的可执行文件了。

它会根据源码中预设的文本合成语音,并生成wav文件在bin目录下。播放wav文件的方法是

安装sudo apt-get install soxsudo apt-get install libsox-fmt-all然后在C代码中写上{system("play tts_sample.wav");}就可以播放了。

于是我通过改这两个文件,合成了一个语音识别后将文字再合成语音播放出来,由于Makefile基本是相同的,因此将各自的main函数合到一起就可以了。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。