700字范文 > linux系统（ubuntu）调用科大讯飞SDK实现语音识别及语音合成

linux系统（ubuntu）调用科大讯飞SDK实现语音识别及语音合成

时间：2023-08-06 10:27:37

1.语音识别

登录科大讯飞官网，注册账号后转到“语音识别”栏目，下载SDK，如图：

我选择了语音听写和语音合成，都是在线的。选好后生成SDK，下载到本地，然后在linux系统中解压，并进入sample目录的iat_online_record_sample目录下。

执行 source 64bit_make.sh

此时会提示“alsa/asound.h:没有那个文件或目录”。解决办法：

sudo apt-get install libasound2-dev

然后就可以去../../bin目录下执行对应的可执行文件了。

ubutnu18的检查麦克风是否可用的设置在这里：

可以通过说话检测input level是否会随之变化。

进入到sample目录的tts_online_sample目录下。

执行 source 64bit_make.sh

然后就可以去../../bin目录下执行对应的可执行文件了。

它会根据源码中预设的文本合成语音，并生成wav文件在bin目录下。播放wav文件的方法是

安装sudo apt-get install soxsudo apt-get install libsox-fmt-all然后在C代码中写上{system("play tts_sample.wav");}就可以播放了。

于是我通过改这两个文件，合成了一个语音识别后将文字再合成语音播放出来，由于Makefile基本是相同的，因此将各自的main函数合到一起就可以了。

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。