700字范文 > 小程序语音识别+php 微信小程序之语音识别(附小程序+服务器源码)

小程序语音识别+php 微信小程序之语音识别(附小程序+服务器源码)

时间：2024-06-10 06:20:25

1、概述

通过微信小程序wx.startRecord()和wx.stopRecord()接口录音并上传silk录音文件至服务器，通过ffmpeg将silk录音文件转成wav录音文件，再通过百度语音识别 REST API 获取语音识别后的结果。

2、代码实现

录音和语音文件上传

//index.js

//开始录音。当主动调用wx.stopRecord，

//或者录音超过1分钟时自动结束录音，返回录音文件的临时文件路径。

//当用户离开小程序时，此接口无法调用。

wx.startRecord({

success: function (res) {

console.log('录音成功' + JSON.stringify(res));

that.setData({

voiceButtonName: '语音识别',

voicePlayButtonName: '开始播放',

tempFilePath: res.tempFilePath

})

//上传语音文件至服务器

wx.uploadFile({

url: 'https://你的域名/upload',

filePath: res.tempFilePath,

name: 'file',

// header: {}, // 设置请求的 header

formData: {

'msg': 'voice'

}, // HTTP 请求中其他额外的 form data

success: function (res) {

// success

console.log('begin');

console.log(res.data);

var json = JSON.parse(res.data);

console.log(json.msg);

var jsonMsg = JSON.parse(json.msg);

console.log(jsonMsg.result);

wx.navigateTo({

url: '../voicePage/voicePage?voiceData=' + jsonMsg.result.join('')

})

fail: function (err) {

// fail

console.log(err);

complete: function () {

// complete

}

})

fail: function (res) {

//录音失败

that.setData({

voiceButtonName: '语音识别'

})

console.log('录音失败' + JSON.stringify(res));

}

})

setTimeout(function () {

//结束录音

wx.stopRecord()

}, 60000)

node.js服务端接收语音文件代码

//upload.js

//使用koa-multer这个组件

var multer = require('koa-multer');

var router = require('koa-router')();

var path = require('path');

//存储文件至path.resolve('./voice-file')路径

var upload = multer({ dest: path.resolve('./voice-file')});

router.post('/', upload.single('file'), async function (ctx, next) {

//这是就文件的具体信息

console.log(ctx.req.file);

});

silk文件转wav文件

我使用的是

silk-v3-decoder 使用方法

//upload.js

var exec = require('child_process').exec;

function silkToWav(file){

return new Promise(function (resolve, reject) {

exec('sh converter.sh ' + file + ' wav', function(err,stdout,stderr){

if(err) {

resolve({

result : false,

msg : stderr

});

} else {

//var data = JSON.parse(stdout);

console.log(stdout);

console.log(stderr);

//console.log(err);

resolve({

result : true,

msg : ''

});

}

});

}

百度语音识别 REST API识别wav文件

1、通过API Key和Secret Key获取的access_token

通过API Key和Secret Key获取的access_token文档

//speech.js

speech.getAccessToken = function(){

return new Promise(function (resolve, reject) {

request({

url: '/oauth/2.0/token?grant_type=client_credentials&client_id=(你自己的API key)&client_secret=(你自己的Secret Key)',

method: 'get',

headers: {

'content-type': 'application/json'

}

}, function (error, response, data) {

if (error){

resolve({

'result' : false,

'msg' : '出现错误: ' + JSON.stringify(error)

});

}else {

resolve({

'result' : true,

'msg' : data

});

}

});

}

2、通过token 调用百度语音识别 REST API识别接口

//speech.js

speech.recognize = function(base64String, size){

return new Promise(function (resolve, reject) {

request({

url: '/server_api',

method: 'post',

headers: {

'content-type': 'application/json'

// len + speech方式

body: JSON.stringify({

"format":"wav",

"rate":16000,

"channel":1,

"token":'(你的token)',

"cuid":"9e:eb:e8:d4:67:00",

"len":size,

"speech":base64String

})

//url + callback方式

//body: JSON.stringify({

// "format":"wav",

// "rate":16000,

// "channel":1,

// "token":'(你的token)',

// "cuid":'9eebe8d46700',

// "url":'http://ihealth-wx./download?name=123.wav',

// "callback":'http://ihealth-wx./callback'

//})

}, function (error, response, data) {

if (error){

resolve({

result : false,

msg : '出现错误: ' + JSON.stringify(error)

});

}else {

resolve({

result : true,

msg : data

});

}

});

}

3、语音识别优化

通过上述操作后，发现识别的内容和实际内容差别很大

百度语音识别 REST API文档

查看文档可知：采样率：8000/16000 仅支持单通道

在ffmpeg里对应的设置方式分别是：

-ar rate 设置采样率

-ac channels 设置声道数

修改converter.sh文件，修改为下图所示

修改后的converter.sh文件

4、如何还不明白，怎么办？

请私信我或者下载源码

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。