700字范文 > 语音识别危险驾驶方法计算机装置及计算机可读存储介质与流程

语音识别危险驾驶方法计算机装置及计算机可读存储介质与流程

时间：2022-09-03 16:27:25

本发明涉及智能控制领域，具体的，涉及一种语音识别危险驾驶方法、实现这种方法的计算机装置以及计算机可读存储介质。

背景技术：

随着智能汽车技术的发展，人们对智能汽车的要求越来越高。现有的一些智能汽车设置有一个车载机器人，例如在中控台上设置一个车载机器人。现在的车载机器人通常能够与车上的人员互动，例如车载机器人获取车辆的状态信息以及行驶信息，从而发出对应的提示信息。例如获取车上各个位置人员是否扣上安全带的信息，并且在判断某一座位上的人员没有扣上安全带，则发出提示信息，建议该人员扣上安全带。

另一方面，在驾驶领域，驾驶员的个人行为对驾驶安全带来重大影响，例如驾驶员疲劳驾驶、酒后驾驶等行为将严重影响驾驶安全，还会危害公共安全。为此，现有的一部分汽车上安装人脸识别系统，通过拍摄驾驶员的脸部表情，根据驾驶员的脸部表情来判断驾驶员是否存在疲劳驾驶或者酒后驾驶等危险行为。但是，由于驾驶员的脸部容易受到光照影响，例如在光照不足的场景难以拍摄清晰的脸部图像，影响判断的准确性，而且驾驶员头部转动后也不容易拍摄驾驶员的脸部，导致该方法难以准确判断驾驶员存在危险驾驶的行为。

此外，现在的另一部分汽车上安装酒精浓度测试仪，通过检测车厢内酒精浓度来判断驾驶员是否存在酒后驾驶的行为。但是，如果副驾驶位或者车内其他乘客有喝酒的行为，将容易导致酒精浓度测试仪的误判，也导致错误判断驾驶员是否存在危险驾驶的行为。

技术实现要素：

本发明的第一目的是提供一种通过语音的方式识别驾驶员是否存在危险驾驶行为的语音识别危险驾驶方法。

本发明的第二目的是提供一种实现上述语音识别危险驾驶方法的计算机装置。

本发明的第三目的是提供一种实现上述语音识别危险驾驶方法的计算机可读存储介质。

为实现本发明的第一目的，本发明提供的语音识别危险驾驶方法包括获取预设驾驶员录制的基准语音信息；对预设驾驶员进行身份认证后，发出读出预设文字或者语句的指示信息；获取预设驾驶员读出的预设文字或者语句，并识别当前的语音信息与基准语音信息的差异，根据差异判断预设驾驶员是否存在预设的危险行为，如是，限制车辆启动。

由上述方案可见，通过对比驾驶员在清醒状态下发出的语音信息并且作为基准语音信息，每次启动车辆前让驾驶员读出预设的文字或者语句，由于驾驶员在疲劳或者喝酒后，读出特定的文字通常会发音不清晰或者文字的发音时间较长，或者两个文字之间的间隔时间较长，因此，可以通过识别当前语音信息与基准语音信息之间的差异来判断驾驶员是否存在疲劳驾驶或者酒后驾驶的行为，如果存在上述危险行为，则限制车辆的启动，从而确保驾驶安全。

一个优选的方案是，预设的危险行为包括疲劳或者喝酒行为。

进一步的方案是，识别当前的语音信息与基准语音信息的差异包括：识别当前的语音信息与基准语音信息中对预设文字的发音清晰度的差异。

由此可见，通过对预设文字清晰度的识别，可以快速并且准确的识别出驾驶员是否存在疲劳驾驶或者酒后驾驶等危险行为。

一个可选的方案是，识别当前的语音信息与基准语音信息的差异包括：识别当前的语音信息与基准语音信息中对预设文字的发音时间的差异。

优选的，根据差异判断预设驾驶员是否存在预设的危险行为包括：判断当前的语音信息中预设文字的发音时间是否为基准语音信息中预设文字的发音时间的预设倍数。

由于驾驶员在疲劳或者喝酒后对特定文字的发音时间往往较长，通过对特定文字的发音时间的来判断是否存在危险驾驶的行为，可以提高判断的准确性。

一个可选的方案是，识别当前的语音信息与基准语音信息的差异包括：识别当前的语音信息与基准语音信息中相邻两个文字的发音间隔时间的差异。

进一步的方案是，限制车辆启动前，至少两次以上获取预设驾驶员读出的预设文字或者语句并识别当前的语音信息与基准语音信息的差异。

由此可见，通过两次以上的识别可以避免因单次识别而导致误判的情况，例如只有两次以上均识别认为驾驶员存在疲劳驾驶或者酒后驾驶的行为，才会限制车辆的启动，可以有效避免错误限制车辆启动而对驾驶员带来的麻烦。

更进一步的方案是，限制车辆启动后，获取预设驾驶员发出的解除限制请求指示，并判断是否获取预设终端发出的解除限制指令，如是，解除车辆启动的限制。

可见，在出现特殊情况下，可以通过第三方的终端设备向车载系统发出解除限制的指令，例如由第三方进行人工复核，驾驶员不存在危险驾驶的情况，可以由第三方通过预设的终端设备向车载系统发出解除限制的指令，减少对驾驶员不必要的影响。

为实现上是的第二目的，本发明提供的计算机装置具有处理器以及存储器，存储器存储有计算机程序，计算机程序被处理器执行时实现上述语音识别危险驾驶方法的各个步骤，或者执行上述语音识别危险驾驶方法的各个步骤。

为实现上是的第三目的，本发明提供计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述语音识别危险驾驶方法的各个步骤，或者执行上述语音识别危险驾驶方法的各个步骤。

附图说明

图1是本发明语音识别危险驾驶方法实施例所应用的车载机器人的结构示意图。

图2是本发明语音识别危险驾驶方法实施例所应用的车载机器人隐藏箱体后的结构示意图。

图3是本发明语音识别危险驾驶方法实施例所应用的车载机器人的支撑板与电路板的结构示意图。

图4是图3的局部放大图。

图5是本发明语音识别危险驾驶方法实施例的流程图。

以下结合附图及实施例对本发明作进一步说明。

具体实施方式

本发明的语音识别危险驾驶方法应用于汽车的车载系统上，例如，在汽车的中控台处设置一个车载机器人，由车载机器人实现语音识别危险驾驶方法。本发明的计算机装置是车载机器人的主控芯片，该计算机装置具有处理器以及存储器，存储器上存储有计算机程序，处理器通过执行该计算机程序实现语音识别危险驾驶方法。

参见图1，应用本发明的语音识别危险驾驶方法实施例的车载机器人具有一个箱体10以及头部20，其中头部20可以隐藏到箱体10内，也可以伸出到箱体10外，图1所示的状态是头部20伸出箱体10的状态。因此，在头部20相对于箱体10是可以升降的。本实施例中，头部20大致呈圆球状，且头部20上设置有一个护罩21，在护罩21内可以设置摄像装置，例如设置ccd传感器等，用于拍摄车上司乘人员的照片。此外，头部20内还可以设置拾音器以及扬声器，拾音器用于获取车上司乘人员的语音信息，而扬声器可以播放语音或者音乐等。这样，车载机器人可以接收司乘人员的语音并且可以反馈，从而实现与司乘人员的语音互动。

优选的，头部20内设置有一块面积较小的电路板，在该电路板上设置有一个处理器，并且，头部20的摄像装置、拾音器以及扬声器均电连接于该电路板上的线路，从而实现处理器与摄像装置、拾音器以及扬声器等器件的电连接。这样，摄像装置、拾音器获取的数据均传输至处理器，扬声器可以接收处理器的数据。

参见图2，箱体10内设置升级组件23以及一块支撑板11，优选的，支撑板11设置在箱体10内靠近底部的地方，参见图3与图4，在支撑板11的下方设置有一块电路板13，电路板13上设置有多个器件并形成多个功能电路，例如形成电源电路等，优选的，电路板13上设置有一个控制器，用于控制电路板13上多个器件的工作。

升降组件23包括一块支承板28，头部20固定在支承板28的上方，并且，在支承板28的两端分别设置有一个螺纹孔，并且在支撑板11的上方设置有两根螺杆26，螺杆26穿过支承板28两端的螺纹孔，当螺杆26转动时，将带动支承板28上下移动，从而实现头部20的升降。优选的，在支撑板11上设置两个电机(图中未示)，每一电机分别带动一根螺杆26转动，因此，电路板13上设置一个用于驱动电机工作的控制器，从而控制两个电机同步运动，确保两根螺杆同步旋转，确保支承板28保持与支撑板11平行，避免头部20相对于箱体10发生倾斜的情况。

为了确保头部20顺畅的移动，在支撑板11上设置两根限位杆24以及限位板25，限位板25的两端分别设置有一个通孔，一根限位杆24穿过一个通孔。从图2可见，限位杆24垂直于支撑板11，并且限位杆24的轴线与螺杆26的轴线平行。优选的，限位板25与支承板28固定连接，由于支承板28与头部20固定连接，因此限位板25也是与头部20固定，这样，限位板25随头部20的升降而升降。

这样，当螺杆26带动支承板28向上运动时，支承板28带动头部20向上运动，并由此带动限位板25相对于限位杆24向上运动，在限位杆24的限位作用下，头部20不会出现绕自身轴线旋转等情况。

在电路板13上设置一个控制器，优选的，该控制器可以控制诸如电机等多个器件的工作，并且，该控制器还用于控制车载机器人与汽车的控制器进行数据交互。并且，头部20内的电路板也需要与电路板13电连接，例如头部20内的处理器也需要与电路板13上的控制器实现电连接。

由于头部20相对于电路板13可以上下移动，为了确保头部20的移动不受影响，本实施例中，头部20与电路板13之间设置有一块柔性电路板27，通过柔性电路板27连接头部20内电路板以及电路板13，具体的，头部20内的处理器可以通过柔性电路板27内的电线与电路板13上的控制器进行数据交互。

本实施例中，车载机器人与汽车的控制器之间通过can总线实现数据交互，因此，在电路板13上设置有can总线接口电路，参见图3与图4，电路板13固定在支撑板11的下方，在电路板13上设置有电源接头14，用于连接车载电源，例如使用汽车点烟器的电源或者使用可充电电池提供的电源。电路板13上设置有can总线接口电路15，电路板13上的控制器与can总线接口电路15电连接并且接收can总线接口电路15传输的信号。

此外，车载机器人的箱体10内设置有can总线接头16，can总线接头16通过一根柔性的电缆线17与can总线接口电路15电连接。can总线接头16可以插入到汽车的中控台的can总线接头上，从而实现车载机器人与汽车中控台的电路连接。

由于现有的汽车电气系统内广泛应用can总线系统，因此只需要在汽车的中控台内设置一个can总线接头，并将汽车中控台上的can总线接头与车载机器人上的can总线接头16连接，如插入到车载机器人上的can总线接头16上，即可以将汽车的控制器的信号通过can总线传输至车载机器人的电路板13上的控制器，车载机器人的控制器可以与汽车的控制器实现数据交互。

另外，由于电路板13的控制器通过柔性电路板27与头部20内的电路板电连接，因此，头部20内的器件，包括拾音器、扬声器等均可以通过柔性电路板27以及can总线等向汽车的控制器发送信号，或者接收汽车控制器发送的信号，车载机器人可以获取汽车的行驶状态等信息，例如车上的某一个司乘人员没有扣上安全带等，从而通过扬声器等发出警示信息。

可见，本实施例的车载机器人通过can总线接头与汽车的can总线系统进行连接，在不影响汽车内饰美观性的情况下通过简单的方式实现与汽车控制器的数据交互，降低汽车与车载机器人数据交互的成本与难度。

语音识别危险驾驶方法实施例：

参见图5，车载机器人实现语音识别危险驾驶方法时，首先执行步骤s1，获取预设驾驶员录制的基准语音信息。首先，记录驾驶员的身份，例如由驾驶员在车载机器人上注册并登记身份信息，如设置驾驶员的姓名、编号等，注册的驾驶员即成为预设驾驶员。然后，车载机器人的显示屏上显示预设的文字或者语句，并让驾驶员读出所显示的文字或语句，接着，车载机器人通过拾音器接收驾驶员的语音信息，并将所接收的语音信息作为基准语音信息，并存储在本地存储器，或者上传至预设的服务器。优选的，预设的文字或者语句可以是多个文字或者多局语句，后续识别时，从多个文字或者多局语句中随机选取其中一个或者两个让预设驾驶员读出。

当预设驾驶员下一次坐到驾驶位并尝试启动车辆时，执行步骤s2，对预设驾驶员进行身份认证，例如对预设驾驶员进行人脸识别，或者使用驾驶员的指纹、虹膜等生物特征信息进行身份认证。使用驾驶员的生物信息进行身份认证，可以避免其他驾驶人员冒名顶替情况，确保驾驶安全。

在预设驾驶员通过身份认证后，发出读出预设文字或者语句的指示信息，例如在车载机器人的显示屏上显示需要预设驾驶员需要读出的文字或者语句。步骤s2中，可以从步骤s1所记录的多个文字或者语句中随机选取一个或者多个文字，或者随机选取一句或者多局语句让预设驾驶员读出。

然后，执行步骤s3，当驾驶员读出该文字或者语句时，通过拾音器接收预设驾驶员读出的预设文字或者语句。接着，执行步骤s4，识别当前所获取的语音信息以及基准语音信息的差异，并执行步骤s5，根据所识别的差异来判断预设驾驶员是否存在预设的危险行为，本实施例中，主要是针对疲劳驾驶以及酒后驾驶的行为进行识别，因此，所判断的危险行为主要是针对疲劳或者喝酒的行为。

由于人们在疲劳或者喝酒后，阅读指定的文字或者语句发音清晰度不准确，或者读出的相邻两个文字之间的时间间隔较长，又或者每一个文字的发音时间也较长，因此，可以识别当前语音信息的发音清晰度、相邻两个文字的发音间隔时间或者每一个文字的发音时间，可以判断预设驾驶员是否存在预设的危险行为。具体的，可以判断当前的语音信息中预设文字的发音时间是否为基准语音信息中预设文字的发音时间的预设倍数，如1.5倍或者2倍，如是，可以确认驾驶员可能存在危险行为。

如果步骤s5的判断结果为否，表示驾驶员不存在疲劳驾驶或者酒后驾驶的行为，则执行步骤s8，根据驾驶员的操作启动车辆。如果步骤s5的判断结果为是，则不一定确认驾驶员当前就是疲劳驾驶或者酒后驾驶，需要进行第二次判断，即执行步骤s6，再次指示驾驶员读出预设的文字或者语句，并再次获取驾驶员的语音信息。优选的，再次指示驾驶员读出的文字或者语句与步骤s2所指示驾驶员读出的文字或者语句不相同，这样，通过驾驶员先后两次读出的不同文字或者语句来判断驾驶员是否存在疲劳驾驶或者酒后驾驶的行为，识别结果更加准确。

在再次获取驾驶员的语音信息后，再次识别当前语音信息与基准语音信息的差异，并执行步骤s7，根据所识别的差异判断预设驾驶员是否存在预设的危险行为，如是，则执行步骤s9，限制车辆的启动，例如不允许发动机点火，否则，执行步骤s8，根据驾驶员的操作启动车辆。

当然，本实施例是执行两次的语音对比识别，实际应用时，可以通过三次或者更多次的语音对比识别，即三次以上获取驾驶员的语音信息，并将当前获取的语音信息与基准语音信息进行对比，进而识别驾驶员是否存在危险行为。

当然，如果存在紧急情况，或者车载机器人存在误判的情况，可以由第三方的终端设备进行解除车辆启动的限制。例如，驾驶员使用终端设备登录第三方网站，由第三方网站经人工复核，驾驶员不存在疲劳驾驶或者酒后驾驶的情况，则由第三方网站使用预设的终端设备向车载机器人发送解除限制的指令。

因此，限制车辆启动后，可以获取预设驾驶员发出的解除限制请求指示，车载机器人将执行步骤s10，判断是否接收到解除限制车辆启动的指令，如是，则执行步骤s11，解除对车辆启动的限制，驾驶员可以正常启动车辆，否则，保持对车辆的启动限制。

可见，本实施例是通过对驾驶员的语音进行识别来判断驾驶员是否存在危险驾驶的行为，相对于拍摄驾驶员脸部表情并进行识别的方式，本实施例能够避免因受到光照、驾驶员头部转动等影响到检测准确性的问题，能够提高危险驾驶行为检测的准确性。此外，相比起在车厢内安装酒精浓度检测仪，可以避免因车厢内其他人员喝酒而影响检测的准确性。

计算机装置实施例：

本实施例的计算机装置可以是车载机器人的控制系统，优选的，该控制系统包括车载机器人箱体内的电路板，电路板上设有控制器以及存储器，存储器中存储有可在控制器上运行的计算机程序，且控制器执行计算机程序时实现上述语音识别危险驾驶方法的各个步骤。

例如，计算机程序可以被分割成一个或多个模块，一个或者多个模块被存储在存储器中，并由处理器执行，以完成本发明的各个模块。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述计算机程序在终端设备中的执行过程。

车载机器人的控制器器可以是中央处理单元(centralprocessingunit，cpu)，还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现成可编程门阵列(field-programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，处理器是电器的控制中心，利用各种接口和线路连接整个电器的各个部分。

存储器可用于存储计算机程序和/或模块，处理器通过运行或执行存储在存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现电器的各种功能。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据电器的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(smartmediacard,smc)，安全数字(securedigital,sd)卡，闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

计算机可读存储介质实施例：

计算机装置的存储器所存储的计算机程序如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读出存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述语音识别危险驾驶方法的各个步骤。

其中，计算机程序包括计算机程序代码，计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括：能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

最后需要强调的是，本发明不限于上述实施方式，如对车载机器人语音识别的具体过程、车载机器人外观形状的改变等，这些改变也应该包括在本发明权利要求的保护范围内。

技术特征：

1.语音识别危险驾驶方法，其特征在于，包括：

获取预设驾驶员录制的基准语音信息；

对所述预设驾驶员进行身份认证后，发出读出预设文字或者语句的指示信息；

获取所述预设驾驶员读出的所述预设文字或者语句，并识别当前的语音信息与所述基准语音信息的差异，根据所述差异判断所述预设驾驶员是否存在预设的危险行为，如是，限制车辆启动。

2.根据权利要求1所述的语音识别危险驾驶方法，其特征在于：

所述预设的危险行为包括疲劳或者喝酒行为。

3.根据权利要求1或2所述的语音识别危险驾驶方法，其特征在于：

识别当前的语音信息与所述基准语音信息的差异包括：识别当前的语音信息与所述基准语音信息中对所述预设文字的发音清晰度的差异。

4.根据权利要求1或2所述的语音识别危险驾驶方法，其特征在于：

识别当前的语音信息与所述基准语音信息的差异包括：识别当前的语音信息与所述基准语音信息中对所述预设文字的发音时间的差异。

5.根据权利要求4所述的语音识别危险驾驶方法，其特征在于：

根据所述差异判断所述预设驾驶员是否存在预设的危险行为包括：判断当前的语音信息中预设文字的发音时间是否为所述基准语音信息中所述预设文字的发音时间的预设倍数。

6.根据权利要求1或2所述的语音识别危险驾驶方法，其特征在于：

识别当前的语音信息与所述基准语音信息的差异包括：识别当前的语音信息与所述基准语音信息中相邻两个文字的发音间隔时间的差异。

7.根据权利要求1或2所述的语音识别危险驾驶方法，其特征在于：

限制车辆启动前，至少两次以上获取所述预设驾驶员读出的所述预设文字或者语句并识别当前的语音信息与所述基准语音信息的差异。

8.根据权利要求1或2所述的语音识别危险驾驶方法，其特征在于：

限制车辆启动后，获取所述预设驾驶员发出的解除限制请求指示，并判断是否获取预设终端发出的解除限制指令，如是，解除车辆启动的限制。

9.计算机装置，其特征在于，包括处理器及存储器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至8任一项所述的语音识别危险驾驶方法的各个步骤。

10.计算机可读存储介质，其上存储有计算机程序，其特征在于：所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的语音识别危险驾驶方法的各个步骤。

技术总结

本发明提供一种语音识别危险驾驶方法、计算机装置及计算机可读存储介质，该语音识别危险驾驶方法包括获取预设驾驶员录制的基准语音信息；对预设驾驶员进行身份认证后，发出读出预设文字或者语句的指示信息；获取预设驾驶员读出的预设文字或者语句，并识别当前的语音信息与基准语音信息的差异，根据差异判断预设驾驶员是否存在预设的危险行为，如是，限制车辆启动。本发明还提供实现上述方法的计算机装置及计算机可读存储介质。本发明能够准确检测驾驶员是否存在疲劳驾驶或者酒后驾驶的情况，并且通过限制车辆启动的方式来减少安全事故的发生。

技术研发人员：韩子天;胡光耀

受保护的技术使用者：中山安信通机器人制造有限公司

技术研发日：.10.09

技术公布日：.01.14

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。