前言

当下，各类AI机器人火爆异常。其中，“小智AI聊天机器人”凭借特色语音功能，在业内广受赞誉。

尽管已有人把相关设备接入Home Assistant进行操控，可我关注的重点，是其背后的语音转文本技术。

在Home Assistant生态里，免费、易用且支持中文识别的语音转文本服务少之又少。

巧的是，我近期在逛小智开源项目时，发现了一项语音转文本技术。

令人惊喜的是，我在GitHub上发现有人提供了针对HassOS的开箱即用的解决方案。

两种方案

在中文语音识别领域，就我目前所知，有两个项目尤为适配中文语音识别任务。

其一，是阿里巴巴开源的FunASR；其二，则是我们今日即将介绍的Sherpa-onnx

项目地址

•https://github.com/modelscope/FunASR
•https://github.com/k2-fsa/sherpa-onnx

关联Home Assistant

在国内，热衷于Home Assistant且愿意开发相关功能的人员数量较少。

因而当我最初知悉FunASR的功能时，在开源社区中并没有找到将其与Home Assistant相关联的解决方案。

然而，经过一段时间后，我惊喜地发现，确实有HA玩家开发者成功将这一实用功能接入到Home Assistant中。

独立部署

该方案采用独立部署模式，其显著优势在于，即便使用Home Assistant的Core版本也能够正常运用。

用户只需完成服务部署，再安装相应插件即可使用。

虽说这对于HassOS用户而言，操作过程可能稍显不便，但总体而言，不失为一个相当出色的解决方案。

深度集成

鉴于当前我所使用的系统是HassOS，因此我更青睐于通过“加载项”的方式来进行安装。

如此一来，便能如同使用国外开源的语音识别加载项那样，在直接安装之后无需进行任何配置，即刻就能投入使用，这种方式既简便又高效。

我之所以推荐Sherpa-onnx，正是出于这方面的考量。因为它真的简单又方便，让我忍不住持续夸赞。

离线语音识别服务

在安装这个加载项之前，首先要确保我们的网络能够正常连接到相关服务。

由于这个镜像的体积较大，因此可能会花费较长时间来完成拉取操作。

添加存储库

https://github.com/ptbsare/home-assistant-addons

一般而言，我们可以在加载项商店右上角菜单里的“仓库”选项中，添加该项目的地址，完成添加后，便能在商店内对其进行安装与启动操作。

当然，除了这种方式之外，我们还可以借助项目文档中的添加按钮，依照相应指引步骤来进行安装。

安装

这个项目的操作使用十分简便，我认为唯一可能存在难度的环节，大概就是把镜像拉取到本地了。

在点击安装按钮后，想必会有不少朋友频繁遭遇超时失败的情况。

倘若大家碰到了这类问题，不妨像我一样，进入HassOS的内部终端，手动输入并执行拉取命令。

如此一来，不仅能够实时查看拉取进度，还能有效避免因经常超时带来的困扰。

启动

由于这是一项离线服务，因而只要我们成功地将镜像完整拉取至本地，启动操作便会变得轻而易举。

在启动该服务后，无需进行任何额外配置，即可在Home Assistant的集成页面中自动发现与之相关的配置项。

这是因为它完美适配了Home Assistant内部的语音转换协议，真正实现了开箱即用的便捷体验。

使用

当点击添加按钮后，在集成界面中会呈现出两个实体。

其中一个是STT语音转文本服务，另一个则是TTS文本转语音服务，这两项服务均属于离线模式。

随后，我们便可在Home Assistant的语音助手界面里，将这两个实体服务进行关联操作。

最后

当所有准备工作都妥善完成后，我们便能在HTTPS的安全环境下，借助麦克风来开启对Home Assistant的语音控制。

当然，除了这种方式外，我们还能通过Home Assistant的APP实现对语音功能的操控。

值得一提的是，这所有的语音控制操作都是完全免费的，并且在使用次数上没有任何限制，能够充分满足我们的使用需求。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

声界

智能语音技术速报

免费中文离线语音转文本服务，HassOS零配置开箱即用

前言

两种方案

项目地址

关联Home Assistant

离线语音识别服务

添加存储库

安装

启动

使用

最后