一款开源的语音对话助手:百聆,通过ASR+LLM+TTS实现,时延800ms

一款开源的语音对话助手:百聆,通过ASR+LLM+TTS实现,时延800ms,低配置也可运行,支持打断。无需GPU,通过优化,可本地部署,仍能提供类GPT-4的性能表现。模块化设计,ASR、VAD、LLM和TTS模块相互独立,可以根据需求进行替换和升级。支持记忆功能,具备持续学习能力,能够记忆用户的偏好与历史对话。

参考文献:[1] github:https://github.com/wwbin2017/bailing[2] bailing 实时对话:https://www.zhihu.com/zvideo/1818994917940260865


永久福利 直投简历
简历投递:join@speechhome.com
扫码关注我们
助力AI语音开发者的社区