5.2.1 语音活动检测
功能介绍
本节介绍如何使用语音活动检测(Voice Activity Detection, VAD)模型,实现对人声的自动检测并控制录音行为。系统将在检测到语音时启动录音,在检测到静音时自动停止。
项目代码仓库:⭐ Bianbu AI Demo Zoo | NLP
准备工作
下载模型文件
wget -O ~/.cache/sensevoice.tar.gz https://archive.spacemit.com/spacemit-ai/openwebui/sensevoice.tar.gz
tar -xzf ~/.cache/sensevoice.tar.gz -C ~/.cache
rm ~/.cache/sensevoice.tar.gz
克隆仓库代码
git clone https://gitee.com/bianbu/spacemit-demo.git
安装依赖环境
sudo apt update
sudo apt install onnxruntime python3-spacemit-ort
sudo apt install python3-numpy
sudo apt install python3-pyaudio