SaraKIT è dotato di tre microfoni e di un processore audio specializzato che permette di elaborare la voce e supporta il riconoscimento vocale su Raspberry Pi da distanze fino a 16,4 piedi (5 metri). La soluzione mostrata utilizza uno strumento di riconoscimento vocale offline Vosk, utilizzato per il rilevamento della parola di attivazione e il riconoscimento dei comandi, e Piper per la generazione della voce – entrambi i programmi sono attualmente le migliori soluzioni offline Text to Speech (TTS) e Speech to Text (STT) per Raspberry Pi.
L’approccio offline permette di migliorare le performance.
Per maggiori dettagli su Piper, consulta il seguente sito. Mentre, per saperne di più su Vosk, controlla qui.
Installazione su SaraKIT
Assumendo che i driver di base di SaraKIT siano già installati (vedi come fare su Getting Started with SaraKIT). Puoi seguire questi passaggi per installare gli strumenti necessari:
1 2 3 4 5 6 7 8 9 |
sudo apt-get update sudo apt-get install -y python3-pip python3-pyaudio libasound2-dev libfmt-dev libspdlog-dev sudo pip3 install vosk piper-tts openai git clone https://github.com/SaraEye/SaraKIT-Voice-ChatGPT-Raspberry-Pi VoiceChatGPT cd VoiceChatGPT |
Prima di eseguire, sarà necessario inserire la tua chiave API di OpenAI, che puoi ottenere registrandoti sul sito web di OpenAI. Inserisci la tua chiave API nella linea:
1 |
client = OpenAI(api_key="LA_TUA_CHIAVE_API_QUI") |
Imposta la tua parola di avvio nella linea:
1 |
WakeWord="sarah" |
Se desideri cambiare la lingua dall’inglese o regolare la voce per Piper o Vosk, scarica e carica i modelli appropriati. Consulta le descrizioni su GitHub di Piper e Vosk per ottenere indicazioni.
Per eseguire VoiceChatGPT digita:
1 |
python VoiceChatGPT.py |
Inizialmente, la chat attende la parola di attivazione, di default “sarah”. Dopo averla riconosciuta, puoi chiedere qualsiasi cosa a ChatGPT, e risponderà verbalmente.
Questa configurazione crea un assistente vocale utilizzando le capacità di ChatGPT, SaraKIT e Raspberry Pi.
Utilizzando SaraKIT, possiamo costruire un dispositivo con supporto ChatGPT in un involucro stampato su una stampante 3D con la funzione di tracciamento e riconoscimento del volto dell’utente.
Gli effetti di questo semplice ma potente script possono essere visti nel video qui sotto.
Pan/Tilt Camera (o Base Turrett).
Pagina principale di SaraKIT.
SaraKIT Voice ChatGPT Raspberry Pi CM4 codice sorgente.
Iscriviti ai nostri gruppi Telegram
Link utili