Uno degli sviluppi più utili derivati dal machine learning è la capacità di eseguire strumenti offline che possono fornire la trascrizione di testo in modo accurato da audio parlato e che possono leggere testi per te. Questi strumenti sono particolarmente utili in differenti .
In questo articolo, ti guiderò attraverso l’installazione di Speech Note, un potente strumento neurale per la sintesi vocale (TTS), la trascrizione vocale (STT) e la traduzione automatica, tutto eseguito localmente per garantire la tua privacy. Inoltre, configureremo il lettore di schermo Orca con Piper TTS per offrire uno strumento di accessibilità più moderno.
Cos’è Speech Note e come si installa?
Speech Note è un’applicazione che fornisce funzionalità di trascrizione e sintesi vocale avanzate. Ecco come installarla sul tuo Raspberry Pi:
- Installa Flatpak:
12$ sudo apt install flatpak$ flatpak remote-add --if-not-exists flathub https://flathub.org/repo/flathub.flatpakrepo - Riavvia il Raspberry Pi:
1$ sudo reboot - Installa Speech Note tramite terminale:
Conferma con “sì” tutte le richieste durante l’installazione.
1$ flatpak install speechnote - Configura le Lingue in Speech Note:
- Apri Speech Note dal menu “Sound & Video”.
- Vai al menu “Languages”, cerca “English” (e qualsiasi altra lingua necessaria) e seleziona i modelli che desideri utilizzare.
Come configurare Speech Note per la trascrizione e la sintesi vocale?
Ci sono diversi modi di configurare l’applicativo:
- Modelli di Trascrizione (Speech To Text):
- Utilizza OpenAI’s Whisper, preferibilmente il modello “English Whisper Small”.
- Modelli di Sintesi Vocale (Text To Speech):
- Consigliamo Piper Alba Medium, noto per la sua qualità sonora.
- Opzioni di Traduzione:
- Disponibili solo per alcune coppie di lingue. Puoi provare in base alle tue esigenze di traduzione.
- Esempio di Trascrizione:
- Scarica un file di test, ad esempio un audio di quattro secondi.
- In Speech Note, vai su File > Transcribe a file e apri il file scaricato. La trascrizione inizierà automaticamente.
Come integrare Piper con Orca per migliorare l’accessibilità?
Piper è un avanzamento significativo rispetto alle voci sintetizzate di eSpeak, offrendo una qualità vocale più naturale.
- Installa Orca:
1$ sudo apt install orca - Configura Piper:
- Clona il repository di Piper tools:
123$ cd Software$ git clone https://codeberg.org/MightyOwlbear/rpi-piper-tools.git$ sh install-spd-piper.sh - Inserisci la tua password per installare le dipendenze.
- Clona il repository di Piper tools:
- Configura Orca:
- Avvia Orca settings:
1$ orca -s - Nella scheda Voice, seleziona ‘piper-generic default voice’.
- Deseleziona ‘Break speech into chunks between pauses’ e clicca su Apply. Puoi anche regolare la velocità di lettura.
- Avvia Orca settings:
Quali sono i vantaggi dell’utilizzo di Piper rispetto ad altri sintetizzatori vocali?
I vantaggi sono:
- Qualità sonora migliorata: Piper offre una voce più naturale e piacevole.
- Migliore esperienza utente: Se usi principalmente una GUI, Piper può rendere l’interazione più gradevole.
- Compatibilità: Funziona con entrambi i sistemi Xorg e Wayland, anche se con prestazioni leggermente migliori su Xorg.
L’installazione e la configurazione di Speech Note e Piper sul tuo Raspberry Pi possono migliorare significativamente le capacità di trascrizione e sintesi vocale del dispositivo. Seguendo questi passaggi, potrai godere di strumenti avanzati mantenendo la tua privacy e migliorando l’accessibilità del sistema.
Iscriviti ai nostri gruppi Telegram
Link utili