Riceviamo da Marco Maggiotti questa interessante serie di articoli sul sistema MIC ReSpeaker 4 di SeeedStudio per AI e voice recognition.
Ho comprato un simpatico Hat del Raspberry che volevo guardare insieme a voi, il ReSpeaker 4-mic Array.
Di cosa si tratta
Una carta d’espansione quad-microphone per Raspberry PI designed, progettata interamente con lo scopo di servire applicazion di AI e Voice Recognition, WHAT !?!?! R U SERIOUS ?! ABSOLUTELY !!!
Cosa vuol dire questo ? Che non é un microfono che puoi prendere da qualunque parte, che serve per tutti gli usi, che puoi usare per il tuo pc per fare streaming o recording; no, se vuoi creare applicazioni dedicate al riconoscimento vocale su Raspberry, questo prodotto é dedicato e costruito appositamente per questo specifico utilizzo.
Dalle informazioni del produttore si evince che ReSpeaker 4 puó essere uno strumento molto piú potente di Alexa e Google Assistant. Da un certo punto di vista potrebbe dare un vantaggio di capacità già in partenza, comunque questo ci dice che se vogliamo spingere sulle performance questo potrebbe essere lo strumento giusto, in seguito vedremo il perché ed anche il vantaggio software.
Un piccolo punto di vista comunque é che se volete provare a giocare un pó con il riconoscimento vocale, vi consiglio prima di sperimentare un normale microfono usb, anche sul vostro pc per poi salire di livello.
Rriassumendo non fate come me che ho la pessima abitudine di comprare prodotti già avanzati per l’utilizzo che devo farci, pensando che mi serviranno ma che poi restano nel cassetto per anni…
Comunque non preoccupatevi, piú avanti presenterò diversi tutorial su come prototipare applicazioni su PC per poi passarle su Raspberry con le dovute cautele, e preparare un “pacchetto” che sia facile da installare poi su un dispositivo meno performante del pc, come il Raspberry appunto.
Specifiche
- AC108 Quad-channel ADC con I2S/TDM per ascolto in un raggio di 3 metri
- Anello di led con 12 led programmabili APA102
- Grove interface I2C connessa con I2C-1
- Grove interface porta digitale connessa con GPI012/13
Cosa vogliono dire tutte queste sigle? Il vantaggio di conoscere i componenti potrebbe venire utile in una fase avanzata dei progetti quando si vorrà approfondire le librerie o magari quando si avranno dei problemi ed errori e capire come sistemarli “FIXARLI”.
AC108 si riferisce al convertitore analogico digitale a 4 canali in grado di lavorare al meglio con i protocolli di gestione audio !2S. Di interfaccia interfaccia grove, caratteristica dei prodotti Seeed Studio, ne abbiamo parlalto in passato. I pin GPIO12 e 13 sono connessioni PWM.
Quello che possiamo dire é che questa scheda permette di fare davvero tante cose anche solo con il software algorithm già preinstallato.
Il software algorithm ci permette di :
- VAD ( Voice Activity Detection ) Riconoscimento di attività vocali
- DOA ( Direction of Arrival ) Direzione di arrivo vocale
- KWS ( Keyword Search ) identificazione parole ed indicazione della direzione con il LED ring.
Uff… che bomba !!! Insomma qua abbiamo tutto quello che ci serve per sperimentare nuove applicazioni e giocarci come se non ci fosse un domani.
Sin qui la presentazione. Dal prossimo venerdìinizieremo a “sporcarci le mani” con il prodotto, mostrando una serie di interessanti idee per sviluppare progetti legati all’apprendimento automatico ed alla domotica I0T intelligente. A risentirci tra 7 giorni!
Link utili:
Join our groups on Telegram…