Chi ha detto che il making e il public speaking sono due ambiti totalmente diversi? Parlare in pubblico implica mantenere l’uditorio costantemente impegnato calamitando l’attenzione su ciò che si sta dicendo, e nulla interrompe quel livello di concentrazione più velocemente dell’uso di parole “riempitive” come “uh“, “um“, “cioè” e affini. Per addestrare le persone a evitare l’utilizzo di certi intercalari, Benedikt Groß, Maik Groß e Thibault Durand hanno lavorato insieme per creare il progetto “Mind the ‘Uuh‘”, che mira a contare il numero di volte in cui viene pronunciato un intercalare e ad avvisare l’oratore. In tal modo, il dispositivo spera di addestrare le persone a ridurre la loro dipendenza da parole non necessarie.
Il rilevamento delle parole chiave richiede un’ampia potenza di elaborazione, motivo per cui il team ha scelto un Arduino Nano 33 BLE Sense. Ancora meglio, il suo microfono integrato elimina la necessità di collegarne uno esterno. Il contatore è un display standard a quattro cifre e sette segmenti ed è controllato da un registro a scorrimento 74HC595 e un registro a scorrimento TPIC6B595 Il contatore viene azzerato premendo un pulsante rosso e vengono emessi avvisi ogni volta che il servomotore si muove per far suonare un campanello.
Dopo aver assemblato i circuiti, il team è passato all’aspetto firmware del progetto che avrebbe consentito il rilevamento di determinate parole. 1500 campioni del suono “uuh” sono stati raccolti a una frequenza di 16 kHz e con una durata compresa tra 300 ms e 1 secondo. Una volta raccolti all’interno di Edge Impulse Studio, sono stati fatti passare attraverso un filtro MFCC (Mel Frequency Cepstral Coefficient), che isola le frequenze a cui comunicano gli esseri umani. Infine, i campioni ora elaborati sono stati utilizzati per addestrare una rete neurale Keras e quindi esportati sia come libreria Arduino che come pacchetto Web Assembly. In questo caso il lavoro di making ha richiesto sviluppi su più livelli concatenati.
Poiché la stragrande maggioranza delle persone non ha accesso ai componenti esatti che il team ha selezionato per il proprio progetto, ha creato una semplice applicazione Web che utilizza lo stesso modello della sezione precedente ma all’interno di un browser Web. Ciò significa che chiunque abbia un dispositivo abilitato a Internet e un microfono può provare a dire “uuh” e ricevere un piccolo avviso in risposta. Per testare il loro nuovo dispositivo, il team ha pronunciato diverse frasi con la parola “uhh” ripetuta. Come previsto, il modello è stato in grado di determinare con successo quando è stato detto, e questo significa che potrebbero essere incluse anche altre parole in futuro. A questo proposito, occorre precisare che a seconda della lingua utilizzata occorrerà campionare tutta una serie di intercalari e parole riempitive differenti.
Volete saperne di più su questo progetto? Potete consultare il repository GitHub qui.
Join our groups on Telegram…