
Intelligenza Artificiale significa anche fotografia. Quest’ultima, infatti, è un’invenzione relativamente recente in termini storici. Per gran parte dell’esistenza dell’umanità, abbiamo dovuto fare affidamento su illustrazioni e descrizioni per comunicarci immagini. Siamo, se non altro, narratori. Ma ora che tutti hanno sempre una macchina fotografica in tasca, parte di quella narrazione è andata perduta. Dato che lo stiamo facendo con tutto il resto, potremmo anche “scaricare” quella creatività sull’intelligenza artificiale. Questo è esattamente ciò che ha fatto Code Strong con questa “fotocamera” fai-da-te economica che utilizza un’intelligenza artificiale per descrivere le scene catturate.
Questo dispositivo ha una fotocamera, ma non scatta foto, almeno non per presentarle all’utente. Invece, le immagini catturate, vengono inviate a un’intelligenza artificiale per l’analisi. L’intelligenza artificiale guarda le foto e quindi genera una descrizione testuale di ciò che “vede”. Una volta completato, verrà visualizzata la descrizione su un piccolo schermo OLED affinché l’utente possa leggerla.
La fotocamera dispone di alcune modalità diverse, destinate a fornire diversi tipi di descrizioni. Uno, ad esempio, è quello che ti aspetteresti: un riassunto generale della scena. Un altro descrive il tempo in base agli indizi presenti nell’immagine. E un altro fornisce anche un’analisi delle persone, perfetta per il feedback sui selfie che non stanno ottenendo molta popolarità su Instagram. Non è la prima volta che vediamo un dispositivo come questo, ma l’implementazione di Code Strong si distingue perché è molto conveniente. Il componente chiave è un modulo ESP32-CAM, che è uno schermo dotato di telecamera per una scheda di sviluppo ESP32. Gli altri componenti includono uno schermo OLED, un cicalino per le notifiche e alcuni pulsanti per scattare foto e cambiare modalità. L’alimentazione arriva tramite USB da un banco di batterie portatile. Tutti questi componenti vanno su una piccola breadboard, quindi non richiede un PCB sofisticato o addirittura un involucro.
il firmware, programmato nell’IDE di Arduino, sfrutta i vantaggi dell’API di OpenAI. L’ESP32 si connette a una rete Wi-Fi predefinita e quindi, dopo aver catturato una foto, richiede all’API di generare una descrizione dell’immagine. Ulteriori suggerimenti, come “descrivi il tempo”, forniscono indicazioni per soddisfare i requisiti della modalità selezionata.
Acquistare le parti necessarie per questo progetto costerebbe solo circa 35 dollari, quindi è perfetto per le persone che vogliono sperimentare richieste di intelligenza artificiale e API con un budget limitato. Se volete cimentarvi nella realizzazione, trovate il codice sorgente a questo link GitHub.
Kit consigliati:
Link utili