Hai presente quelle volte in cui sei a una festa a cui non vuoi davvero essere presente e fissare un muro bianco è più attraente che socializzare? Per una telecamera ad alta risoluzione, quel muro bianco apparentemente noioso è in realtà una ricchezza di informazioni che possono essere utilizzate per capire quante persone sono in una stanza e cosa stanno facendo.

Appena un mese dopo che i ricercatori dello Stanford Computational Imaging Lab hanno rivelato una tecnica in cui un singolo raggio laser sparato in una stanza attraverso un piccolo foro nel muro potrebbe essere usato per generare immagini di oggetti nella stanza, un team del Massachusetts Institute of Technology ha pubblicato ricerca su un approccio diverso per capire cosa sta succedendo in una stanza quando non si può effettivamente vedere al suo interno – o almeno vedere chi c’è dentro e cosa stanno facendo.

Non è sempre evidente ad occhio nudo, ma in una stanza con anche una sola fonte di luce, ogni parete è immersa nelle ombre: alcune in movimento, altre statiche, alcune morbide e altre con bordi duri. A seconda di dove si trova la fonte di luce, visualizzare le ombre e ricavarne informazioni significative può essere quasi impossibile, ma i ricercatori del MIT hanno usato una videocamera ad alta risoluzione con eccellenti prestazioni in condizioni di scarsa luminosità (la quantità di rumore del sensore deve essere la minima possibile) per catturare abbastanza filmati di un pozzo vuoto che tecniche di elaborazione speciali sono state in grado non solo di vedere i movimenti dell’ombra, ma di estrapolare chi li stava creando.

La tecnica inizia puntando una videocamera su un muro in una stanza dove le persone che si muovono non sono viste dalla videocamera stessa, solo il muro. Il filmato catturato viene poi mediato in modo che le ombre in movimento proiettate dagli esseri umani siano eliminate mentre le ombre proiettate da oggetti fermi, come i mobili, vengono conservate, creando essenzialmente un riferimento di base di come appare il muro illuminato nella stanza quando non c’è nessuno.

I ricercatori hanno poi fatto essenzialmente la stessa cosa in una stanza diversa con una parete diversa, ma con un numero specifico di persone che fanno azioni e movimenti molto specifici. Questo filmato è stato utilizzato per addestrare una rete neurale in modo che fosse in grado di riconoscere quali movimenti d’ombra erano prodotti da quali azioni e quante persone li stavano facendo. Una volta addestrata, la rete neurale è stata in grado di fare queste deduzioni su filmati di qualsiasi parete vuota (non importa se era completamente pulita o se aveva dettagli come cornici di porte, interruttori della luce, ecc.) con un’impressionante precisione del 94,4% nel contare le persone nella stanza, e del 97,3% nel riconoscere la loro attività specifica.

È ora di tenere chiuse le tende 24 ore su 24, 7 giorni su 7? Non ancora. Come con la maggior parte degli approcci che si basano su reti neurali, il sistema deve essere addestrato a quali azioni dovrebbe riconoscere, e mentre non c’è un numero infinito di cose che si possono fare in una stanza, cercare di addestrare una IA su tutte le possibilità è semplicemente impossibile. Tuttavia, c’è la possibilità di addestrarlo su attività illecite in particolare, ma è difficile dire se la tecnica è abbastanza intelligente da riconoscere qualcuno che consegna una valigia piena di soldi come tangente.

Il sistema può anche essere reso completamente inutile in presenza di luce tremolante, come da una candela, o un televisore nella stanza. L’intensità della luce che cambia costantemente rende impossibile discernere le ombre create dal movimento rispetto a quelle create dallo sfarfallio. Le prestazioni sono anche scarse in stanze scarsamente illuminate, il che è probabilmente una limitazione che deriva dalle attuali capacità delle videocamere, quindi se non volete che qualcuno vi spii, o tenete le luci spente, o cambiate tutte le vostre lampade con dei candelabri.

.

Source link