Smart TV: la nuova frontiera del riconoscimento vocale

La convergenza passa anche dalle interfacce: la classica contrapposizione tra tastiera e telecomando, che finora più di ogni altra ha sancito la differenza (tecnologica, ma anche e soprattutto di mercato) tra il mondo dell’informatica e quello dell’elettronica di consumo, sta per evaporare in favore di nuove soluzioni.

Le esigenze di semplificazione, che vengono da una rete sempre più diffusa e sempre meno aperta, spingono verso l’adozione di sistemi di interazione cosiddetti “naturali”, che coinvolgono l’utilizzo dei gesti o della voce. Il touch screen, antica invenzione sdoganata da Apple, nella sue sempre più sofisticate evoluzioni “gesture”, sta spopolando nei dispositivi mobili, risultando insuperata per facilità e rapidità di utilizzo. Chiaro però che difficilmente si può ipotizzare di applicare uno schermo tattile su un televisore, viste le ben diverse modalità di utilizzo del noto elettrodomestico. Ecco quindi che appare l’incarnazione virtuale del touch screen, ovvero le interfacce sensibili ai movimenti del corpo (la più conosciuta è Kinect di Microsoft), che traducono i gesti compiuti nello spazio libero tramite telecamere e sensori, e permettono di rimanere alla giusta distanza dall’apparecchio controllato, pur mantenendo l’approccio naturale e istintivo. Per un certo periodo è sembrato che potesse essere questa la soluzione vincente per sostituire il vetusto telecomando, poi però è ritornato in auge un altro fantasma dell’informatica: il controllo vocale. E’ noto a tutti gli addetti ai lavori che le applicazioni software di riconoscimento della voce umana sono disponibili da almeno quindici anni, e sono in grado di funzionare su qualsiasi personal computer; però nessuno, a meno di ovvi casi di necessità, se l’è filate un granché per tutto questo tempo. Fino a quando, manco a dirlo, è arrivata la casa della mela morsicata. Chi non ha sentito parlare di Siri, l’assistente vocale degli smartphone Apple, protagonista di epiche narrazioni su presunte capacità di intelligenza artificiale, abile conversatore sui più disparati argomenti, ultimamente anche partner di John Malkovich in un affascinante spot? Non a caso pare che un ruolo decisivo l’abbia giocato il know-how di Nuance, software house con lunga esperienza nei sistemi di riconoscimento della voce, che grazie all’IPhone 4s ha visto rinascere un mercato che sembrava destinato a rimanere di nicchia. In più, i periodici rumors che filtrano sulla Apple TV, mitico e sfuggente apparecchio televisivo sempre sul punto di essere lanciato sul mercato dal colosso di Cupertino, propagandano come uno degli aspetti più innovativi del prodotto proprio l’adozione dell’interfaccia vocale. Gli ultimi sviluppi della vicenda vedono così la fuga in avanti dei grandi produttori orientali di elettronica di consumo: LG, Samsung, Panasonic, ecc. si stanno affannando a presentare nuovi modelli in grado di obbedire agli ordini dei telespettatori. E anche Google, naturalmente, ci sta pensando. Limitarsi del resto a sostituire le voci di un menu o i tasti di un telecomando con i corrispondenti comandi vocali non sarà certo sufficiente. Lascia un po’ perplessi, infatti, vedere, nelle dimostrazioni d’uso di questi gioielli tecnologici, gente che pronuncia “volume up”, “volume down” o “1031” per cambiare canale, cose che probabilmente continuano a farsi meglio e più rapidamente con un sano telecomando. La sfida invece starà proprio nel riconoscimento del linguaggio naturale, in quel minimo di (simulata) intelligenza artificiale che sarà in grado di rispondere a domande del tipo “quando trasmettono CSI?” oppure “che tempo farà domani?”. Caratteristica delle TV convergenti, infatti, è proprio quella di essere “smart”, intelligenti: avere le potenzialità di un computer, senza l’ostacolo della complessità d’uso. Dispositivi destinati a diventare semplici ma versatili canali di output per flussi multimediali sempre disponibili: in rete, nei server di casa nostra o magari nel cloud di qualche grande fratello dell’intrattenimento multimediale. Apple docet: la tendenza per ora è, infatti, quella di confinare tutto all’interno di walled garden legati ai brand dei produttori e/o degli over-the-top coinvolti con i loro servizi, in modo da poter garantire maggiore affidabilità e anche (o soprattutto) maggior controllo sui contenuti. Si conferma che la sempre più spinta commercializzazione di internet è il prezzo che dovremo pagare per avere a portata di mano (e di voce) tutti quei servizi a cui la rete stessa ci ha abituato e di cui ora non possiamo più fare a meno. (E.D. per NL)
printfriendly pdf button - Smart TV: la nuova frontiera del riconoscimento vocale