OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?

distance - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?

Decidere quali film o serie tv produrre è una delle chiavi di successo nel competitivo mercato degli Over The Top. Nel caso di Netflix l’algoritmo di Machine Learning (ML) è essenziale nella scelta dei contenuti da produrre. E di conseguenza nella decisione di dove allocare il budget dedicato alle produzioni. 

Netflix e tecnologia

Nella prima puntata di questa serie di articoli abbiamo analizzato Netflix dal punto di vista della qualità video dei suoi contenuti. Successivamente ci siamo occupati degli algoritmi utilizzati per creare fidelizzazione e mantenere l’audience engaged. Infine, abbiamo analizzato l’evoluzione di questi algoritmi e dei problemi legati ai titoli difficili. 

Ma il Machine Learning è applicato anche all’altro capo della catena del valore

Vogliamo oggi analizzare come Netflix utilizza la tecnologia non solo per proporre contenuti già esistenti ai propri utenti, ma anche per definire quali saranno i nuovi contenuti da produrre. 

bridgerton - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?Parametri individuati dalla Machine Learning

Come forse ricorderete nell’ultimo articolo avevamo affermato che Netflix raggruppa i film in base a parametri trovati dalla ML stessa, arrivando a individuare anche cluster surreali come quelli contenenti “film di azione, ma che non includono né autobus né Keanu Reeves”. Questo stesso concetto di cluster è alla base dei sistemi di valutazione dei titoli da produrre. 

bridg2 - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?

Bridgerton

A fine gennaio 2021 Netflix ha annunciato che Bridgerton è stato visto da 82 milioni di famiglie nel mondo in soli 28 giorni, diventando il suo maggior successo alla data.  Battendo dunque nel giro di soli due mesi il record precedente, detenuto da The Queen’s Gambit con 62 milioni di households. La trama probabilmente più popolare, l’inclusione di scene di sesso e la scelta di attori di colore – ormai consuetudine in un mondo politically correct – hanno senz’altro contribuito a creare questo successo.
Ma non è solo questo.
 

Shaping the Catalog

Nel blog dedicato alla promozione dei propri lavori di ricerca Netflix afferma: “Utilizziamo il machine learning (una tipologia di IA, ndr) per aiutarci nella creazione del nostro catalogo di film e serie, apprendendo da questa gli ingredienti che fanno di un titolo un successo. Utilizziamo inoltre questa tecnologia per ottimizzare la produzione di film e serie originali”.  Netflix definisce dunque il suo catalogo di contenuti grazie al ML e se ne serve per “ottimizzarne la produzione”. 

netflix home - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?

Quali sono i fattori per selezionare i titoli da produrre?

La scelta di quale serie o telefilm produrre (genericamente i titoli) è tradizionalmente frutto di un processo creativo. Da sempre questa decisione è sottomessa all’analisi di numerosi fattori, tra cui: la qualità della narrazione, il contesto sociale o zeitgeist (l’adesione del titolo allo spirito del tempo), le caratteristiche dei creatori dei contenuti e molti altri. 

Titoli in cantiere

Inoltre, al fine di prevederne la composizione dell’audience (tipologia, paese, ecc.) ed il potenziale di ritorno economico, Hollywood ha da sempre analizzato anche i dati dei titoli simili a quelli in cantiere.

Machine Learning come Super-Mente

Trattandosi di investimenti importanti (un titolo come Titanic è costato oltre 200 milioni di dollari) questo procedimento viene, nel caso di Netflix, supportato dalla IA attraverso una metodologia che gli anglosassoni chiamano empowerment. La IA agisce come una sorta di super-mente, in grado di mettere a disposizione di chi deve decidere tutti gli elementi – anche quelli nascosti – per fare le scelte migliori. 

Il Metodo Netflix

A fronte di ogni nuovo titolo proposto, le due domande chiave sono:
1) Quali titoli esistenti sono comparabili e in quale maniera?
2) Quale audience ci possiamo attendere nelle varie regioni (geografie o stati)?

Utenza geografica

Occorre tener presente che la vastità dell’utenza Netflix e la grande diversità di mercati serviti rende la risposta a questi semplici quesiti molto complessa, soprattutto se basata su metodi classici (rating Nielsen e vendite biglietti). Non esiste infatti una risposta unica valida in tutto il mondo. 

Esame interdimensionale

Le tecnologie di Machine Learning permettono non solo di effettuare queste indagini per ogni mercato/geografia, ma anche di analizzare numerose altre dimensioni, definite come componenti (elementi tematici) caratteristiche di ciascun titolo. trasnfer learning - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?

Transfer Learning

La metodologia utilizzata è quella del transfer learning, un approccio al ML dove i parametri utilizzati in un dominio (target task) sono in parte ottenuti trasferendo i parametri appresi in domini differenti (source task). Nel nostro caso i target task sono le due domande appena illustrate, mentre il source task è ricavato da un vasto dataset di parametri storici: titoli, generi, durata, tipologia di serie, effetto del passa-parola, ecc.  

L’importanza dei metatag

Questo dataset è arricchito con una serie di metatag creati da (umani) esperti del settore: in sostanza, professionisti che assegnano a ciascun titolo una vasta serie di tag e relativi pesi, così come noi faremmo per assegnare un tag ad un articolo su un blog al fine di ottimizzarne la visibilità in rete. È importante notare come questi metatag siano molto specifici, arrivando anche a descrivere il contenuto di singole scene (ecco dunque il nostro famoso “non autobus” con cui abbiamo aperto). Applicando questo modello al dominio più ristretto del titolo in esame, Netflix estrapola i parametri che aiuteranno i decisori.  

metaflow 300x169 - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?

Similarity map

Sempre nel blog citato Netflix ci informa anche che lo strumento utilizzato è Metaflow, un oggetto software da loro sviluppato e reso di pubblico dominio quasi a suggerirci che, sì, potremmo utilizzarlo anche noi.  Con questa tecnologia viene creata una mappa in uno spazio n-dimensionale detto “similarity map” dove titoli simili (nelle diverse dimensioni) appaiono aggregati, con distanze misurabili. 

cluster contenuti - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?

Relazioni tra entità e fatti

Ribadiamo che non esiste una verità unica rispetto a queste distanze: l’analisi per genere, ad esempio, porta a risultati molto differenti da un’analisi per dimensione dell’audience, analisi che peraltro va reiterata per ogni nazione. Le relazioni tra entità (ad esempio titoli) e fatti (ad esempio “basato su”) sono illustrate in questo modello relativo al celebre titolo Apocalypse now: 

apocaliypse now - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?

L’esempio di Apocalypse now

Numericamente possiamo esprimere queste relazioni come una funzione a tre variabili h,r,t: In questo schema ad esempio vediamo “Apocalypse now”, “based_on”, “Heart of Darkness” (Il film Apocalypse now è basato sul romanzo del 1899 Heart of Darkness); la lunghezza della freccia che connette Apocalypse now con Heart of Darkness è il risultato della funzione: il sistema navigherà dunque tutto lo spazio per trovare le frecce più corte. 

Quindi decide tutto la IA?

Leggendo i blog degli esperti di Data Science di Netflix potremmo giungere alla conclusione che tutto viene deciso dall’intelligenza artificiale di questi algoritmi di ML. Ma un’intervista a Theodore Anthony Sarandos Jr. – co-CEO di Netflix e responsabile dei contenuti – apparsa sul New Yorker lascia la strada aperta a qualche dubbio. 

House of Cards

Sarandos è un convinto utilizzatore di queste tecnologie, al punto di aver ammesso che queste sono state essenziali per identificare e sviluppare successi come House of Cards. La vicenda è stata raccontata da Spacey stesso tempo fa all’International Television Festival di Edimburgo. 

Corrispondenza tra Spacey e Fincher

Gli autori del futuro serial e l’attore stesso avevano proposto House of Cards a diversi network televisivi ottenendo però solo rifiuti o offerte non allettanti. Quando si sono presentati da Netflix non è stato chiesto loro di mostrare alcun pilot. È stato infatti l’algoritmo a trovare che c’era un’ottima corrispondenza tra i lavori di Spacey (attore e produttore) e Fincher (produttore) con il proprio pubblico e Netflix ha accettato immediatamente la produzione. Mettendo sul tavolo $100 milioni per due stagioni. 

spacey - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?

Ma è proprio solo merito degli algoritmi?

L’intervistatore del New Yorker, evidentemente poco convinto, ha provato a provocare Sarandos, affermando che probabilmente quello che conta di più è ancora l’intuito umano, non le distanze tra metadati trovate dall’algoritmo di ML e gli ha chiesto quanto effettivamente ci sia di umano nelle scelte relative alla produzione dei contenuti.
La sua risposta: (Sarandos): “Direi che il mix giusto è settanta-trenta”  (New Yorker): “D’accordo: ma quale parte è settanta e quale trenta?” (Sarandos): “Settanta il risultato dell’analisi dei dati e trenta il giudizio umano…” [pausa] “…ma il trenta conta di più, per così dire”.  (M.H.B. per N.L)

printfriendly pdf button - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?
Share on facebook
Share on twitter
Share on linkedin
Share on whatsapp
Share on email
Share on telegram
Send Mail 2a1 - OTT. Netflix: quanto c’è di umano e quanto Machine Learning nella scelta dei contenuti prodotti dalla piattaforma?

IN ARRIVO

Approfondimenti sulle assegnazioni dei diritti d’uso DTT