Social Innovation Mapping

Introduzione

In questo articolo vogliamo presentarvi una metodologia sperimentale che abbiamo recentemente testato con l’obiettivo di analizzare i nuovi trend nel settore dell’innovazione sociale.

Nello specifico, abbiamo provato a svolgere questa analisi raccogliendo dati Twitter relativi ad un insieme di tweet pubblicati in un determinato arco di tempo e che soddisfano una serie di criteri prestabiliti. Nel caso della prima sperimentazione di questa metodologia, l’arco di tempo analizzato è il mese di Novembre 2020.

Pertanto, nella prima sezione di questo blog post presenteremo la strategia metodologica sviluppata.

Si tratta di una metodologia di tipo quantitativo e qualitativo, strutturata in due fasi: la prima, in cui i dati sono stati estratti automaticamente dalla fonte; la seconda, in cui gli stessi dati sono stati selezionati e analizzati applicando principi di Etnografia Digitale.

Nella seconda sezione del blog post, invece, sono descritti i risultati della sperimentazione, raggruppati secondo tre gruppi concettuali diversi:

    • Contesto del mese di Novembre
    • Problemi identificati nel settore dell’innovazione sociale
    • Soluzioni identificate nel settore dell’innovazione sociale

In conclusione, presentiamo limiti e criticità della metodologia descritta e gli apprendimenti derivanti da questa prima sperimentazione, dedicando le ultime riflessioni alle possibile traiettorie future di ricerca. 

Metodologia

Possiamo sintetizzare in quattro passaggi  l’approccio utilizzato:

1| Stabilire un’ampia rete di ricerca

2| Arricchire e classificare i dati 

3| Filtrare e selezionare

4| Interpretare utilizzando una prospettiva umana 

Va precisato che questa metodologia seleziona soltanto tweet in Inglese ed esclude i contenuti scritti in qualsiasi altra lingua. 

1| Stabilire un’ampia rete di ricerca

La fonte di informazione

La nostra metodologia utilizza Twitter come fonte di informazioni sulle più recenti iniziative sviluppate nel settore dell’innovazione sociale.

Nello specifico, utilizziamo Twitter API per recuperare automaticamente tweet e conversazioni rilevanti avvenute sulla piattaforma, impostando dei parametri o “parole chiave” di interesse per gli obiettivi della ricerca.

In questo modo, avevamo la possibilità di analizzare fino a 500,000 tweet al mese, con uno sguardo retrospettivo di una settimana alla fine di ogni mese. 

Tenendo a mente questi parametri ci siamo riproposti di analizzare in più ampio numero possibile di tweet riguardanti i principali temi relativi all’innovazione sociale, recuperando i contenuti su base settimanale per l’intero mese di Novembre.

Recupero dei contenuti

Per recuperare i contenuti in modo sistematico abbiamo utilizzato un approccio basato su “parole chiave”, per cui tutti i tweet corrispondenti ad un insieme predefinito di termini e hashtag venivano salvati automaticamente per essere poi analizzati.

Volevamo che le nostre parole chiave coprissero i temi dell’Innovazione Sociale e le relative metodologie, al fine di poter osservare quali attività e iniziative si stavano svolgendo e potenzialmente identificare argomenti comuni e tendenze emergenti.

Per farlo,  abbiamo utilizzato due diversi insiemi di parole chiave:

  • Innovazione Sociale: espressioni e hashtag tra cui “social innovation”, “social impact”, “#socialinnovation”
  • Metodologia: termini ed espressioni specifiche che descrivono le 11 categorie metodologiche dell’innovazione sociale individuate dalla Stanford Social Innovation Review: Advocacy, Collaboration, Design thinking, Governance, Impact investing, Leadership, Measurement and evaluation, Organizational development, Philanthropy and funding, Scaling, Technology.

2 | Arricchire e  classificare

Al fine di fornire un contesto tematico ai tweet, abbiamo assegnato loro un’area tematica utilizzando il framework degli Obiettivi di Sviluppo Sostenibile (SDG) dell’Agenda 2030 delle Nazioni Unite. In poche parole, abbiamo provato ad assegnare uno o più dei 17 SDG a ogni tweet in base al testo del tweet stesso.

Per farlo, abbiamo seguito due passaggi: corrispondenza dei tweet con le parole chiave e classificazione dei tweet attraverso il machine learning.

Per prima cosa, abbiamo assegnato i tweet alle parole chiave, semplicemente verificando che il testo del tweet contenesse una o più delle parole chiave associate a ciascuno dei 17 SDG. Queste parole chiave sono state definite a partire dalle definizioni ufficiali degli Obiettivi mediante scraping automatico e un successivo processo di selezione manuale.

Successivamente, abbiamo utilizzato un algoritmo di classificazione proprio del machine learning per assegnare le “etichette” con gli SDG ai tweet per i quali non era possibile l’assegnazione utilizzando il primo metodo. Lo abbiamo fatto utilizzando BERT pre-trained sentence embeddings.

In particolare, abbiamo addestrato l’algoritmo di classificazione multi-label sui tweet etichettati con il metodo di corrispondenza delle parole chiave (divario train / test all’80 / 20%) e quindi applicato ai tweet senza etichetta, assegnando solo etichette SDG al di sopra di un certo livello di certezza. 

3 | Filtrare e selezionare

Al fine di filtrare e selezionare i tweet da analizzare per la nostra ricerca, abbiamo applicato una serie di criteri al set iniziale di dati raccolti attraverso il processo illustrato nei paragrafi precedenti.

Più specificamente, abbiamo prima eliminato i duplicati dei tweet, che erano in realtà retweet del tweet originale. Successivamente, abbiamo deciso di includere solo i tweet che riguardavano un SDG o una delle 11 metodologie citate precedentemente. 

Infine, poiché l’obiettivo della nostra ricerca era trovare le principali tendenze nel mondo dell’innovazione sociale, abbiamo selezionato solo i tweet che avevano almeno un “mi piace”.

Ciò è stato fatto sulla base del presupposto che coloro che non hanno alcun “mi piace” non sono davvero una buona rappresentazione delle tendenze emergenti nel mondo dell’innovazione sociale, e che i “mi piace” sono più indicativi dei retweet, perché i retweet sono generalmente meno comuni e usati più difficilmente – per cui, filtrando il dataset sulla base dei retweet,  avremmo perso informazioni importanti.

4 | Interpretazione utilizzando una prospettiva umana

Una volta che siamo stati in grado di filtrare e selezionare il set di dati iniziale, i tweet rimanenti sono stati esaminati su base individuale. Più specificamente, abbiamo letto e analizzato sia il testo, sia i contenuti a cui portavano i link incorporati in ogni dato tweet.

Infatti, poiché molti tweet erano in realtà solo parzialmente interpretabili, (poiché promuovevano principalmente un’iniziativa collegata all’esterno) è stato necessario indagare il contesto che circonda ogni tweet. Solo così, infatti, siamo riusciti a comprendere appieno il significato di ogni tweet. 

Durante l’interpretazione non automatizzata, molti tweet sono stati infatti considerati non pertinenti in base al loro significato e contesto più ampio e individuale. In effetti, questo processo aveva lo scopo di rafforzare la nostra metodologia incorporando un approccio qualitativo a quello quantitativo che abbiamo impiegato inizialmente, in modo da fare il più possibile un’analisi informata.

Risultati e scoperte

Una volta raccolti i tweet secondo i criteri illustrati sopra, ne avevamo un totale di  9.229. Affinché l’analisi potesse essere il più possibile precisa e rigorosa, si è proceduto con un processo di selezione e filtraggio dei dati disponibili.

Pertanto, abbiamo prima ripulito il set di dati eliminando i duplicati dei tweet. In effetti, circa il 50% dei tweet erano in realtà retweet che non erano stati raccolti come tali nel processo di estrazione, principalmente perché gli utenti avevano copiato il testo senza utilizzare la funzione “retweet” di Twitter. Una volta de-duplicato il seti di dati, sono rimasti 4.522 tweet da analizzare.

Utilizzando il classificatore basato su parole chiave, abbiamo abbinato circa il 16% dei tweet con uno o più SDG. Abbiamo quindi applicato il classificatore di machine learning ai tweet rimanenti, utilizzando la precisione sul set di test (bassa, ~ 20%) per informare l’impostazione della soglia di classificazione (quindi alta, ~ 80%). Questo ci ha lasciato con 998 tweet, distribuiti attraverso le metodologie di innovazione sociale e gli SDG, come illustrato nella tabella seguente.

Infine, eliminando i tweet con 0 “mi piace”, sono rimasti 576 tweet da leggere e analizzare individualmente.

Cosa abbiamo scoperto

Una volta ottenuti i 576 tweet definitivi, abbiamo condotto l’analisi tematizzando i dati secondo tre temi principali: (1) contesto del mese di novembre, (2) problemi identificati, (3) soluzioni identificate. Nei prossimi paragrafi, descriveremo i risultati di ciascun tema.

  • Contesto generale del mese di Novembre

Per quanto riguarda l’analisi relativa al contesto della nostra ricerca, abbiamo individuato i tweet rilevanti per il momento e il contesto in cui sono stati twittati. In particolare, il mese di novembre si è rivelato un periodo peculiare, soprattutto a causa delle elezioni americane. Sebbene i tweet relativi alle elezioni statunitensi non fossero così tanti (circa 10), sono stati quelli più apprezzati e retwittati.

È importante notare che l’esiguo numero di tweet non indica che non vi siano state conversazioni sulle elezioni americane durante il mese di novembre; in effetti, ciò mostra solo che il processo di data mining e classificazione dei contenuti che abbiamo impiegato ha filtrato con successo i tweet che non erano specificamente correlati all’innovazione sociale.

Una volta esclusi i dati sulle elezioni negli Stati Uniti, abbiamo anche filtrato i tweet relativi alla Brexit e / o alla politica britannica, che non erano così rilevanti per la nostra ricerca ma sembravano emergere abbastanza spesso.

Entrambi i processi sono stati condotti filtrando i tweet che contenevano le seguenti parole chiave: “Elections”, “Presidential”, “Brexit”, “Trump”, “Boris”, “Johnson”, “Cummings”, “Biden”, “Kamala”.

Inoltre, la pandemia ha naturalmente svolto un ruolo cruciale nell’analisi dei tweet di novembre. Quindi, abbiamo ordinato i dati in base alle seguenti parole chiave: “Covid-19”, “coronavirus”, “Pandemic”, “social distancing”, “social distance”, “working from home”, “smart working”.

Pertanto, abbiamo scoperto che il set di dati conteneva 65 tweet relativi a Covid-19. Il numero relativamente piccolo di tweet relativi alla pandemia è stato in effetti piuttosto sorprendente all’inizio, poiché sappiamo – come illustrato in uno dei nostri articoli precedenti – che l’emergenza sanitaria che stiamo attraversando ha giocato e continuerà a giocare un ruolo fondamentale nel mondo dell’innovazione sociale.

Infatti, una volta che i tweet sono stati analizzati individualmente, è stato facile vedere come la pandemia fosse spesso sottintesa, in modi che non potevano essere rilevati dalle parole chiave. Questo processo ha dimostrato come metodi misti che fondono analisi automatizzate e quantitative con quelle etnografiche e qualitative consentano di ottenere un quadro molto più ampio e affidabile.

  • Definizione dei problemi nel settore dell’Innovazione Sociale

A seguito di un’analisi rispetto al mese di novembre, utile a dare un contesto alla più ampia serie di tweet raccolti, abbiamo deciso di approfondire i principali argomenti discussi in relazione al settore dell’innovazione sociale. 

Pertanto, abbiamo identificato i problemi attraverso le menzioni degli SDG, sulla base del presupposto che gli obiettivi delle Nazioni Unite in qualche modo facciano implicitamente riferimento ai problemi che si percepisce debbano essere affrontati (per fare un esempio pratico e immediato: obiettivo (SDG) pace / problema implicito: guerra).

Dai tweet analizzati, sembra che l‘SDG più discusso durante il mese di novembre sia il 4° – raggiungere un’istruzione di qualità, seguito dall’8°- sforzo per costruire ambienti di lavoro dignitosi e crescita economica – e il 3°- che mira a dare buona salute e benessere a tutti. Data la pandemia, sembra avere senso che il 3 ° obiettivo sia tra gli obiettivi / problemi più discussi.

Tuttavia, è molto interessante notare come l’emergenza covid-19 sembri essere concettualizzata in modo olistico, dunque più come una questione sociale piuttosto che unicamente sanitaria. In effetti, l’istruzione e le condizioni di lavoro sembrano essere altrettanto importanti, se non di più. Ovviamente, la grande maggioranza degli Stati Uniti Considerato come la pandemia abbia avuto conseguenze fondamentali su entrambi gli obiettivi SDG, questo è sicuramente un aspetto che sembra degno di essere esaminato più da vicino nella nostra ricerca futura.

  • Soluzioni identificate nel settore dell’Innovazione Sociale

In aggiunta all’analisi dell tematiche più discusse riguardanti l’innovazione sociale, abbiamo anche indagato quali fossero le soluzioni più apprezzate presenti nel nostro dataset. Pertanto, le abbiamo identificate attraverso le 11 metodologie, partendo dal presupposto che quelle siano gli strumenti ritenuti in grado di raggiungere i 17 SDG.

Da un lato, dai tweet analizzati, sembra che le metodologie più affrontate siano Leadership e Tecnologia. D’altra parte, Misurazione e valutazione, insieme a Filantropia e finanziamento e Sviluppo organizzativo sono quelle meno considerate.

Quanto alla prima metodologia, abbiamo scoperto che 228 tweet sostenevano la necessità di costruire sistemi di leadership più forti. La leadership sembra essere stata indirizzata sia in termini di (1) leadership politica, quindi spesso riferendosi alla pandemia e alla sua gestione in tutto il mondo (tenendo presente che, come precedentemente specificato, i tweet raccolti erano solo in inglese e quindi riferiti ad un numero limitato di realtà anglofone) e (2) leadership imprenditoriale sociale. Naturalmente, quest’ultima sembra essere il più interessante per la nostra ricerca.

La cosa più interessante è che dall’analisi è emerso che i tweet promuovevano prevalentemente programmi di formazione alla leadership e sostenevano la necessità di insegnare ai giovani, alle donne e alle minoranze le capacità di leadership per svilupparla ulteriormente e applicarla nel campo dell’innovazione sociale e dell’imprenditorialità. Questa è certamente una tendenza che sembra valere la pena continuare a esaminare a lungo termine e in ricerche future.

Per quanto riguarda la Tecnologia, i tweet analizzati affrontano in modo preponderante il potenziale della tecnologia nel dare alle persone l’opportunità di ottenere un’istruzione, da un lato, e le opportunità che gli strumenti digitali ci forniscono in termini di salute e benessere, dall’altro. Come abbiamo visto nella sezione precedente, sia l’istruzione che la salute sono stati gli obiettivi più discussi.

È interessante notare che la maggior parte dei tweet relativi a entrambi questi temi si riferissero alla necessità di includere gruppi emarginati e minoranze nel processo di innovazione sociale e digitalizzazione, evidenziando come la pandemia – e quindi l’apprendimento a distanza e le necessità legate alla salute – abbia reso tali bisogni sempre più urgenti.

Per quanto riguarda le metodologie meno discusse, abbiamo notato che queste erano (a) Misurazione e valutazione, (b) Filantropia e finanziamento  (c) Sviluppo organizzativo. È interessante notare che, sebbene i metodi quantitativi qui impiegati li abbiano resi i meno discussi, sia (b) che (c) sono stati in realtà implicitamente affrontati in molti dei tweet raccolti.

In effetti, i tweet relativi sia alla leadership che alla tecnologia hanno effettivamente affrontato questioni come i modi per aiutare le organizzazioni senza scopo di lucro e i leader a raccogliere fondi e rendere più efficiente il loro lavoro, e per aiutare i fundraiser i donatori a dare il loro contributo in modo più efficace. D’altra parte, tuttavia, la Misurazione e la Valutazione sono state effettivamente discusse a malapena.

A questo proposito, può essere interessante leggere l’articolo recentemente pubblicato dalla Stanford Social Innovation Review Ten Reasons Not to Measure Impact—and What to Do Instead.

Limiti e sviluppi futuri della ricerca

Considerando la natura sperimentale di questa metodologia, vale la pena condurre una discussione fortemente incentrata sulle cose che abbiamo appreso durante il processo e sui passaggi che intendiamo intraprendere da questo momento.

Limiti e apprendimenti

Il gran numero di tweet raccolti ha evidenziato come la domanda di ricerca (es. “Quali sono le tendenze nel mondo dell’innovazione sociale?”) sembra essere troppo ampia perché l’analisi sia sufficientemente esaustiva e soddisfacente.

In effetti, il grado di varietà tra i tweet è così alto che la delimitazione di alcune tendenze principali porta inevitabilmente a sacrificare la varietà: in questo modo, rischiamo di perdere la maggior parte dei contenuti/significati, e quindi di non essere in grado di essere veritieri e fedeli rispetto a cosa sta succedendo nel mondo, per il solo obiettivo di definire degli schemi e ordinare un ambiente intrinsecamente non ordinato.

Riteniamo che una domanda di ricerca più precisa potrà rafforzare la metodologia e consentirà alla ricerca di essere esplicitamente posizionata e affidabile, cercando in ultima analisi di dimostrare perché particolari conclusioni sono state tratte dallo studio.

Futuri ambiti di ricerca

I risultati hanno evidenziato una serie di elementi che vale la pena esaminare ulteriormente. Tra questi, abbiamo individuato tre grandi temi che sembrano in linea con gli interessi di Nesta Italia e rappresentano quindi importanti temi di ricerca futura:

1 – La concettualizzazione olistica della pandemia Covid-19, quindi come l’emergenza sanitaria sia di fatto percepita come un’emergenza sociale e assistenziale;

2 –  La convinzione diffusa che la formazione alla leadership sia sempre più necessaria per includere minoranze e giovani nel cosiddetto “mondo post-pandemico”;

3 – La stretta relazione tra Tecnologia (soprattutto nei settori dell’istruzione e della salute) e Inclusione sociale, alla luce di una pandemia che, anziché essere “il grande equalizzatore”, come molti pensavano sarebbe stata, ha esacerbato ed esposto esclusioni fondamentali.

Questi temi ci consentono di avviare il processo di restringimento della nostra domanda di ricerca, in modo da rafforzarne il processo e i risultati. In particolare, le domande di ricerca secondarie che potrebbero orientare la domanda di ricerca principale sono:

Cosa pensate? Cosa dovremmo indagare ulteriormente? Fateci sapere quale domanda di ricerca secondaria ritenete sia la più importante per ottenere una comprensione più chiara delle tendenze attuali nel mondo dell’innovazione sociale!