Big Data: possiamo prevedere le tendenze della popolazione (come la felicità) tramite le app per la salute?

Più di cinque anni fa, ho scritto un pezzo intitolato Affidabilità e validità in un mondo Web 2.0. Ha parlato delle preoccupazioni per la raccolta di dati da campioni distorti - senza prima capire in quali modi, esattamente, quei campioni possono essere distorti.

Ora, con l'ubiquità delle app - programmi scaricabili per gli smartphone delle persone - vedo sorgere lo stesso problema. Sviluppatori e imprenditori stanno cercando dati da queste app senza comprendere le basi di una raccolta di dati scientifici buona, affidabile. E perché è importante, specialmente quando inizi a voler analizzare tutti questi "big data" (un termine un po 'sciocco ... in epidemiologia, ad esempio, gli scienziati lo chiamano semplicemente "dati").

I dati sulla salute personale possono essere raccolti da queste app senza pregiudizi e in qualche modo essere trasformati in misurazioni di qualcosa di più grande?

La risposta breve: no, non facilmente.

Certo, ci sono persone che fanno parte di un movimento di "sé quantificato" - che vogliono monitorare e misurare ogni aspetto della loro salute personale (e presumibilmente, salute mentale). Ma quelle persone sono attualmente1 valori anomali e non rappresentano in alcun modo la popolazione in generale.

Tali minoranze possono rapidamente costituire la maggior parte degli sforzi per raccogliere set di dati più ampi al fine di analizzare le tendenze di salute o benessere. Sebbene le analisi risultanti possano dirti qualcosa su questo gruppo di persone, sarebbe inappropriato suggerire che sia generalizzato al resto della popolazione (che, dal punto di vista demografico e comportamentale, può apparire e agire in modo molto diverso).

Questo non cambierà presto, perché la maggior parte delle app per la salute vengono scaricate dalle persone, utilizzate una o due volte e poi abbandonate. C'è un motivo per cui la maggior parte delle persone smette di usare le app per la salute, specialmente quelle destinate a fungere da diario di dati. Sono noiosi! La raccolta di dati su se stessi è solo un compito molto noioso per la maggior parte di noi a cui impegnarsi attivamente ogni giorno (o anche ogni settimana).

La risposta complicata: le app devono essere più intelligenti e connesse

Le app per la salute pensate per raccogliere dati alla fine falliscono perché richiedono un input attivo da parte dell'utente. Questo è il motivo per cui le cartelle cliniche personali non sono mai decollate in modo significativo.2 Le persone sono troppo occupate a vivere la propria vita per preoccuparsi di dire a un'app3 quali sono le loro metriche quotidiane.

Affinché le app per la salute abbiano successo dove la maggior parte degli altri tentativi di software di monitoraggio della salute personale hanno fallito, è che raccolgono i propri dati in modo passivo. Ciò significa che non è richiesto alcun input da parte dell'utente.

Naturalmente, siamo molto lontani dal fatto che tali metriche forniscano dati significativi.Certo, ci sono dispositivi in ​​esecuzione che tengono traccia di quanto corri (da Nike, ovviamente). Ma un'app per la corsa è inutile se non parla con la mia app per la dieta, con la mia app per la nutrizione o con la mia app per gli esercizi. O la mia app di consapevolezza. È un'app che misura una singola metrica nell'essere complesso che sono io. Semplicemente non è molto su cui lavorare.

La fiducia è una pietra angolare chiave

L'adozione di tali app in rete che condividono tutti i tuoi dati sanitari ha anche un altro ostacolo, meno tecnico: la fiducia. Aziende come Facebook e Nike alla fine rispondono a un solo gruppo di persone: i loro azionisti. Ciò significa che se è nel loro interesse analizzare i tuoi dati per cose da cui possono fare soldi, lo faranno.

Le startup non sono migliori, perché invece degli azionisti, rispondono solo ai venture capitalist, prestatori di denaro che cercano solo il miglior e più rapido ritorno sui loro investimenti.

Perché dovrei voler affidare le mie informazioni sanitarie - dati che potrebbero essere utilizzati contro di me per la futura negazione dell'assicurazione o l'impostazione delle mie tariffe assicurative - ad aziende che hanno scarso interesse a proteggere la mia privacy?

Il che ci riporta di nuovo al primo punto: un campione parziale. Le persone che forniscono volentieri tutte le loro informazioni sanitarie ad aziende a scopo di lucro per analizzare, raccogliere e infine associare a te (anche se tali dati sono inizialmente resi anonimi) non sono come la maggior parte delle persone. La maggior parte di noi si preoccupa ancora di tenere per sé le proprie informazioni sulla salute, proprio come la maggior parte di noi desidera ancora tenere per sé le proprie informazioni finanziarie.

Dove andiamo da qui

Il tentativo di raccogliere dati basati sulla popolazione (ad es. Condurre ricerche epidemiologiche) da app per la salute presenta alcuni problemi e opportunità che ho identificato:

  • Campionamento parziale a causa della piccola minoranza di persone che utilizzano attivamente e continuamente app per la salute
  • Il campionamento e l'uso continuato potrebbero essere migliorati da passivo contro attivo raccolta dati
  • Il campionamento e l'utilizzo potrebbero essere ulteriormente migliorati utilizzando un'autorità affidabile per la raccolta e l'archiviazione dei dati (non un'azienda o startup a scopo di lucro)
  • Le app che si conoscono l'una dell'altra e si scambiano dati sanitari rilevanti su di me sono la prossima generazione, invece dell'attuale ricchezza di app in silos, inconsapevoli (stupide?)

Penso che sia fantastico che gli sviluppatori esaminino un problema di salute, sviluppino un'app e la rilascino al mondo. Ma troppo spesso queste app non vanno da nessuna parte, senza pubblico. Oppure sono rimasti orfani dagli sviluppatori originali per mancanza di interesse. Le poche app per la salute popolari che ottengono un vasto pubblico sono l'eccezione, non la regola. E anche quando ottengono una diffusa accettazione, proprio come i sistemi di cartelle cliniche elettroniche del nostro paese, non parlano tra loro.

Se vuoi essere in grado di dire qualcosa di autorevole o significativo sui dati raccolti da un'app, devi dimostrare che i dati provengono da un campione rappresentativo della popolazione. In mancanza di ciò, i tuoi dati ci parlano solo di un piccolo gruppo della popolazione, che non assomiglia alla maggior parte di noi.

Note a piè di pagina:

  1. E lo sarà per il prossimo futuro [↩]
  2. E perché domani Google chiuderà finalmente il proprio libretto sanitario personale. [↩]
  3. O peggio - e più comunemente - a intero set di app che non sono a conoscenza dell'altro e non possono scambiarsi dati tra loro [↩]

!-- GDPR -->