

Ezek az adatok értékes információkat kínálnak, és segíthetnek az új koronavírus nyomon követésében, de hibákat kockáztatnak és adatvédelmi aggályokat vetnek fel.

Közel egy héttel azelőtt, hogy az Egészségügyi Világszervezet egy rejtélyes új légzőszervi betegségre figyelmeztetett volna a kínai Wuhanban, a HealthMap globális betegségmegfigyelő rendszerben található bostoni csapadékcsapatok egy online sajtóértesülés alapján digitális nyomokat ragadtak a járvány kitörésére. Ugyanezen a napon, december 30-án a ProMED, egy másik digitális betegség-felderítő csoport, ismeretlen eredetű tüdőgyulladással kapcsolatos online csevegésről értesült Kína mikroblogozó weboldalán, a Weibóban. Amint arról a kutatók később beszámoltak, a WeChat közösségi média platformon újonnan népszerű kulcsszavak voltak a „SARS”, a „légszomj” és a „hasmenés”.
Az ilyen figyelmeztetések egy hatalmas, mégis kockázatos erőforrás ígéretét tárják fel: a tweet méretű tippek olyan emberektől származnak a világ minden tájáról, akik beszámolnak egészségi állapotukról és online adják le félelmeiket. Egyes kutatók arra szólítják fel a közegészségügyi tisztviselőket, hogy használják ki nagyobb mértékben ezt a virtuális kincses adattárat, különös tekintettel az új koronavírus jelenlegi gyors terjedésére.
"Példa nélküli lehetőség szakadékán vagyunk a lakosság globális betegségterheinek nyomon követésére, előrejelzésére és megelőzésére a digitális adatok felhasználásával" - Allison Aiello, az észak-karolinai egyetem Gillings School of Global Public Health epidemiológusa és két diplomás a hallgatók a közegészségügy 2020-as éves felülvizsgálatában írnak.
"Hihetetlen mennyiségű adat található a közösségi média blogjain, csevegőszobáiban és helyi híradásokban, amelyek nyomokat adnak a napi járványkitörésekről" - mondta nemrég a CNN Headline Newsnak John Brownstein, a Bostoni Gyermekkórház és a Harvard Orvosi Iskola innovációs igazgatója.. Az ilyen adatok, amelyeket Brownstein „digitális panírnak” nevez, létfontosságú nyersanyag a digitális epidemiológiának nevezett feltörekvő vizsgálati területen. A HealthMap, amelyet 2006-ban alapított, egyike a számos vezető erőfeszítésnek a területen.
Az HealthMap első nagy sikere a 2009-es H1N1 (sertésinfluenza) járvány idején volt, amikor spanyol nyelvű online híreket tartalmazó forrásokat használt fel az ismeretlen légzőszervi megbetegedések korai felismerésének elősegítésére a mexikói Veracruzban. Öt évvel később a WHO Twitter hírcsatornájához és más forrásokhoz nyomon követte az Ebola vírus terjedését, amely végül több mint 11 000 embert ölt meg Nyugat-Afrikában.
Az Egészségügyi Világszervezet mostantól rendszeresen az HealthMap, a ProMED és hasonló rendszereket használja a fertőző betegségek kitörésének figyelemmel kísérésére, valamint az orvosok, a tisztviselők és a nyilvánosság tájékoztatására. A nagy adatmennyiségek felderítése azonban még mindig gyerekcipőben jár a hagyományos módszerekhez képest, és különösen a közösségi média összetevőinek még mindig nem kell jelentősen hozzájárulniuk a fertőző betegségek előfordulásának előrejelzéséhez.
Legalábbis eddig az HealthMap még mindig nem támaszkodik erősen a közösségi médiára; ehelyett leginkább online hírforrások és kormányok beszámolóit követi nyomon, miközben közegészségügyi szakemberektől néhány közösségi média bejegyzést is tartalmaz. Ezenkívül az HealthMap felhívja az önkénteseket, hogy heti adatokat nyújtsanak be a tömegesen beszerzett betegségkövető platformra, a Flu Near You-ra. Március végén elindított egy új webhelyet, a Covid Near You-t, amely kifejezetten a Covid-19 tüneteire és tesztelésére összpontosít.
Ennek ellenére a digitális epidemiológia két fő előnye - a sebesség és a mennyiség - egyre inkább elősegítheti az egészségügyi tisztviselők gyors és olcsó észlelését a járványokban - vélekedik Brownstein és más szakértők. Ugyanakkor a közösségi médiából származó hatalmas digitális adatmennyiség elegendő kihívást jelent a pontosság és a magánélet szempontjából is, hogy „kétélű kard” legyen, Patty Kostkova, a University College London e-egészségügyi kutatója szerint. Ez egy már megszokott történet: A technológiai fejlődés megelőzi képességünket, hogy garantáljuk azok minőségét és biztonságát.
A legközvetlenebb kihívás a helyes helyrehozás. "Valójában nagyon nehéz hasznos leendő adatokat szerezni a közösségi médiából" - mondja Clark Freifeld, az Északkeleti Egyetem informatikusa, aki az HealthMap és Brownstein társalapítója. Az egyik legnagyobb kihívás szerinte az, hogy ha egy betegség hírré válik, a későbbi médiakérdések és bejegyzések többsége az adott hírekre adott reakció, nem pedig a további hírek mutatója.
Például 2012-ben a Google Influenza Trends a téli influenza eseteiben jelentős növekedést becsült az influenzával kapcsolatos kifejezések Google-keresésekben történő fokozott használata alapján. A tényleges csúcs körülbelül fele olyan magasnak bizonyult, talán azért, mert a felhasználók keresései inkább az influenza kitörésének hírét tükrözték, mint a tényleges betegségeket.
A vörös hering egy másik komoly probléma. A kutatók megállapították, hogy a Google 2007-ben megugrotta a „kolera” szót. De az ok nem egy betegség kitörése volt; ehelyett kiderült, hogy Oprah Winfrey a „Szerelem a kolera idején” című regényt választotta könyvklubjához. Bár az adott eset egyetlen közegészségügyi tisztviselőt sem vezetett félre, mondja Aiello, ez a reaktív és irreleváns „zaj” élénk példája.
Az HealthMap megpróbálja megoldani ezt a problémát mesterséges intelligencia segítségével az ismétlés és a lényegtelenség kiszűrésére. "A betegségek kitörésével kapcsolatos cikkek és tartalom millióinak adatbázisával rendelkezünk" - mondja Freifeld. „Kézzel fogunk címkézni 100 000 példát a tényleges kitörésekre, és szembeállítjuk azokat olyan dolgokkal, amelyek nem kapcsolódnak egymáshoz, például a hetedik játékrészben az otthoni futások„ kitörése”. Így tanulja meg a rendszer, hogy mi hasznos és mi nem.”.
A digitális kenyérmorzsa tévútra vezetheti a szakértőket, hogy a lakosság nagy részét hiányolhatják. Az amerikai felnőttek körülbelül 22 százaléka használja a Twittert, de ez nem véletlenszerű minta. Az amerikai Twitter-felhasználók túlnyomórészt tehetősebbek, fiatalabbak, képzettebbek és inkább demokraták, mint más amerikaiak. Ráadásul a legtöbb Twitter-felhasználó nem csipog annyit: Az összes felnőtt amerikai felhasználó tweetjeinek körülbelül 80 százaléka a legtermékenyebb 10 százalékból származik. A Twitter fiatalos profilja különösen problematikus, tekintve, hogy az idősebb emberek - legalábbis a kezdeti feltételezések szerint - nagyobb kockázatot jelentenek a súlyos betegségre. Az egészség tweetek általi figyelemmel kísérése így figyelmen kívül hagyhatja a legkiszolgáltatottabbakat közülünk.
Tágabb értelemben a közösségi média indokoltan híres a hamisságok terjesztéséről, amelynek fertőző betegségek esetén halálos következményei lehetnek. És ez, a közegészségügyi kutatók szerint, mindig veszélyt jelent a jelek felkutatásakor a közösségi média zajai között. A közegészségügy az állami tisztviselők iránti bizalomtól függ, de ez a bizalom gyorsan megkophat, ha a kormány hibás információkat közöl.
A pontossággal kapcsolatos problémákon felül a digitális epidemiológia növelheti az internet felhasználók magánéletét fenyegető veszélyeket. Európával ellentétben az Egyesült Államokban nincsenek átfogó törvények a magánélet védelme érdekében a közösségi médiában. Az olyan platformok, mint a Google és a Facebook, rutinszerűen licencelik az összesített felhasználói információkat a hirdetők számára, akik ezután a keresési tartalom és a „tetszik” alapján megcélozhatják a helyeket. Az ilyen típusú adatok egészségügyi felügyeletre történő felhasználása megsokszorozhatja a magánélet visszaélésének kockázatát, mondja Freifeld, különösen akkor, ha a közegészségügy konfliktusba ütközik a titoktartással.
Az adatvédelem szószólói már most riasztót adnak a Fehér Ház és az Egyesült Államok Betegségmegelőzési és Megelőzési Központja közelmúltbeli erőfeszítéseiről, hogy bővítsék hozzáférésüket az amerikaiak mobiltelefon-adataihoz, hogy nyomon kövessék tartózkodási helyüket a járvány idején. A szövetségi egészségügyi tisztviselők anonim, összesített adatok beépítését remélik, hogy kövessék a vírus terjedését és ellenőrizzék az új „társadalmi elhatárolódási” szabályok betartását.
Az online közegészségügyi adatok növekvő tárháza éppen ebben a hónapban lett valamivel nyitottabb a nyilvánosság számára. Március 17-én a CrowdTangle, a Facebook által nemrégiben megvásárolt közösségi média megfigyelő oldal bejelentette, hogy elindított egy új funkciót, amely lehetővé teszi a felhasználóknak, köztük a hírmédia szervezeteinek, a közegészségügyi tisztviselőknek és a kutatóknak a társadalmi trendek nyomon követését az olyan webhelyeken, mint a Facebook, az Instagram és a Reddit. A vállalat egyidejűleg bevezette a hivatalos információk és a közösségi média bejegyzéseinek streaming, korlátozott valós idejű megjelenítésének központját az új koronavírus által okozott Covid-19 fertőzésekről. A közösségi média bejegyzéseit csak az állami számlákról tették ki, a magánszférából nem.
Az önkéntes jelentési rendszerek elkerülhetik a malomfutás digitális epidemiológiájának néhány, bár nem az összes elfogultságát. A 2011-ben piacra dobott Flu Near You névtelen, tömeges modell alapján gyűjti az adatokat a közegészségügyi tisztviselők és kutatók számára.
Kissé hasonló projekt a FoodBorne Chicago, egy Twitter alapú felügyeleti rendszer, amely figyelemmel kíséri az élelmiszer által okozott betegségekkel kapcsolatos panaszokat. A chicagói Közegészségügyi Minisztérium székhelyén gépi tanulási algoritmus segítségével követi a tweeteket, amelyek azonosítják az „ételmérg” kulcsszavakat. Amikor a helyi lakosok beírják ezeket a szavakat, a webhely tweetel egy linket egy űrlappal, amely részleteket szolgáltat, és olyan adatokat gyűjt, amelyekről egyébként soha nem számoltak volna be.
Az elmúlt hét évben a CDC mártotta a lábát a betegségek digitális felderítésében egy FluSight néven ismert éves verseny lebonyolításával, amelyen az akadémia és az ipar kutatói megpróbálják előrejelezni az influenzaszezon időzítését és intenzitását. A CDC megköveteli, hogy a versenytársak valamilyen digitális adatot használjanak előrejelzéseik során.
Eközben a kutatók egyre izgatottabbak a lehetőségek között, amelyek a wellness és a betegség közvetlenebb méréseiből származó adatok bevonásával járnak. Az intelligens, viselhető egészségkövető monitorok folyamatos adatfolyamot szolgáltatnak a pulzusszámról, a megtett lépésekről és az alvás minőségéről.
Március 25-én a Scripps Research Translational Institute epidemiológusa, Jennifer Radin, a Fitbits betegség "észlelésében" potenciálisan "létfontosságú" szerepével foglalkozó közelmúltbeli tanulmány vezető szerzője felszólította az amerikai felnőtt önkénteseket, hogy bármilyen okosórát vagy aktivitáskövetőt használjanak egészségügyi adataik megosztására a kutatókkal a MyDataHelps mobilalkalmazás letöltésével. A kutatók remélik, hogy az adatokat felhasználják a nyugalmi pulzus változásainak azonosítására, amelyek betegségre utalhatnak - mondta Radin a Knowable-nak. Noha elismerte, hogy a hírek egyszerűen megnézésével gyorsabb pulzus alakulhat ki, elmondása szerint az önkéntesek, akik nem érzik jól magukat, más tüneteket is felsorolhatnak az alkalmazásban.
Az elmúlt nyolc évben a Kinsa nevű San Francisco-i startup rendszeresen gyűjtött ilyen valós idejű egészségügyi adatokat, nemrégiben több mint 1 millió internethez csatlakoztatott hőmérőt adott el és adott el. Az Oregoni Állami Egyetem tudósa, Benjamin Dalziel, aki a Kinsa által finanszírozott kutatásban dolgozik, azt mondja, hogy a rendszer két héttel a CDC előrejelzései előtt pontosan követheti az influenzát, és nyomon követheti a Covid-19-et is. Március 18-án megkezdte új adatok közzétételét az optikai rendszerből az „atipikus lázak” csoportjairól az „Egészségügyi időjárási térképen” a www.healthweather.us oldalon.
Dalziel és Kinsa vállalati vezetők bizonyos hőmérők segíthetnek ebben a globális vészhelyzetben. Ezeknek és más típusú rendszereknek a tünetek valós idejű nyomon követésére Dalziel szerint „a jövő, bármennyire is nagyszerűnek hangzik…. A láz az akut légúti fertőzés kulcsfontosságú mutatója. Ez a betegség szempontjából közvetlenül releváns dolgot mér. És bár úgy gondolom, hogy lenyűgöző munkát végeztek az információk Twitterből történő kinyerése érdekében, a hőmérő leolvasása egyértelműen előnyhöz jutott egy tweet előtt.”*.
Más szakértők is lelkesek a Kinsa előrehaladásáért. "A láz monitorozása nagyszerű ötlet, tekintettel a Covid-specifikus tesztkészletek hiányára" - mondja a HealthMap Freifeld munkatársa.
A koronavírus vészhelyzet egyértelműen felgyorsítja az érdeklődést a digitális epidemiológia iránt. A mai napig Freifeld és más szakértők egyetértenek abban, hogy a terület ígérete inkább a hagyományos megfigyelés kiegészítőjeként, mint helyettesítőjeként marad.
Ahogy Aiello, Észak-Karolinában, elismeri, hogy egyelőre legalább: „Meg kell majd erősítenünk a hagyományos cipő-bőr adatokkal.”.
A koronavírus kitöréséről itt olvashat bővebben.
* A szerkesztő megjegyzése (20.3.31.): A Knowable partnereink frissítették ezt a bekezdést, hogy tisztázzák Benjamin Dalziel véleményét.