Datuen kudeaketa

Espainian, Covid-19aren epidemiarekin lotutako datuak, bai asistentzialak zein epidemiologikoak, autonomia-erkidego edo -hiri bakoitzak kudeatzen ditu, eta Osasun Ministeriora bidaltzen dira. Ministerioak modu zentralizatuan argitaratzen ditu, Carlos III.a Osasun Institutuaren bitartez. Datuak kasuz kasu lortzen dira, Zaintza Epidemiologikoko Sare Nazionalari (Red Nacional de Vigilancia Epidemiológica, RENAVE) deklaratuta, Epidemiologiako Zentro Nazionalak kudeatzen duen SiViES (Sistema de Vigilancia de España, Espainiako Zaintza Sistema) web bidezko plataforma informatikoaren bidez1.

Autonomia-erkidego bakoitzak erabakitzen du zein datu argitaratu eta nola2. Datuen tratamenduaren arabera, zenbakiak desberdinak izan daitezke, estatuko edo autonomia-erkidegoko datu-baseak kontsultatzen diren kontuan hartuta. Datuen serie baterako hainbat iturri egon, eta hauek bat ez datozenean, ez dago jakiterik zein den errealitatetik hurbilen dagoena.

Pandemiak iraun duen bitartean, Euskal Autonomia Erkidegoak (EAE), beste autonomia-erkidego eta herrialde batzuek bezala, aldaketak egin ditu datu irekiak argitaratu eta mantentzeko orduan. Zoritxarrez, ez dituzte kontuan hartu pandemiaren bilakaeraren jarraipena egiteko aldaketa hauek sortzen dituzten zailtasunak. Aldagai batzuk solte argitaratzen dira prentsa-oharretan, datuen serie historikoa eskaini gabe eta deskargatzeko aukerarik eman gabe. Beste datu-serie batzuk argitaratzeari utzi zitzaion, hala nola hildakoak3, probintziaren arabera, edo asistentzia-datuak, ospitale bakoitzeko.

Argitaratzen ez den edo aztertzeko asko landu behar den zenbait datu ez dira hain erabilgarriak izango eta, beraz, ez dira izango komunikabideek argitaratu eta jendearen arreta erakartzeko modukoak. Nahita egindako zerbait izanda zein ez, datuak eskuratzea problematikoa izan da, eta agerian utzi du argitaratzeko erabili diren era desberdinen mugak bai eta datu horiek modu irekian argitaratzeko borondate falta ere.

Open Data Euskadin, EAEko datu irekien plataforman, hainbat datu-serie deskarga daitezke4, lanegunetan soilik eguneratzen direnak. Batzuetan, informazio hori astero eguneratzen da eta datu metatuak baino ez dira ematen; erabiltzeko orduan serie osoa berreraiki behar da, artxibo guztiak deskargatuz, taldekatuz eta alderatuz. Hala ere, zeregin hori ez da beti posible izaten, artxibo guztiak ez daudelako eskuragarri. Batzuetan, eskainitako formatuetako aldagai batzuk (.csv) kalkulu-orrian deskarga zitezkeenak (.xlsx) ez bezalakoak ziren, honek zaildu egiten zuela alderaketa. Prozesatzeko eskuragarri dauden artxiboek datuak eta azalpenak nahasten dituzte, datu irekiak argitaratzeko estandarrak hautsiz (esaterako, Open Standards for Data-n agertzen diren moduan). Horrez gain, hainbat aldagai ez dago batere argi zehaztuta. Era berean, ez dago web helbiderik (URL) datu-serie bakoitzerako; aitzitik, fitxa anitzeko kalkulu-orrietan edo .zip fitxategietan sartuta dauden .csv artxibo gisan. Kalkulu-orriek sarri izan ohi dituzte akatsak, ziur asko datuak eskuz prozesatzearen ondorioz.

Irekian, Eusko Jaurlaritzaren web-plataforman, Osasun Sailburuordetzaren egoera epidemiologikoari buruzko informazioa ematen da prentsa-ohar edo PDF formatuko buletinetan, bertan lanegunetan eguneroko informazioa eta asteko laburpenak biltzen direlarik. Buletin edo prentsa-oharretan jasotako datu-serie batzuk ez dira datu ireki bezala argitaratzen (adibidez, test diagnostikoa egiteko arrazoien ingurukoak edo itxitako eskola-gelen kopuruari buruzkoak).

Herritarrek zenbait aldagairi eta datu gehigarrien argitalpenari buruzko galderak egin dituzte, baina hauek erantzun gabe daude oraindik. Galderaren bati unean-unean erantzun zaio Irekian, bai eta @opendataeuskadi Twitterreko kontuaren bidez. Nolanahi ere, esan daiteke Administrazioak, oro har, ez diela erantzuna eman datuak irekitzeko eskaerei5.

Proposamenak

Ondorengo zenbait proposamen Oraindik posiblea da manifestuan6 oinarrituta daude.

  • Datu eguneratuak argitaratu behar dira. Neurri epidemiologikoak eta erabaki politikoak hartzeko, eta herritarrei argi eta garbi zertan oinarritzen diren jakinarazteko, beharrezkoa da informazio eguneratu eta fidagarria izatea. Argitalpena, ahal den neurrian, jatorrian lortu eta tratatzetik ahalik eta gertuena izan beharko litzateke.
  • Modu egituratuan, irekian, estekatuan eta testuinguruan antolatutako datuetarako eskuragarritasuna ahalbidetzeko gordailuak bideratu beharko lirateke, lehendik dauden gobernu-ekimenen ildoan (https://red.es/redes/ edo https://datos.gob.es/). Erabilitako eremuak eta horietako bakoitza nola lortu den deskribatzen duten metadatuak izan behar dituzte, eremuaren definizioaren inguruan egon daitekeen ziurgabetasun-maila, biltzeko prozedura eta lortutako balioa barne. Gordailu horrek Osasun Ministerioak (bere koordinazio-funtzioak betez) eskatzen dituen gutxieneko datuak bateratuak ez ezik, biltzen ari diren datu-multzo guztiak ere izan beharko lituzke. Gardentasunak datuetan oinarrituta hartzen diren neurriak ulertzen eta aplikatzen lagunduko die herritarrei.
  • Trazabilitateari eusteko eta gordailuko datuen bertsio guztiak (erregistro historikoak) eskuragarri izateko datu tratamendu bat ziurtatu behar da, pandemiaren bilakaera aztertu ahal izateko. Gordailuak Administrazio zentralaren eta autonomia-erkidegoen gardentasun-atariekin integratuta egon beharko luke, herritarrek datuak errazago eskuratu ahal izateko.
  • Datuak gardentasunez argitaratu behar dira, datuekin lan egiten duten kolektiboen informazio- eta ikerketa-beharrak kontuan hartuta (komunitate zientifikoa eta komunikabideak, bi adibide jartzearren).
  • Datuak bereizketa-maila nahikoarekin eman behar dira, erabilgarriak izan daitezen (adina, probintzia, udalerria, osasun-eremuak…) eta, aldi berean, datuen babesaren arloan eskatzen den anonimotasuna bateragarria izan dadin.
  • Informazioa zentralizatu. Administrazioak herritarrentzako webgune bat eduki behar du, informazio guztia modu argian zentralizatuko duena eta egungo egoera epidemiologikoa zein den eta une bakoitzean zer neurrik eragiten dioten adieraziko duena (herriaren, jarduera profesionalaren eta abarren arabera). Horrela, herritarrek arreta-neurriak areagotu edo mugikortasuna mugatzeko aukera izango lukete, agintariek eskatutakoaz gain, egiazko informazio eskuragarria oinarri hartuta.
  • Gardentasunez informatu behar da egindako test kopuru eta proba moten aldaketak lortutako balioetan duen eraginari buruz (intzidentzia metatua, ehuneko positibotasuna). Egindako proba diagnostikoen aldaketa kopuru handiarekin, eta probintzien arabera bereizitako informaziorik eta baheketa orokortuei buruzko informazio bereizirik gabe, pilatutako intzidentziaren edo eguneroko kasuen azterketak arazo handiak sortzen ditu.
  • Datuak aldez aurretik interpretatu beharra dago. Administrazioak datuak argitaratzean, datuen lehen interpretazio bat egin beharko luke, bai eta analisi horren jarraibideak azaldu ere, komunikabideek eta herritarrek interpretazio okerrak egin ez ditzaten.

  1. Situación y evolución de la pandemia de COVID-19 en España. Panel Covid-19 en Instituto de Salud Carlos III. https://cnecovid.isciii.es/covid19/#documentación-y-datos ↩︎

  2. Autonomías y Covid-19: ¿datos para comunicar o para confundir? (David Rodríguez Mateos) https://theconversation.com/profiles/david-rodriguez-mateos-1170231 ↩︎

  3. Artículo en blog que cuenta la ausencia de publicación de fallecidos por provicnias en la CAPV https://numeroteca.org/2020/11/25/fallecidos-euskadi-provinicias-datos ↩︎

  4. Evolución del coronavirus (COVID-19) en Euskadi https://opendata.euskadi.eus/catalogo/-/evolucion-del-coronavirus-covid-19-en-euskadi/ ↩︎

  5. EAEko datuen berrerabilpen prozesua jasotzen duen Twitterreko haria: https://twitter.com/numeroteca/status/1370123787472154625 ↩︎

  6. Todavía es posible. Por unos datos públicos accesibles para la construcción de un conocimiento compartido en tiempos de pandemia global (2020ko ekaina) https://datoscovid19esposible.github.io ↩︎