Combinant tecnologia i metodologia en escenaris de Health Big Data Analytics
Les organitzacions de salut estan recol·lectant dades d’una àmplia gamma de fonts cada dia amb més velocitat. L’anàlisi d’aquesta vasta quantitat i varietat de dades crea noves oportunitats per oferir serveis de salut i atenció social moderns i personalitzats. Healthcare analytics proporciona mètodes i processos per extreure i transformar dades mèdiques i assistencials en nou coneixement per donar suport a decisions eficients i efectives en la cura de la salut. No obstant això, encara no hi ha un enfocament metodològic específic que condueixi el procés complet de disseny i construcció, des de les dades crues fins a l’activació eficaç del coneixement en les rutines diàries mèdiques. El nostre enfocament es focalitza en les àrees i activitats clàssiques de salut que combinen 1) nous paradigmes tecnològics desenvolupats en l’àmbit de Data Analytics i Big Data i 2) nous enfocaments metodològics de la medicina translacional, l’economia de la salut i les ciències del comportament. L’objectiu principal de l’aplicació de health data analytics juntament amb altres branques del coneixement com les ciències socials i del comportament, és desenvolupar un marc analític innovador que contribueixi a la millora en tot el continu de salut (promoció, Recuperació i atenció / crònica).
Les organitzacions de salut s’enfronten a un nou escenari on les eines analítiques han d’acomodar tant el “Business Intelligence” tradicional com els nous enfocaments d’anàlisi de dades. Això imposa abordar desafiaments tecnològics i metodològics importants. Aquests desafiaments són la força que impulsa el disseny del marc analític sota el prisma de la metodologia esquematitzada a la figura anterior. Des d’aquesta perspectiva, en lloc de definir el que és Big Data en termes de Vs, proposem fer-ho sobre la base de les solucions tecnològiques que donen suport a les noves necessitats de negoci, com 1) bases de dades NoSQL (no només SQL), 2) emmagatzematge distribuït i computació distribuïda 3) Machine Learning distribuït i 4) Tecnologies de virtualització en els seus diferents graus (hipervisors, contenidors Linux i contenidors d’aplicacions).
El marc analític que suporta els objectius de la càtedra UOC-BSA, estructura les diferents solucions i enfocaments de les quatre línies anteriors, en una plataforma lògica de quatre capes, 1) La capa de fonts i d’emmagatzematge, 2) La capa de dades, 3) la capa cognitiva i 4) la capa de metadades, així com els connectors i les solucions de transferència de dades entre capes.
En vista dels diferents requeriments de cada projecte analític específic, la plataforma tecnològica a implementar s’ha d’adaptar a diferents escenaris, cobrint tant els enfocaments analítics més tradicionals com entorns més innovadors on es necessiten tecnologies associades a Big Data Analytics. En aquest context, s’han de prendre diverses decisions respecte a l’enfocament d’emmagatzematge de dades, disseny distribuït, selecció d’eines i models analítics. Per a això, considerem un conjunt de directrius de disseny que impulsen les decisions tècniques i estructurals sobre la construcció del framework tecnològic (suport heterogeni de dades, agilitat i flexibilitat, suport a la gestió de metadades, estabilitat de solucions, ús d’estàndards, etc.).
Seguint aquestes premisses és com hem desenvolupat l’enfocament metodològic, l’estructura tècnica i les directrius de disseny necessàries per desplegar el laboratori de dades que dóna suport als projectes analítics desenvolupats en el context de la càtedra.