Περιγραφή:
Σύνοψη
Τα δεδομένα υγείας αποτελούν σήμερα έναν από τους πιο σύνθετους και πολύτιμους τύπους δεδομένων: παράγονται από Ηλεκτρονικούς Φακέλους Υγείας (EHR), Προσωπικούς Φακέλους Υγείας (PHR), συστήματα ιατρικής απεικόνισης, γονιδιωματικές αναλύσεις, φορητές συσκευές και αισθητήρες. Η ορθή διαχείρισή τους αποτελεί προϋπόθεση για την εξατομικευμένη ιατρική (P4 medicine), τα κλινικά συστήματα υποστήριξης αποφάσεων και την εφαρμογή τεχνικών Τεχνητής Νοημοσύνης. Το μάθημα παρουσιάζει μια ολοκληρωμένη εισαγωγή στις βασικές αρχές, τεχνολογίες και προκλήσεις της διαχείρισης δεδομένων υγείας.
Εβδομαδιαία Διάρθρωση Ύλης
Εβδομάδα 1: Εισαγωγή: Τύποι, πηγές και ιδιαιτερότητες δεδομένων υγείας. Από το «reactive» στο P4 medicine. Επισκόπηση χώρου ιατρικής πληροφορικής. European Health Data Space (EHDS), EUCAIM.
Εβδομάδα 2: Πληροφοριακά Συστήματα Υγείας: HIS, LIS, RIS, Ηλεκτρονικός Φάκελος Υγείας (EHR/EMR) έναντι PHR. Αρχιτεκτονικές, ροές δεδομένων, βασικές προκλήσεις.
Εβδομάδα 3: Πρότυπα Διαλειτουργικότητας Ι — HL7: επίπεδα διαλειτουργικότητας, HL7 v2/CDA, HL7 FHIR (resources, RESTful APIs, profiles, IGs). Εργαστήριο: ερωτήματα σε δημόσιο FHIR server.
Εβδομάδα 4: Πρότυπα ΙΙ — Ορολογίες, Οντολογίες, DICOM: SNOMED CT, ICD-10/11, LOINC, MeSH, RxNorm, ATC. BioPortal, OBO Foundry. DICOM, PACS. Εργαστήριο: αντιστοίχηση κλινικών όρων σε SNOMED/LOINC.
Εβδομάδα 5: Κοινά Μοντέλα Δεδομένων (CDMs): OMOP (OHDSI), i2b2, Sentinel, PCORnet. ETL από EHR σε CDM. ATLAS, cohort definition. Εργαστήριο: εξερεύνηση συνθετικού OMOP dataset σε SQL.
Εβδομάδα 6: Σημασιολογικός Ιστός και Βιοϊατρικές Οντολογίες: RDF, RDFS, OWL, SPARQL. Linked Data principles. Bio2RDF, UMLS. Σχεδίαση οντολογίας υγείας. Εργαστήριο: SPARQL σε βιοϊατρικά endpoints.
Εβδομάδα 7: Σημασιολογική Ολοκλήρωση και Knowledge Graphs: Mediator/wrapper architectures, Ontology-Based Data Access (OBDA), R2RML/RML mappings. Knowledge graphs στην υγεία ως υπόβαθρο εφαρμογών AI.
Εβδομάδα 8: Big Data Management στην Υγεία: NoSQL βάσεις (document, graph, column-family), data warehouses, data lakes, lakehouses. Health Data Spaces — η ευρωπαϊκή στρατηγική (EHDS, EHDS2). Εργαστήριο: αποθήκευση/ερωτήματα FHIR resources σε MongoDB.
Εβδομάδα 9: Ποιότητα Δεδομένων και FAIR: διαστάσεις ποιότητας (completeness, accuracy, consistency, timeliness), data curation, data profiling. Αρχές FAIR (Findable, Accessible, Interoperable, Reusable). Συνοψίσεις (summaries) μεγάλων data sources.
Εβδομάδα 10: Ιδιωτικότητα, Ασφάλεια, Ομόσπονδη Ανάλυση: GDPR, anonymization vs pseudonymization (k-anonymity, l-diversity, differential privacy). Federated learning / federated analytics. Personal Health Trains. Εργαστήριο: ανωνυμοποίηση dataset με ARX.
Εβδομάδα 11: AI-based Data Management & Real-World Evidence: cohort discovery, automated data integration, learned indexes, semantic search σε EHR. RWD/RWE. Σχέση με Clinical Decision Support Systems.
Εβδομάδα 12: Υποδομές Δεδομένων για AI στην Ιατρική Απεικόνιση: από τοπικά PACS σε ευρωπαϊκά federated repositories. Case studies: ProCancer-I, EUCAIM, GenoMed4All, RadioVal. Curation pipelines, annotation, quality control. Προσκεκλημένη ομιλία.
Εβδομάδα 13: Σύγχρονες τάσεις & Παρουσιάσεις Project: mHealth, wearables, patient-generated health data, patient empowerment. LLMs/Generative AI για δεδομένα υγείας — ευκαιρίες και κίνδυνοι. Παρουσιάσεις ομαδικών projects.
Ομαδικό Project (ενδεικτικές επιλογές)
• FHIR-based mini EHR — REST API πάνω σε FHIR resources.
• OMOP cohort study — ETL συνθετικών δεδομένων → OMOP → φαινοτυπικός ορισμός κοόρτης → στατιστική ανάλυση.
• Knowledge graph for clinical data — ολοκλήρωση πηγών (DrugBank, SIDER, ClinicalTrials) με SPARQL.
• Federated analytics demo — εκπαίδευση μοντέλου σε δύο «νοσοκομεία» χωρίς μεταφορά δεδομένων.
• Privacy-preserving release — εφαρμογή τεχνικών ανωνυμοποίησης σε σύνολο EHR, αξιολόγηση trade-off χρησιμότητας/ιδιωτικότητας.
Μαθησιακά Αποτελέσματα:
Με την επιτυχή ολοκλήρωση του μαθήματος, οι φοιτητές θα αποκτήσουν τα παρακάτω:
- Γνώση: Θα αποκτήσουν γνώσεις για τη φύση, τις πηγές και τις ιδιαιτερότητες των δεδομένων υγείας (EHR, PHR, ιατρική απεικόνιση, γονιδιωματικά, δεδομένα αισθητήρων), καθώς και το οικοσύστημα των πληροφοριακών συστημάτων υγείας. Θα γνωρίσουν τα κυρίαρχα πρότυπα διαλειτουργικότητας (HL7 FHIR, DICOM), τις βιοϊατρικές ορολογίες/οντολογίες (SNOMED CT, ICD-10/11, LOINC, MeSH) και τα κοινά μοντέλα δεδομένων (OMOP CDM, i2b2).
- Κατανόηση: Θα κατανοήσουν τις διαστάσεις της διαλειτουργικότητας (technical, syntactic, semantic, organizational), την έννοια της ποιότητας δεδομένων υγείας, τις αρχές FAIR, καθώς και τις απαιτήσεις του GDPR και τις τεχνικές προστασίας ιδιωτικότητας (k-anonymity, differential privacy, federated learning).
- Εφαρμογή: Θα εφαρμόσουν σύγχρονες σημασιολογικές τεχνολογίες (RDF/OWL/SPARQL) και knowledge graphs για την ολοκλήρωση ετερογενών πηγών δεδομένων υγείας. Επιπλέον θα αναπτύξουν εφαρμογές πάνω σε FHIR APIs, εκτελούν ETL ροές προς OMOP CDM και θα χρησιμοποιήσουν NoSQL βάσεις δεδομένων και data lakes.
- Ανάλυση: Θα μάθουν να αναλύουν και να αξιολογούν κριτικά την ποιότητα ενός συνόλου δεδομένων υγείας, να εντοπίζουν προβλήματα ολοκλήρωσης και ασφάλειας, και προτείνουν τεκμηριωμένες λύσεις. Επίσης θα μάθουν να αναγνωρίζουν πότε ένα πρόβλημα απαιτεί κεντρική, κατανεμημένη ή ομόσπονδη αρχιτεκτονική.
- Σύνθεση: Θα μάθουν να σχεδιάζουν και να υλοποιούν ολοκληρωμένες λύσεις διαχείρισης δεδομένων υγείας που συνδυάζουν πρότυπα διαλειτουργικότητας, σημασιολογικές τεχνολογίες, big data υποδομές και τεχνικές AI-based data management για συγκεκριμένα κλινικά σενάρια.
- Αξιολόγηση: Θα μάθουν αξιολογούν τα πλεονεκτήματα, τα μειονεκτήματα και τους περιορισμούς διαφορετικών τεχνολογικών προσεγγίσεων διαχείρισης δεδομένων υγείας, καθώς και τα ηθικά, νομικά και κοινωνικά διακυβεύματα της διαχείρισης ευαίσθητων δεδομένων.
Αξιολόγηση:
Μέθοδος αξιολόγησης (συμπερασματική με διαμορφωτικά στοιχεία):
• Ομαδικό Project (παράδοση και προφορική παρουσίαση): 40%
• Εργαστηριακές ασκήσεις (3 παραδοτέες): 25%
• Τελική γραπτή εξέταση (συνδυασμός σύντομης απάντησης και επίλυσης προβλημάτων): 30%
• Συμμετοχή / παρουσίαση επιστημονικού άρθρου: 5%
Τα κριτήρια αξιολόγησης κάθε σκέλους είναι ρητά προσδιορισμένα και διαθέσιμα στους φοιτητές μέσω της ιστοσελίδας του μαθήματος και της πλατφόρμας eLearn. Η ελάχιστη βαθμολογία προαγωγής είναι 5/10 στο σύνολο, με υποχρεωτική παράδοση του project.