Datamanagement

Om Datamanagement

Datamanagerne er behjælpelige med datahåndtering, hvor dette kan f.eks. være registerudtræk, samkørsel af data, klargøring af data og datasæt til forarbejdning i SAS, Stata m.fl. efter standarder, videnskabelige og tekniske krav.

Datamanagerne er behjælpelige med design og udvikling af databaser, spørgeskemaer, software m.m., herunder web- og mobil løsninger. Vi kan tilbyde hjælp i SAS, SPSS, STATA, SurveyXact, EPI Data, SQL Server, Microsoft Excel/Access, m.fl., klargøre datasæt til videnskabelig analyse. Hertil tilbydes softwareudvikling i C#, RAD Studio, Delphi, VB, ASP.NET, .NET, .NETMF til individuelle løsninger, herunder dataadministration, dataindsamling, dataopsamling og målinger. Ekspertisen omfatter design, udvikling, implementering og support.

Datamanagerne er ligeledes behjælpelige med at søge om officielle tilladelser til at gennemføre videnskabelige studier via registre og undersøgelser. Datamanagerne kan også hjælpe med software licenser og kontakter til eksterne samarbejdspartnere, f.eks. vedrørende kurser.

Ved afslutning af projekter assisterer datamanagerne i forbindelse med overdragelse af data til f.eks. Dansk Dataarkiv, herunder opbygning af formatkatalog og dokumentation.

Sikkerhed

Sikkerhed og overholdelse af regler fra Datatilsynet og sikkerhedsreglerne på Aarhus Universitet er altafgørende ved behandling af personfølsomme/fortrolige data og er et ufravigeligt krav.

Personfølsomme data er typisk CPR, navn, bopæl. Men vær opmærksom på, at telefonnummer, e-mail eller andre unikke oplysninger, der gør en person identificerbar, også er personfølsomme oplysninger.

Ved personfølsomme oplysninger må du ikke:

  • sende fil/dokument vedhæftet en e-mail
  • lægge fil/dokument på offentlig tilgængeligt netværksdrev
  • udskrive lister på printer, der ligger tilgængelig for andre
  • flytte filerne til anden computer eller medie, der ikke er godkendt/krypteret
  • indflette direkte til præsentation, f.eks. Excel-ark, Stata datasæt til grund for diagram m.v.

Kontakt din datamanager, hvis du er i tvivl, har behov for hjælp.

Ved personfølsomme oplysninger skal du:

  • have godkendelse fra Datatilsynet

Normalt laves en nøglefil koblet til CPR-numre, og CPR anvendes herefter kun i forbindelse med yderligere registeropslag.

Datamanagerne sørger for, at du har fødselsoplysninger i form af dag, måned og årstal i formatet: dd-mm-åååå, køn m.v., yderligere information fra stamdata indsættes, dette kunne for eksempel være postnummer.

Du kan derfor arbejde helt uafhængig af CPR og er sikret mod uhensigtsmæssigt brug af fortrolige oplysninger.

Øvrige links:

Danmarks Statistik og Retningslinjer

For at kunne få adgang til registerdata på Danmarks Statistik (DST) skal der indgås en aftale om autorisation med DST, hvor forskningsprojektets formål klart og tydeligt beskrives og tidsperioden med start- og slutdato for arbejdet med registerdata, datasæt. Autoriseret godkendelse betyder, at der er adgang til DST's afidentificerede data på individ-, virksomhedsniveau (micro-niveau).

Som hovedregel skal vedkommende have et ansættelsesforhold ved instituttet i den periode projektet forløber. Der kan undtagelsesvist i tilfælde af samarbejdsprojekter gives tilladelser til personer uden ansættelse ved Instituttet. Dette vil dog kræve, at der er en Institutansat medarbejder, der skriftligt påtager sig ansvaret for at vedkommende overholder alle reglerne.

Det er en grundforventning at medarbejderen respekterer og overholder retningslinjerne for god forskningsetik inden for sit videnskabelige område (sundhedsvidenskab, socialvidenskab m.v.) og eventuelle retningslinjer gældende på Institut for Folkesundhed og Aarhus Universitet.

Data kan sammenkøres med DST's øvrige registre, andre myndigheders indberetning samt egne forskningsdata. Egne forskningsdata kan enten ligge på egen forskerserver på DST eller indsendes til DST.

Projektindstilling indeholdende en præcis beskrivelse af ønskede

  • population
  • registre
  • variabler
  • periode

Registre og variabler skal være angivet som beskrevet i DST’s registre- og variablebeskrivelse. DST's beskrivelse af databaser/registre er normalt bestående af generelt beskrivelse, historik, selve tabellerne i en given database, variable og eventuelle koder og sluttelig en udtræksvejledning. En vigtig information er tidsperiode for anvendelse af given variable, der udgår variable eller tilføjes nye som følge af ændringer i f.eks. behandling eller lovgivning. Egentlige databrud er beskrevet i den generelle beskrivelse.

Er der behov for 100 pct. populationsudtræk, skal dette begrundes nøje. Samtlige personer, der skal adgang skal oplyses med institut, mailadresse, mobilnummer og evt. eksisterende DST forskerident. Eksempel på projektindstilling kan se under Projektindstillingsskabelon.

Der skal altid være godkendelse fra Datatilsynet, hvis der arbejdes med identificerbare data. Dette gør sig normalt gældende i forbindelse med registerdata. Der skal endvidere foreligge godkendelser fra andre relevante myndigheder såfremt projektets natur kræver dette f.eks. Videnskabsetisk Råd, Sundhedsstyrelsen. Ved anvendelse af lægemiddeldata skal der ligeledes udarbejdes en protokol.

Vær opmærksom på, at godkendelse fra Datatilsyn kan tage 1-2 måneder, mens godkendelse fra Sundhedsstyrelsen kan tage 14 dage.

For instituttets retningslinjer vedrørende registre/fortrolige data, se retningslinjer for data fra Danmarks Statistik.

Vigtige ufravigelige bestemmelser. Alle medarbejdere som ønsker at bruge DST data skal rette henvendelse til Datamanagement med henblik på oprettelse og vejledning.

Med tilladelsen fra DST skal en række retningslinier som skal overholdes.

Overtrædelse af reglerne vil kunne få meget alvorlige konsekvenser for Instituttet og for den ansvarlige medarbejder.

  • Data er fortrolige i forhold til Forvaltningsloven §27, stk. 3 og Straffeloven §152
  • Kørsel må kun foregå på Institut for Folkesundheds arbejdsplads, hjemmearbejdsplads skal være i overensstemmelse med DK Stats og Aarhus Universitets retningslinjer. I tilfælde af at vedkommende ikke er ansat, skal den ansvarlige kunne dokumentere at kravene er opfyldt på vedkommendes arbejdsplads.
  • En computer opkoblet til DST må ikke overlades til andre. Forlades computeren skal den lukkes eller være frakoblet DST. Computeren skal være beskyttet mod uautoriseret brug.
  • Tilladelse gives til enkelt person. Password, token, brugernavn er streng fortroligt. Password, token, brugernavn må ikke videregives til andre.
  • Er flere medarbejdere inklusiv datamanager tilknyttet et projekt, skal hver enkelt medarbejder godkendes og have brugernavn, password tildelt af DST.
  • Der må ikke udtrækkes, kopieres data til download på egen computer. Alt arbejde skal foregå opkoblet til serveren på DST.
  • Det er ikke tilladt at foretage eller forsøge identifikation af enkelt individer/virksomheder.
  • Analyseresultater, tabeller, figurer, publiceringer må ikke muliggør identifikation af individer/virksomheder.
  • Ved projektet ophør tilbagegives token til DST ligesom alle publiceringer tilsendes DST.

Godkendt ansøgning fra DST skal i kopi sendes til institutlederen og tilknyttet datamanager.

Yderligere oplysninger kan også ses under Procedure for hjemtagelse af informationer fra Danmarks Statistik

Vejledning om Statens Serum Institut

Statens Serum Institut (SSI) har ansvaret for sundhedsregistre dækkende oplysninger om befolkningens sundhedsforhold. Registrene er delt op i administrative og forskningsregistre.

For komplet liste over registre på SSI, se venligst SSI registre

Sammenkøring med Landspatientregisteret og Lægemiddeldatabasen sker via Danmarks Statistik (DST) under forskerordningen. Der skal altid ansøges elektronisk om data, hvor der skal være tilladelse fra Datatilsynet, projekt- og udtræksbeskrivelse.

Udtræksbeskrivelse skal indeholde oplysninger om population/kohorte, afgrænsning i form af f.eks. diagnose, alder, køn, tid. Hvis de ønskede data er individbaseret skal tabel, variable og register oplyses i den af SSI/DST dokumenteret form.

Bemærk, nogle registre kræver flere tilladelser, f.eks. kræver Lægemiddeldatasen ved udtræk af særlige variable tilladelse fra Sundhedsstyrelsen.

For instituttets retningslinier vedrørende data, se retningslinier for data fra Danmarks Statistik.

For yderlig information om forskerservice fra SSI se links til højre.

Statistikprogrammer

Datamanagerne er behjælpelige med opbygning af datamateriale i STATA, SAS, SPSS m.v.

Mere konkret er vores hjælp normalt udformning og design af variabler til håndtering af et givent datamateriale, design af databaser og import/eksport af data til databaser og datasæt.

Endvidere udfører vi dataoprensning og udformning af scripts/forespørgsler og assistance i forbindelse med udformning af kørsler i statistikprogrammerne, hvor dette typisk sker i samarbejde med forskeren og under dennes vejledning.

Egentlig statistisk analyse og arbejde ligger udenfor datamanagernes kompetence og arbejdsopgaver. Der henvises i denne forbindelse til de videnskabelige medarbejdere på Institut for Folkesundhed.

Ældre datamateriale

Vi assisterer i forbindelse med ældre statistikprogrammer fra f.eks. DOS og overførsel af originalt materiale fra floppy disks m.v. samt rekonstruktion af ældre datamateriale.

STATA – hvilken version?

STATA leveres i flere versioner. Er forskningen direkte baseret på store registerudtræk anbefales STATA /SE, den licensbilligere STATA/IC anbefales til alle andre. Begge versioner kan håndtere ubegrænset antal observationer, forskellen ligger i antallet af variable, hvor SE kan håndtere 32.767 og IC 2.047. Antallet af højrestillet ( typisk uafhængige ) variable er henholdsvis 10.998 i SE og 798 i IC.

Databaser, dataset

SQL databaser og SQL server

Datamanagerne har deres egen sikker SQL server internt på HE IT på Health.

På denne server opbygges administrative databaser og opslagsdatabaser, som muliggør enkelt og direkte opslag til forskerne på diverse sundhedsvidenskabelige oplysninger og labels.

Endvidere muliggør den interne SQL server kørsler af meget store databaser, som det ikke er muligt på en enkelt PC eller for en enkelt person.

SAS, Stata, SPSS datasæt

Datamanagerne kan ud fra databaser lave datasæt til videnskabelig analyse. Dette vil typisk være datasæt til SAS, Stata og SPSS eller eksempelvis Microsoft Access/Excel. Ved anvendelse af CSV, XML kan vi understøtte de fleste programmer.

Flere af de store videnskabelige datasæt opbygges, opbevares, vedligeholdes på sikker server. Der laves typisk udtræk fra denne til den enkle forsker eller til rapporteringer.

Spørgeskema

Spørgeskemaer kan laves såvel i papirform som elektronisk på nettet.

Papirform

Spørgeskemaer på papir kan laves i EpiData. Når dataene er indsamlet, kan disse bruges direkte i statistikprogrammer og udfører statistiske analyser.

Elektronisk form

Elektroniske spørgeskemaer er normalt WEB baseret lavet i SurveyXact. Hele spørgeskemaet designes online og besvarelserne gemmes i en sikker database. Data fra besvarelsen overføres elektronisk af datamanagerne direkte til en intern database.

Deltagerne i undersøgelsen får via e-mail tilsendt URL (web adressen) til spørgeskemaet og udfylder online.

Login til SurveyXact

Hvis man allerede har en brugerkonto hos SurveyXact (ikke WAYF), skal man log ind i SurveyXact som hidtil ved at gå til loginsiden: http://survey-xact.dk

For oprettelsen af nye SurveyXact-brugerkonti for medarbejdere eller studerende på AU, skal oprettelsen nu foregår via WAYF.

Introduktion til WAYF: http://medarbejdere.au.dk/administration/it/digital/wayf/

Login til SurveyXact igennem WAYF: http://wayf.survey-xact.dk

Yderligere oplysninger kan ses her:

For at få oprettet et projekt og tildelt de rigtige rettigheder, i den rigtige organisation, kontakt Niels-Søren Bøgh fra Datamanagement (kontaktes efter afgivelsen af samtykke via WAYF).

Data-udtræk:

Datamanagement kan også være behjælpelig med at udtræk af dataset fra SurveyXact som Stata-dataset, hvilket vi kan gøre automatisk med value labels, variable labels etc.