3.5.1. Hvordan klassifisere dataene?
I utgangspunktet er det ikke mulig å klassifisere personopplysninger basert på datakilde. Vi kan for eksempel ikke si at lydopptak eller spørreundersøkelser har en gitt farge. Dette er fordi ulike datakilder kan inneholde vidt forskjellige personopplysninger. Et lyd- eller videoopptak av personer som snakker om egne psykiske lidelser vil utgjøre helseopplysninger og er dermed røde data. Et lyd- eller videoopptak av noen som snakker om hvor effektivt de jobber på hjemmekontor kontra kontorfellesskapet på arbeidsplassen, vil nok utgjøre gule data.
Når det er sagt er video et medium som samler inn store mengder informasjon. I en intervjusituasjon vil ikke bare svarene til deltageren registreres, men også stemme, tonefall, ansikt, uttrykk og kroppsspråk. Det kan dermed argumenteres for at videoopptak i forskning aldri kan utgjøre grønne data. Det kan derfor være greit å alltid ta utgangspunkt i at videoopptak er gule data som blir til røde data hvis de i tillegg inneholder særlige kategorier av personopplysninger.
Når det gjelder spørreskjema, er dette også en datakilde som kan samle inn vidt forskjellige typer personopplysninger. Planlegger du for eksempel å stille spørsmål vedrørende politisk eller filosofisk overbevisning, utgjør dette røde data. Samler du inn opplysninger om i hvilken grad dette kurset har bidratt til grunnleggende opplæring innenfor personvern, utgjør dette gule eller grønne data.
Det viktige er uansett at vi gjør en selvstendig og konkret vurdering basert på hvilke personopplysninger vi skal samle inn, hvilken kategori disse faller i og deretter hvilken farge de har.
Det vil alltid være en fordel å legge til rette for innsamling av den fargen data du har tiltenkt. Hvis du for eksempel utformer spørsmål til et spørreskjema hvor respondentene i utgangspunktet bare skal gi fra seg informasjon som klassifiseres som gule data, vil det være lurt å minimere risikoen for å samle inn røde data ved å gjøre enkelte tiltak. Et slikt tiltak – som også vil være hensiktsmessig for å oppfylle dataminimeringsprinsippet – er å kun benytte fritekstfelt der det er strengt nødvendig. Hvis du forhåndsdefinerer svaralternativene, har du full kontroll på hvilke opplysninger som samles inn. Hvis du derimot lar respondenten selv formulere svaret fritt i et fritekstfelt, vet du ikke hvilke opplysninger som potensielt kan samles inn.
Ofte ser man på slutten av et spørreskjema et spørsmål av typen: «Er det noe annet du vil opplyse om som kan være relevant for prosjektet?». Det er lett å tenke seg at dette kan være nyttig. Kanskje får man inn noe informasjon man ikke har tenkt på som kan være kjekk å ha? Det kan imidlertid være problematisk med tanke på hvilke data man har planlagt å samle inn. Har du kun tatt høyde for grønne og gule data, har du ikke kontroll over om respondenten skriver inn røde data i fritekstfeltet.
Personopplysninger i seg selv vil ikke skifte farge over tidens løp. En helseopplysning vil være rød fra den samles inn til den slettes eller anonymiseres. Men, hvis opplysningene anonymiseres og ikke lenger kan knyttes til en enkeltperson, mister opplysningen sin sensitive karakter. Dette betyr at anonymisering kan endre fargen på opplysningene, slik at for eksempel røde personopplysninger blir til anonyme gule data.