En begränsad datauppsättning, enligt definitionen enligt förordningar som HIPAA i USA eller GDPR i Europa, tillåter endast data som har identifierats till en viss nivå. Detta innebär att information som direkt identifierar en individ har tagits bort eller förändrats. Det specifika för vad som är tillåtet beror emellertid starkt på tillämpliga regler och det specifika sammanhanget (t.ex. forskning, affärsanalys). Generellt sett kan en begränsad datauppsättning inkludera:
Potentiellt tillåtet (med lämpliga skyddsåtgärder och beroende på sammanhang):
* aggregerade data: Data kombinerade från flera individer, vilket förhindrar identifiering av en enda person (t.ex. medelålder för patienter med ett visst tillstånd).
* avidentifierade data med begränsade identifierare: Data där vissa identifierare hålls men deras koppling till en specifik individ är extremt svår. Detta är ett grått område och kräver noggrant övervägande. Exempel kan inkludera:
* datum (men ofta begränsat, t.ex. endast år, inte exakt datum): Födelseår kan vara acceptabelt, men inte födelsedatum.
* geografisk information (i stort sett definierad): Bostadstillstånd kan vara tillåtet, postnummer förmodligen inte.
* Åldersintervall (brett intervall): "65-74 år gammal" snarare än "68 år gammal."
* pseudonymiserade data: Data där identifierare ersätts med pseudonymer. En nyckel upprätthålls vanligtvis för att identifiera individer på nytt, men denna nyckel hålls säkert separat och åtkomst är begränsad.
* Data härrörande från andra data: Information som statistiskt härstammar från originaldata, men inte direkt identifierar individer (t.ex. korrelationer mellan variabler).
I allmänhet inte tillåtet:
* Direkt identifierare: Det här är saker som direkt identifierar en individ, som:
* Fullt namn
* Socialförsäkringsnummer
* Medicinskt registernummer
* Exakta geolokaliseringsdata
* E -postadress
* Telefonnummer
* IP -adress (såvida inte starkt anonymiserad)
* Biometriska identifierare (fingeravtryck, ansiktsskanningar)
* kvasi-identifierare: Information som, i kombination med annan information, kan användas för att identifiera en individ. Även om individuellt oskyldigt kan en kombination vara en risk (t.ex. ålder, kön, postnummer, specifikt tillstånd). Risken bedöms baserat på potential för återidentifiering.
Nyckelöverväganden:
* Återidentifieringsrisk: Den mest avgörande aspekten är potentialen för att identifiera individer från uppgifterna. Regler kräver ofta bedömningar av denna risk.
* Kontextuella faktorer: Den acceptabla nivån för deidentifiering kan variera beroende på syftet med dataanvändning och tillämpliga regler. Forskning kan tillåta mer avslappnade standarder än marknadsföringsanalys.
* Data minimering: Endast de nödvändiga uppgifterna bör inkluderas i det begränsade datasättet.
* Datasäkerhet: Robusta säkerhetsåtgärder är viktiga för att skydda begränsade datamängder från obehörig åtkomst.
Det är avgörande att konsultera relevant juridisk och reglerande vägledning för specifika krav innan du skapar och använder en begränsad datamängd. Mis tolkning kan leda till betydande juridiska och etiska frågor.