Det första du måste göra när du skapar en ny datakälla är
Definiera dess syfte och omfattning .
Innan du ens börjar tänka på databaser, filformat eller API:er måste du tydligt formulera:
* Vilka frågor kommer denna datakälla att svara? Detta dikterar vilken information du behöver samla in.
* Vem kommer att använda den här datakällan? Detta informerar kraven på format och tillgänglighet.
* Vad är den förväntade volymen och hastigheten för data? Detta hjälper dig att välja lämplig teknik.
* Vilka är datakvalitetskraven? Noggrannhet, fullständighet och konsistens är avgörande.
* Vad är säkerhets- och integritetsöverväganden? Datastyrning är avgörande från början.
Utan ett väl definierat syfte och omfattning riskerar du att bygga en datakälla som är ineffektiv, felaktig och i slutändan värdelös. Allt annat - teknikval, datamodellering etc. - bör flyta från detta första, avgörande steg.