Hitri podatki
Podobno kot v svetu avtomobilizma, je velikost impresivna, a poglede vlečejo predvsem hitri lepotci. Hitri podatki so tisti, katerih uporabnost s časom hitro pada. Gre torej za različne podatke iz družabnih omrežij in pretočnih storitev, ki jih morajo podjetja zajeti in analizirati v realnem času ter si tako omogočiti sprejemanje kar najbolj natančnih in predvsem takojšnjih odločitev. Podjetja, ki trgujejo z vrednostnimi papirji, dobičke kujejo prav z (algoritemskim) obvladovanjem hitrih podatkov.
Počasni podatki
Na drugem koncu palice imamo počasne podatke, ki jih bodo analitična orodja potrebovala redkeje. V tem primeru spremljanje v realnem času ni potrebno, saj se podatki počasneje spreminjajo. Spominjajo na bojo, ki meri plimovanje morja. Informatiki te podatke zajamejo v podatkovno jezero, kjer do njih dostopajo aplikacije, ki jih potrebujejo.
Mali podatki
S tem terminom označujemo vse podatke, ki jih lahko shranite na prenosnem računalniku. Veliko analiz podatkov se v podjetjih še vedno opravi na manjših (omejenih) količinah podatkov na računalnikih zaposlenih s preprostimi aplikacijami - na primer Excelom.
Srednji podatki
Če imamo velike in male podatke, je logično, da obstajajo tudi srednji. Ko je govora o petabajtih, gre za velike podatke. Podjetja za njihovo analizo uporabljajo tehnologije, kot sta Hadoop in MapReduce. V Sloveniji) opravka s tolikšno količino podatkov nimamo prav pogosto, imamo pa zato več izkušenj z gigabajti ali morebiti terabajti podatkov, ki sodijo v srednji razred.
Podatki v temi
Podatki v temi (dark data) so podatki, ki jih podjetja spregledajo in zato tudi ne uporabijo. Zaposleni običajno sploh ne vedo, da obstajajo, do njih ne znajo ali ne smejo dostopati ali pa nimajo na voljo orodja, s katerimi bi jih lahko obdelali. Podatke v temi največkrat ustvarijo uporabniške pravice v bazah, skladiščih in jezerih podatkov.
Umazani podatki
To so podatki, ki pred uporabo v analitične namene še niso bili očiščeni. »Čiščenje« lahko pomeni podrobno izbiro dela podatkov, njihovo bogatenje ali pa pretvarjanje na skupni imenovalec. Uporaba umazanih podatkov v analitične namene ni primerna, saj bomo zelo verjetno dobili kup napačnih odgovorov.