Velike količine podataka potječu primjerice od korisnika određene aplikacije ili igrice, od podataka o lokalizaciji korisnika telekomunikacijskih usluga, mobilnih uređaja za praćenje tjelesnih aktivnosti, podataka društvenih mreža, ponuđača prijenosa video sadržaja, podataka javnih registara, sustava za prikupljanje bonus bodova trgovačkih lanaca, popisa prodaja od internetskih trgovaca ili podataka prikupljenih pomoću senzora mobilnih i umreženih uređaja (u kućanstvu).
Ukratko: skoro svaka akcija korisnika u digitalnom prostoru povezana je sa skupljanjem podataka. I budući da se to događa neprekidno, u kratkom se vremenu skupi velika količina podataka.
Ovisno o namjeri, podaci iz različitih izvora skupljaju se i analiziraju tako da iz toga mogu izvesti nove informacije. Iz tih masovnih podataka mogu se primjerice generirati obuhvatne studije o mišljenju ljudi, o novim spoznajama u medicini ili vršiti prognoze o potrošačima. Rezultati analiza provedenih na takvim velikim količinama podataka zanimljive su proizvođačima, bankama, osiguravajućim društvima, poslodavcima, znanstvenicima ili državnim istražnim organima koji ih koriste za svoj rad.
Velike količine podataka mogu biti i unosan posao – kada iza sakupljanja osobnih podataka stoje ekonomski interesi i kada ekonomski subjekti takve podatke mogu kupovati kao proizvode. Kod koga će ti podaci na kraju završiti i što će se s njima dogoditi, o tome korisnici više onda ne odlučuju. Zaštita osobnih podataka zapravo treba spriječiti takvu zloupotrebu. Uzimajući u obzir fenomen velikih količina podataka, koncept zaštite suočava se s dodatnim izazovima:
Korisnici interneta skupljanje podataka teško mogu izbjeći. Određeno znanje i kompetencije mogu im međutim pomoći da suvereno i samoodređeno rukuju svojim podacima i kontroliraju koje informacije o sebi odaju na internetu. Posebno djecu i mlade trebalo bi rano senzibilizirati za tu temu.