Na ogromne zbiory danych składają się dane użytkowników konkretnych aplikacji lub gier online, informacje klientów o lokalizacji dostarczane przez operatorów telefonii komórkowej, dane z urządzeń fitness, mediów społecznościowych, usług pobierania filmów, spisów publicznych, systemów punktowania wiernych klientów np. w supermarketach, historii zakupów w sklepach online lub danych sensorycznych przenośnych (i skomunikowanych ze sobą) urządzeń (domowych).
Krótko mówiąc: niemal każda aktywność użytkownika w przestrzeni cyfrowej jest powiązana z pobraniem danych. A ponieważ dzieje się to 24 godziny na dobę, zbiory danych są już niewyobrażalnie duże.
Zależnie od celu, zbiera się i analizuje dane z różnych źródeł i w ten sposób uzyskuje nowe informacje. Z masy danych można wyciągnąć szerokie wnioski na przykład o aktualnej opinii publicznej na wybrany temat, uzyskać nową wiedzę medyczną czy utworzyć prognozę zachowań konsumenckich. Wyniki analizy Big Data stają się interesujące dla producentów, usługodawców, banków, agencji ubezpieczeniowych, pracodawców, naukowców lub komisji śledczych, wykorzystujących uzyskane wnioski do swojej pracy.
Ogromne ilości danych szybko stają się „maszynką do robienia pieniędzy“ –wtedy, gdy za ich magazynowaniem stoją interesy gospodarcze, a przedsiębiorstwa kupują dane jak towar. Użytkownicy tracą powoli wpływ na to, kto przejmuje i wykorzystuje ich własne dane. Zadaniem ochrony danych jest właściwie zapobieganie takim nadużyciom. Jednak w obliczu Big Data ochrona danych stoi przed wieloma dalszymi wyzwaniami:
Użytkownikom internetu trudno uciec przed ściąganiem danych przez sieć. Jednak wyposażeni w odpowiednią wiedzę i kompetencje mogą odpowiedzialnie obchodzić się ze swoimi danymi i kontrolować, jakie informacje podają w internecie. Szczególnie dzieci i młodzież powinny być odpowiednio wcześnie uwrażliwiane na tę kwestię.