Loading AI tools
Van Wikipedia, de vrije encyclopedie
Big data of massadata[1] zijn gegevensverzamelingen (datasets) die te groot en te weinig gestructureerd zijn om met reguliere databasemanagementsystemen te worden onderhouden. De gegevens hebben een direct of indirect verband met privégegevens van personen. [2] Big data spelen een steeds grotere rol. De hoeveelheid data die opgeslagen wordt, groeit exponentieel. Dit komt doordat consumenten bij sociale media in toenemende mate data opslaan in de vorm van bestanden, foto's en films (bijvoorbeeld op Facebook of YouTube, waar Facebook ook de door de gebruikers gewiste data bewaart) en organisaties, overheden en bedrijven steeds meer data over burgers produceren en opslaan, en doordat apparaten zelf data verzamelen, opslaan en uitwisselen (het zogenaamde internet der dingen). Hierdoor is er steeds meer sensordata beschikbaar. Niet alleen de opslag van deze hoeveelheden is een uitdaging, maar ook het analyseren ervan. Deze data bevatten namelijk informatie voor doeleinden zoals marketing, wetenschappelijk onderzoek, of preventief onderhoud.
De definitie van big data is niet altijd duidelijk en de term wordt soms ten onrechte gebruikt. Volgens Gartner gaat het om drie factoren:[3]
Als aan minimaal twee van bovenstaande kenmerken aanwezig zijn, spreekt men in het algemeen over big data.
Drie andere kenmerken zijn:
In het Engels worden deze eigenschappen vaak aangeduid als 'de v's', volume, velocity en variety voor de eerste drie kenmerken en variability en veracity voor variatie en kwaliteit.[4]
De gegevens in big data kunnen worden onderscheiden in primaire bronnen (waar daadwerkelijk gegevens worden gegenereerd) en secundaire bronnen (waarbij bestaande gegevens worden gekoppeld en hergebruikt).[5]
Conform de Wet van Moore verdubbelt ongeveer elke twee jaar de rekencapaciteit en het opslagvermogen van microchips. Door deze exponentiële groei en het inzakken van de kosten, raakt technologie steeds verder verspreid en ingebed in de samenleving. In toenemende mate is de technologie uitgerust met sensoren die data vastleggen en/of doorgeven. Grote hoeveelheden gegevens worden gegenereerd door onder meer sensoren (zoals camera's en microfoons), trackers (zoals RFID-tags en cookies op internet) en apparaten die we bij ons dragen of in huis hebben en op het internet of things zijn aangesloten (zoals mobiele telefoons, horloges, brillen, gehoorapparaten, pacemakers). Daarnaast leggen veel mensen gegevens over zichzelf vast op sociale media.
Door het hergebruik van gegevens, bijvoorbeeld via het combineren van bestaande datasets, kunnen ook big data ontstaan. Het hergebruik van gegevens kan worden onderscheiden in hergebruik voor dezelfde doelen in dezelfde context (data recycling), voor andere doelen dan waarvoor de gegevens initieel zijn verzameld, maar wel in dezelfde context als het originele doel (data repurposing) of in een andere context (data recontextualisation).[6] Hergebruik van gegevens voor nieuwe doelen of in een andere context kan stuiten op de wettelijke kaders voor de bescherming van persoonsgegevens.
Big data hebben tot de opleving van het vakgebied van de datascientist en een hernieuwde belangstelling voor het beroep van data-analist geleid. Hierbij gaat het om de statistische analyse van de gegevens, waarbij men nog onbekende verbanden probeert te ontdekken. Er is geen vastomlijnde definitie van een datascientist, maar over het algemeen heeft een datascientist veel kennis van metadata en dataconversie in combinatie met meer algemene kennis over de verwerking van gegevensbestanden, programmeren en wiskunde.
Een data concierge is iemand die big data verzamelt en consolideert tot bruikbare informatie. Deze persoon is vaak het eerste aanspreekpunt voor onderzoekers die toegang tot specifieke datasets willen voor specifieke onderzoeksvragen. De verzoeken wisselen van eenvoudige gegevens met minimale regelgevingsproblemen tot geanonimiseerde, beperkte of volledige PHI-gegevenssets.[7]
De IT-industrie richt zich vaker op nieuwe gegevensbronnen, die voornamelijk over consumenten worden verzameld, waardoor de functie van een data concierge de afgelopen jaren steeds gebruikelijker is geworden.[8]
De grootste verzamelaars van persoonlijke big data zijn de sociale media en overheden met als belangrijkste doel fraudebestrijding, zoals in Nederland iCov en het Inlichtingenbureau. De Amerikaanse spionagedienst National Security Agency (NSA) verzamelt data uit communicatie via telefonie en internet met Google en Facebook.[9]
De Algemene verordening gegevensbescherming (AVG) regelt de omgang met persoonsgegevens, en definieert de rechten van individuen en de plichten voor partijen die persoonsgegevens verwerken. De werking van de AVG is breed: zij is van toepassing op alle tot een persoon herleidbare gegevens en vormt een belangrijk uitgangspunt voor de verantwoorde omgang met persoonsgegevens.
onbekendheid met en onzekerheid over de toepassing en implicaties van wettelijke eisen hun parten speelt. Daarnaast worden sommige eisen als lastig en zelfs als onuitvoerbaar ervaren. Een verantwoorde verwerking van gegevens biedt alle partijen echter voordelen. Consumenten zullen eerder bereid zijn om gegevens te delen in het vertrouwen dat bedrijven zorgvuldig met hun gegevens omgaan en er mogelijkheden zijn tot controle en verantwoording. Bedrijven profiteren van het vertrouwen dat consumenten in hen stellen en kunnen daardoor datagedreven producten en diensten blijven ontwikkelen. Het maakt bovendien de bedrijfsvoering rond gegevens inzichtelijk en controleerbaar en ondervangt daarmee bepaalde risico’s zoals datalekken. De wetgeving, die soms wordt ervaren als een last, kan als een prikkel fungeren om op verantwoorde wijze met persoonsgegevens om te gaan en daarin nationaal en internationaal zelfs onderscheidend te zijn.[11]
Big data kunnen volgens de Wetenschappelijke Raad voor het Regeringsbeleid uitsluitend vruchten afwerpen als de huidige wet- en regelgeving wordt versterkt om fundamentele rechten en vrijheden te waarborgen. Hiertoe moet de aandacht worden verlegd van het reguleren van het verzamelen van data – het zwaartepunt in de huidige juridische kaders – naar de regulering van en het toezicht op de fases van de analyse en het gebruik van big data. Voor de vrijheid en de veiligheid van de burgers doen zich in deze twee fasen van big-dataprocessen de grootste kansen én de grootste risico’s voor.
Veiligheidsorganisaties kunnen en mogen diep ingrijpen in de rechten en vrijheden van burgers. Het gebruik big-datatoepassingen - die sturend voor dat ingrijpen worden - moet daarom met extra waarborgen worden omkleed. Dat kan door:
Het gebruik van big data, het internet of things en kunstmatige intelligentie tast (mogelijk) de grondrechten in Nederland aan.[13]
Het analyseren van big data wordt ingezet voor het bestrijden van criminaliteit (waaronder fraude), het reconstrueren van aanslagen en in kaart brengen van criminele netwerken om daders gemakkelijker op te sporen, het controleren van crisissituaties, en voor crowd control bij evenementen. Als voordeel geldt dat hierbij tijdwinst en efficiëntie wordt behaald en dat de gegevens in real time kunnen worden verwerkt. Politiemensen en veiligheidsfunctionarissen kunnen bijvoorbeeld snel een beeld krijgen van een situatie ter plaatse.
Als nadeel geldt de grootschalige inmenging in de persoonlijke levenssfeer - ook van niet-criminele burgers - waarbij privacy en vrije meningsuiting in gevaar zijn. Dit kan tot gevolg hebben dat de samenleving haar gedrag daarop aanpast. Verder worden burgers steeds transparanter terwijl de persoons- en organisatie-profielen, algoritmen en methoden die overheidsorganisaties gebruiken dit niet zijn. Big data-toepassingen kunnen leiden tot toename in sociale stratificatie waardoor er (grotere) ongelijke verhoudingen tussen maatschappelijke groepen ontstaan.
Big data-toepassingen kunnen andere doelen hebben dan waarvoor de data in beginsel voor waren verzameld (zogeheten function creep), aangezien secundair gebruik van big data-toepassingen een meerwaarde zijn op van de verzamelde data.[14]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.