Meten is onderzoeken - 20 jaar Tegenlicht in data
June 23, 2022
Wat data van 20 jaar Tegenlicht kan zeggen … en wat niet.
Willemien Sanders (Utrecht Universiteit en Beeld & Geluid)
Rana Klein (Beeld & Geluid)
Mari Wigham (Beeld & Geluid)
William de Bruijn (VPRO)
Inleiding
In september 2002 startte bij VPRO Televisie de reeks Tegenlicht met wekelijkse tv-afleveringen en een bijbehorende website die door de jaren heen steeds verder werd uitgebreid. Inmiddels is Tegenlicht uitgegroeid naar een ‘merk’ met permanente aanwezigheid op 11 platforms: naast tv en website is dat op YouTube, Facebook, Instagram en Twitter. Tegenlicht produceert daarnaast podcasts, ‘Tegenlicht in de klas’, een wekelijkse nieuwsbrief, Tegenlicht MeetUps en een jaarlijkse pioniersverkiezing. Naar aanleiding van het 20-jarig jubileum werd eveneens een Archief van de Toekomst ontwikkeld.
Tegenlicht identificeert zich als ‘future affairs’. Wie over de toekomst praat, praat al snel over technologie: technologie wordt immers vaak gezien als een domein voor toekomstgerichte oplossingen. Daarbij speelt de toenemende productie en analyse van data een steeds grotere rol: op basis van het meten van allerlei facetten van het menselijk leven worden analyses uitgevoerd die de basis vormen voor beleid en productontwikkeling (zie bijvoorbeeld Marr 2016). Er bestaat een groot vertrouwen in data. Ze zijn ‘objectief’ en “meten is weten” luidt het adagium. We zetten artificiële intelligentie (AI) inmiddels in voor allerlei functies, van het ontgrendelen van onze smartphones door gezichtsherkenning tot het digitaliseren van handgeschreven tekst. De mogelijkheden lijken eindeloos.
Tijdens gesprekken met de redactie bleek dat er aanvankelijk bij Tegenlicht enthousiasme was over de technologische en digitale mogelijkheden en ontwikkelingen aan het begin van de 21e eeuw. Echter, de vertekeningen in data, de consequenties daarvan bij het gebruik van algoritmes, de groeiende surveillance-industrie en de kosten voor zaken als privacy, gelijkheid en rechtvaardigheid, zorgen voor kritische noten bij het geloof in digitale en data-technologie als oplossing (zie o.a. D’Ignazio and Klein 2020, O’Neil 2017). De redactie van Tegenlicht spreekt zelf, na jaren van optimisme, over een geleidelijke kentering in het vertrouwen in technologie als oplossing en van een groeiende scepsis. Dit was aanleiding om in een Data Story over 20 jaar Tegenlicht het vizier te richten op ‘technologie’.1
In deze Data Story diepen we de relatie van Tegenlicht met technologie uit aan de hand van de volgende onderzoeksvraag: Hoe heeft de aandacht voor technologie in verschillende facetten zich in 20 jaar Tegenlicht ontwikkeld? Omdat we voor deze Data Story onderzoek doen op basis van metadata van afleveringen van Tegenlicht2 stellen we ook de vraag wat we kunnen meten en wat niet. In deze Data Story gaan we dan ook nader in op de beperkingen van data-onderzoek en de noodzaak een kritisch perspectief aan te nemen ten opzichte van data en analyses, waarmee we aansluiten op bovengenoemde discussie.
Data
Voor het onderzoeken van de vraag naar technologie in Tegenlicht hebben we gebruik gemaakt van transcripten van afleveringen van Tegenlicht: bestanden met de letterlijke, al dan niet vertaalde teksten die gesproken worden in de afleveringen. Alleen door de redactie zelf gemaakte afleveringen zijn meegenomen, aangekochte afleveringen zijn buiten beschouwing gelaten. Door de oorlog in Oekraïne was het niet mogelijk deze set compleet te maken (zie Methodische verantwoording). Figuur 1 toont de beschikbaarheid van transcripten van Tegenlicht per jaar in percentages. Hieruit blijkt dat met name transcripties uit de beginperiode missen. Bij de interpretatie van de resultaten hebben we hier uiteraard rekening mee gehouden.
Figuur 1. Beschikbaarheid van Tegenlicht-transcripten in percentages.
De 20 seizoenen Tegenlicht zijn verdeeld over 21 kalenderjaren doordat televisieseizoenen lopen van september tot en met juni. De uiteindelijke data bestaan uit de transcripten van 482 van de in totaal 526 afleveringen van Tegenlicht (92%). Deze zijn aangeleverd door de Tegenlichtredactie.
De redactie van Tegenlicht heeft hard gewerkt aan het produceren van de dataset en gepoogd deze zo compleet mogelijk te maken. Ze heeft onder andere elke aflevering aan een van twintig thema’s gekoppeld. Tegelijkertijd vormen de transcripten van twintig jaar Tegenlicht voor kwantitatief onderzoek een vrij kleine dataset en zijn de data niet volledig. De door de redactie gekozen thema’s lopen niet continu door, zijn niet gelijk verdeeld over de twee decennia en afleveringen binnen hetzelfde thema kunnen zeer verschillende onderwerpen vanuit verschillende perspectieven behandelen. Daarnaast stelt de redactie dat elke aflevering als stand-alone is gemaakt, vaak met een sterk redactioneel stempel. Dit alles maakt het uitdagend om grip te krijgen op de data en hun precieze betekenis.
Ondanks deze beperkingen vormen de data een rijke bron waarmee op verschillende manieren inzicht kan worden verkregen in 20 jaar Tegenlicht. Ook is er de afgelopen twintig jaar veel gebeurd in de ontwikkeling van met name digitale technologie. Wat is daarvan in Tegenlicht te zien?
Analyses
Om kwantitatief onderzoek uit te voeren voor een bepaalde vraag, moet die vraag eerst worden ‘geoperationaliseerd’ - vertaald in iets wat kwantificeerbaar en meetbaar is in data. Voor de analyses hebben we eerst gekeken naar de aanwezigheid van specifieke termen binnen de transcripten van Tegenlicht. Deze termen geven we weer tussen “dubbele aanhalingstekens”, vergelijkbaar met hoe je in Google op specifieke termen zoekt. Wanneer we in algemenere zin over begrippen spreken of verwijzen naar een groep termen, gebruiken we ‘enkele aanhalingstekens’.
Vanuit de resultaten zijn we verder gaan kijken en hebben we vervolganalyses uitgevoerd. D’Ignazio en Klein (2020) verwijzen naar data analyse als storyfinding en dat sluit aan bij onze aanpak: op basis van een vraag vanuit geïnformeerde analyses op zoek naar het verhaal. Daarbij zijn we begonnen met het overkoepelende begrip ‘technologie’.
We hebben ervoor gekozen relatieve grafieken op te nemen, die percentages tonen in plaats van absolute aantallen, om vertekening door onbalansen in de dataset te voorkomen.
Voor een nadere toelichting op de werkwijze, zie de Methodische verantwoording.
Technologie in Tegenlicht
We hebben aanvankelijk gekeken naar de aanwezigheid van termen als ‘technologie’ en ‘technologisch’ door te zoeken op ”*technologi*”. Figuur 2 laat de resultaten zien in de dataset van 20 jaar Tegenlicht.
Figuur 2. Aanwezigheid van ”*technologi*” in 20 jaar Tegenlicht.
De analyse van de aanwezigheid van de term ”*technologi*” laat een piek zien in termen als technologie en technologisch in 2008 en daarna in grote lijnen een toename tussen 2010 en 2015. Daarna volgt een daling tot 2019 en weer een stijging tot 2022. Dit laat zien dat technologie een terugkerend onderwerp is dat in alle jaren aan bod komt, zij het in verschillende mate.
De zoekterm ”*technologi*” telt alle keren dat “technologi” voorkomt, al of niet als deel van een grotere term, zoals technologisch, internettechnologie of technologievraagstuk. Het is daardoor niet helder welke woorden precies meegeteld worden. Daarom hebben we ook gezocht op de specifieke termen “technologie”, “technologieën”, “technologisch” en “technologische”. We verwijzen hier in het vervolg naar als de ‘technologie-termen’. Figuur 3 laat de resultaten zien.
Figuur 3. Technologie-termen in Tegenlicht.
Figuur 3 verschilt weinig van figuur 2. Dit duidt erop dat er naast de gezochte termen weinig andere varianten van woorden met ‘technologi’ voorkomen in Tegenlicht. Voor verdere analyses hebben we dan ook de bovengenoemde vier technologie-termen gebruikt, zodat we weten wat we meten.
In figuur 2 en figuur 3 is een piek te zien in 2022 (waarvan pas een half seizoen is uitgezonden ten tijde van het schrijven van dit verhaal). Bij navraag blijkt dat vanwege de actualiteit rond AI en de rol ervan in bijvoorbeeld de toeslagen-affaire, het opduiken van The Metaverse en de tijdgeest in het algemeen, eind 2021 de eindredactie en redactie samen met regisseurs besloten de voorjaarsreeks 2022 te beginnen met een soort drieluik over de nieuwe ontwikkelingen in de digitale technologie (de Bruijn 2022b). Dit illustreert het gegeven dat data op zich niet zoveel zeggen; je hebt domeinkennis nodig om ze goed te kunnen interpreteren.
Figuren 2 en 3 nodigen vanwege de pieken en dalen uit ‘technologie’ verder te onderzoeken. De afleveringen van Tegenlicht zijn allemaal gekoppeld aan een thema. Figuur 4 laat zien binnen welke thema’s de technologie-termen voorkomen, verspreid over de 20 jaar Tegenlicht.
Figuur 4. Aanwezigheid van technologie-termen binnen de verschillende thema’s van 20 jaar Tegenlicht.
Naast de algehele toename uit figuren 2 en 3 is in figuur 4 ook een spreiding over steeds meer thema’s zichtbaar. Technologie-termen komen aan het begin voor in het thema Economie maar dat lijkt eenmalig, de lijn onderaan de visualisatie daalt meteen en blijft onderin steken. Daarna volgen Energie, Internet, Klimaat en Technologie. Deze thema’s duiden op aandacht voor technologie in relatie tot duurzaamheid alsmede tot digitale technologie.
We hebben de neiging om naar een grafiek te kijken en daar gelijk conclusies aan te verbinden maar we moeten daar zorgvuldig mee omgaan. Ontwikkelingen in een grafiek kunnen duiden op (significante) veranderingen maar ze kunnen ook voortkomen uit eigenaardigheden in de data. In figuur 4 bijvoorbeeld kan een afname bij een thema simpelweg betekenen dat er in dat jaar geen aflevering was binnen dat thema. Tegelijkertijd komt ‘technologie’ uiteindelijk in alle thema’s voor. Dit suggereert dat technologie een rol is gaan spelen in een toenemend aantal maatschappelijke domeinen. Reden om dit verder te onderzoeken.
Technologie is een overkoepelende term voor verschillende fenomenen. Voor een nadere analyse richten we ons met name op digitale technologie, omdat de ontwikkeling daarbinnen gevolgen hebben voor vele sectoren en praktijken. We kijken hieronder naar verschillende aspecten van technologie.
Aspecten van technologie
Bij het onderzoeken van aspecten van technologie hebben we gezocht op een aantal begrippen gerelateerd aan software en een aantal gerelateerd aan hardware. We hebben daarbij eerst naar een aantal voor de hand liggende termen gekeken: computer, smartphone, website en app, google en algoritme. Bij computer bleek hoe problematisch het zoeken op een term die ruimte laat voor samengestelde en afgeleide woorden is, dus met als zoekterm ”computer*”, is. Deze zoekterm telt naast woorden als computerscherm (hardware) ook computerprogramma (software) en computervaardig (geen van beide). Met andere worden: de resultaten uit een dergelijke analyse zijn diffuus. Vandaar dat we bij het zoeken naar aspecten van technologie gekozen hebben voor een beperkt aantal concrete termen, inclusief varianten voor enkelvoud en meervoud.
Computer
Technologie hangt nauw samen met machines en apparaten. Figuur 5 toont de aanwezigheid van ‘computer’ (“computer” en “computers”) in de transcripten.
Figuur 5. De aanwezigheid van “computer” en “computers” in Tegenlicht.
In grote lijnen is in figuur 5 een toename van ‘computer’ te zien tot en piek in 2014 en daarna een afname. In 2014 waren er 24 afleveringen in elf thema’s. Waar die piek precies aan ligt, kunnen we dus zo niet zeggen, maar een duidelijk verband met ‘technologie’ is nog niet te zien.
Smartphone
Tegenwoordig worden steeds meer diensten specifiek ontwikkeld voor de smartphone. Figuur 6 laat de aanwezigheid van dit woord in de data van Tegenlicht zien.
Figuur 6. De aanwezigheid van “smartphone” en “smartphones” in Tegenlicht.
Figuur 6 weerspiegelt de opkomst van de smartphone aan het einde van het eerste decennium van de 21e eeuw en toont een grote toename van de term tot en met 2014-2015 en vervolgens een afname. De piek is niet logisch te verklaren vanuit de algemene technologische ontwikkelingen: hoewel er andere ‘schermen’ bijkwamen, zoals de tablet, is de smartphone een steeds centraler rol gaan spelen in velerlei alledaagse handelingen. De piek is derhalve wellicht te verklaren door de thematiek van individuele afleveringen van Tegenlicht. De piek in 2022 is wellicht te verklaren door de voice-over tekst waarin naar het Archief van de Toekomst wordt verwezen, we hebben hier niet specifiek naar gekeken. Dergelijke terugkerende teksten kunnen de uitkomsten vertekenen.
Website en app
Figuur 7 toont de aanwezigheid van de begrippen ‘website’ en ‘app’ in de dataset.
Figuur 7. De aanwezigheid van de termen “app”, “apps”, “website” en “websites” in Tegenlicht.
Niet geheel verrassend laat Figuur 7 zien dat ‘website’ vanaf het begin van Tegenlicht wordt genoemd. Daarentegen komt ‘app’ pas vanaf 2013 op. In 2007 werd het besturingssysteem Android geïntroduceerd (Cheng 2007), evenals Apple’s IOS voor de iphone (iCulture 2022). In de jaren daarna zijn in toenemende mate producten en diensten ontwikkeld in de vorm van apps, naast websites, hetgeen de opkomst van ‘app’ kan verklaren.
Een verklaring voor de schommeling in het aantal keren dat ‘app’ wordt genoemd kan zijn dat apps voor 2016 opkwamen maar sindsdien gemeengoed zijn geworden en in de jaren daarna veel minder expliciet zijn benoemd.
De piek in 2022 in Figuur 7 kan wederom te maken hebben met het noemen van het Archief van de Toekomst in de voice-over tekst van afleveringen van Tegenlicht. De meer consistente score van de term ‘website’ kan wellicht eveneens worden verklaard door de verwijzing naar de website van Tegenlicht in de voice-over tekst. Kennis van de data blijkt ook hier noodzakelijk om de resultaten goed te kunnen interpreteren.
Op het gebied van software was Google al snel een grote speler, aanvankelijk vooral als zoekmachine maar tegenwoordig als aanbieder van tal van producten en diensten. Figuur 8 toont de aanwezigheid van “google” alsmede van de werkwoordsvormen “googlen”, “googlet” en “googled” in de data.
Figuur 8. Aanwezigheid van de term “google” en de termen “googlen”, “googlet” en “googled” in de dataset.
Google werd opgericht in 1998 en ging in 2004 naar de beurs (Trends 2018). In 2005 werden eveneens Google Earth en Google Maps gelanceerd (Gibbs 2015). De eerste piek in ‘google’ in 2006 roept allerlei vragen op. Nader onderzoek leert dat er in mei 2006 een aflevering over Google was, hetgeen de piek in figuur 8 verklaart. Na de eerste piek wordt het even rustig rond ‘google’ maar vanaf 2011 is er een min of met constante aanwezigheid van deze term in de data. Je zou denken dat dit de dominante positie van deze term in het technologiediscours weerspiegelt. Echter, de werkwoordsvormen komen veel minder voor: slechts in geringe mate in 2009 en 2010. De manier waarop “googlen” tegenwoordig wordt gebruikt als synoniem voor zoeken, is hier niet zichtbaar.
Als een analyse daadwerkelijk een ontwikkeling laat zien, is nog de vraag wat deze betekent. Daar is domeinkennis weer onontbeerlijk, in dit geval over de specifieke aflevering over Google. De redactie vertelde dat deze werd gemaakt door twee regisseurs die in de ban waren geraakt van al het nieuws uit Silicon Valley (de eerste tweet, de introductie van de iphone), dat werd gezien als een nieuw domein voor Tegenlicht. Met veel geduld en doorzettingsvermogen lukte het hen bij Google binnen te komen (de Bruijn 2022d, 2022e). Deze informatie illustreert de individuele aanpak van Tegenlichtafleveringen maar ook de vertekeningen die dit op kan leveren bij het analyseren.
Algoritme
Algoritmes spelen een steeds grotere rol in het denken over (digitale) technologie als oplossing. Vandaar dat we ook hebben gekeken naar de aanwezigheid van dit begrip in de data. Figuur 9 laat het resultaat zien.
Figuur 9 De aanwezigheid van “algoritme” en “algoritmes” in Tegenlicht.
Al in 2006 kwam ‘algoritme’ voor in Tegenlicht en ook daarna werd erover gesproken maar de piek in 2018 springt in het oog. In dat jaar was er een aflevering met de titel Verslaafd aan het algoritme en dit zou deze piek kunnen verklaren.
De termen die we los onderzochten, hebben vooral betrekking op digitale technologie. Digitale technologie is grofweg in te delen in software en hardware. We hebben de data daarom ook geanalyseerd op de aanwezigheid van een reeks termen die samenhangen met het begrip ‘software’ en met het begrip ‘hardware’.
Software en hardware
Tabel 1 geeft de diverse begrippen weer die we hebben geschaard onder ‘software’ en ‘hardware’. Bij elk begrip hebben we in de data gezocht naar varianten voor enkelvoud en meervoud.
Tabel 1. Software- en hardware-termen
Software-termen | Hardware-termen |
---|---|
AI | apparatuur |
algoritme | beeldscherm |
app | camera |
applicatie | component |
browser | computer |
kunstmatige intelligentie | device |
malware | elektronisch |
programmatuur | harde schijf |
programmeren | hardware |
software | laptop |
webbrowser | machine |
website | processor |
scherm | |
server | |
webcam |
Figuur 10 toont de aanwezigheid van deze ‘software-termen’ en ‘hardware-termen’ in de data door de jaren heen.
Figuur 10. Aanwezigheid van software- en hardware-termen in de Tegenlicht-data.
Hoewel de hardware-termen in de meeste jaren hoger scoren, zijn zowel software- als hardware-termen over de gehele periode aanwezig in de data van Tegenlicht en lopen de ontwikkelingen min of meer parallel. De hoeveelheid neemt na 2010 gestaag toe tot 2014, waarna de aantallen in grote lijnen weer afnemen. De redactie geeft bij navraag aan dat de periode 2008-2013 sterk werd bepaald door de financiële crisis; pas daarna kwam er ruimte voor de Silicon Valley (de Bruijn 2022d). Verder springt de piek in de software-termen in 2018 in het oog. In dat jaar waren er 28 afleveringen in dertien thema’s, waarvan drie in het thema Internet en vier in het thema Technologie. Ook hier ligt een verklaring niet voor de hand.
Tegelijkertijd verschuift in figuur 10 de verhouding tussen software- en hardware-termen langzaam, waarbij hardware vanaf 2016 minder dominant wordt. Dit zou er ook op kunnen duiden dat software-ontwikkelingen een relatief grotere rol zijn gaan spelen dan hardware-ontwikkelingen. Denk hierbij aan het feit dat software tegenwoordig voor alle devices beschikbaar is en dat voor van steeds meer handelingen apps worden ontwikkeld.
We hebben ook gekeken hoe de verschillende termen zich in de onderzochte periode ontwikkelden. Figuur 11 laat zien hoe de software- en hardware-termen zich door de tijd heen tot elkaar verhouden. De grote van een bol laat zien hoe vaak de betreffende zoekterm voorkwam in verhouding tot de andere zoektermen in dat jaar.
Figuur 11. Software- en hardware-termen door de tijd.
Figuur 11 laat zien dat hardware-termen lang de boventoon voeren: de blauwe bol is steeds groter dan de groene. Pas in 2016 verandert dit. Het verschil komt misschien deels doordat we op meer hardware-termen dan software-termen hebben gezocht. Hardware wordt gedomineerd door ‘computer’, gevolgd door ‘camera’ en ‘machine’, vervolgens weer ‘computer’ en uiteindelijke alle drie deze begrippen. Hierin is wellicht de ontwikkeling van digitalisering naar surveillance en automatisering/robotisering te herkennen maar of het bij de betreffende afleveringen daarover gaat, zeggen deze uitkomsten niet. Bij software domineert aanvankelijk ‘website’, gevolgd door en in combinatie met ‘software’, ‘app’, ‘algoritme’ en ‘AI’. Daarin is ook de ontwikkeling van digitale technologie te herkennen. Overigens hangen de resultaten voor 2002, waarin alleen de term “electronische” binnen hardware wordt weergegeven, hoogstwaarschijnlijk aan het gebrek aan transcripten voor dat jaar (zie figuur 1).
We onderzochten de data ook op de twee hierboven genoemde begrippen ‘automatisering’ en ‘robotisering’.
Automatisering en robotisering
Technologische ontwikkeling heeft zich geuit in de vorm van automatisering en robotisering. Hierin komen software en hardware samen. Vandaar dat we de data ook hebben geanalyseerd op deze begrippen. Daarnaast hebben we specifiek gezocht op ‘robot’. Figuur 12 toont de aanwezigheid van ‘automatisering’, ‘robotisering’ en ‘robot’ (“robot”en “robots”) in de data.
Figuur 12. De begrippen ‘automatisering’, ‘robotisering’ en ‘robot’ in de data.
De termen “robot”en “robots” komen veel vaker voor dan automatisering en robotisering. Blijkbaar wordt er meer gesproken over het resultaat dan over de processen. In figuur 12 is ook een scherpe piek te zien in 2015 en bescheiden pieken in 2014 en 2022, specifiek bij ‘robot’. In andere jaren komen de termen niet of veel minder voor. In 2015 was er een aflevering over De robot als mens, dat verklaart deels deze piek.
Innovatie en revolutie
Technologie en vooral digitale technologie wordt zoals gezegd vaak besproken in termen van ‘innovatie’ en zelfs ‘revolutie’. Vandaar dat we nader naar deze twee termen hebben gekeken. Figuur 13 laat de aanwezigheid zien van het begrip ‘innovatie’ door te analyseren op “innovatie”, “innovaties”, “innovatief” en “innovatieve” rond ‘revolutie’ door te analyseren op “revolutie”, “revoluties”, “revolutionair” en “revolutionaire”.
Figuur 13. Aanwezigheid van ‘innovatie’ en ‘revolutie’ in de data van Tegenlicht.
Figuur 13 laat zien dat innovatie in alle seizoenen voorkomt, met een bescheiden piek in 2015. Bij revolutie is er sprake van een scherpe piek in 2011 en een bescheiden piek in 2006, terwijl over de andere jaren de score lager is en licht fluctueert. Deze ontwikkeling loopt niet parallel met die van ‘automatisering’ en ‘robotisering’, hetgeen suggereert dat er niet zonder meer een samenhang is tussen momenten waarop deze begrippen in Tegenlicht zijn besproken.
De bovenstaande analyses laten zien dat de aanwezigheid van individuele termen rond technologie in Tegenlicht in grote lijnen de algemene technologische ontwikkelingen volgt maar dat er niet zonder meer samenhang is te zien tussen de verschillende termen. Tabel 2 toont de jaren waarin de aanwezigheid van de diverse begrippen piekte. Dit overzicht suggereert dat de komst van google werd gevolgd door aandacht voor innovaties in hardware, gevolgd door revolutie en software.
Tabel 2. Pieken in de grafieken
begrip | piekt in |
---|---|
2006 | |
innovatie | 2011 |
computer / hardware-termen | 2014 |
technologie-termen | 2014-2015 |
smartphone / automatisering / robot / revolutie | 2015 |
app / robotisering | 2016 |
website / software-termen / algoritme | 2018 |
technologie-termen / app / algoritme / smartphone | 2022 |
In grote lijnen is Tabel 2 ook een weerspiegeling van de algemene technologische ontwikkelingen. De pieken concentreren zich rond de periode 2014-2016. Dat sluit aan bij het relaas van de redactie over aanvankelijk enthousiasme en toenemende scepsis. De interpretatie wordt bemoeilijkt doordat deze analyse alleen iets zegt over de aanwezigheid van de gezochte termen en niets over de manier waarop erover gesproken wordt of wat er nader over gezegd wordt. Navraag bij de redactie leert dat Tegenlicht vaak een technologie-onderwerp behandelt als er maatschappelijke discussie over ontstaat (de Bruijn 2022a). Op die manier zal bij Tegenlicht als ‘future affairs’ met enige vertraging een piek ontstaan (de Bruijn 2022b).
Aangezien Tegenlicht zichzelf karakteriseert als ‘future affairs’, hebben we ook gekeken naar ‘toekomst’ en ‘verleden’ in de data.
Technologie als Future Affair
Om te bekijken hoe technologie zich in Tegenlicht verhoudt tot ideeën over de toekomst, hebben we geanalyseerd hoe vaak ‘toekomst’ voorkomt door te analyseren op “toekomst”, “toekomstig” en “toekomstige”. Dit hebben we gecombineerd met ‘verleden’ door te analyseren op “vroeger”, “vroegere” en “verleden”, om deze met elkaar te kunnen vergelijken. Figuur 14 laat de resultaten zien.
Figuur 14. De aanwezigheid van ‘toekomst’ en ‘verleden’ in Tegenlicht.
Figuur 14 laat zien dat er aanvankelijk een toenemende verwijzing naar de toekomst zichtbaar is en dat dit vanaf de piek in 2012 een beetje schommelt tot een tweede piek in 2021. De karakterisering van Tegenlicht als ‘future affairs’ stamt uit begin 2007 (de Bruijn 2021) en het lijkt alsof de focus op de toekomst al eerder door de makers is ingezet maar sindsdien wel is toegenomen. Dat wordt bevestigd door de redactie: na de eindredactionele beslissing als ‘future affairs’ verder te gaan, gingen redactieleden letten op deze profilering en elkaar er ook op aanspreken (de Bruijn 2022c)
Tegelijkertijd laat de grafiek zien dat ook het verleden een constante is in Tegenlicht, zij het in mindere mate dan de toekomst. Dit zou erop kunnen duiden dat de toekomst vanuit het verleden wordt benaderd en niet los daarvan.
Om meer inzicht te krijgen in wat gezegd wordt over technologie en over de toekomst, hebben we woordwolken gemaakt van de 10 woorden voor en na de termen ‘technologie’ en ‘toekomst’. De resultaten bespreken we hieronder.
In de buurt van Technologie
We hebben voor elk jaar een woordenwolk rond zowel de term toekomst als de term technologie gemaakt. Tijdens een brainstorm hebben we gekeken naar de meest in het oog springende woorden. Dat bleken woorden te zijn die wijzen op aandacht voor de menselijke gemeenschap: we, wij, onze, ons en mens.3 De dominantie van woorden die te maken hebben met de menselijke gemeenschap/samenleving was aanleiding voor nadere analyses.
Figuur 15 toont de aanwezigheid van de termen “we”, “wij”, “ons”, en “onze” in de buurt van de technologie-termen per thema.
Figuur 15. De termen “we”, “wij”, “ons”, “onze” in de buurt van technologie-termen per thema.
De termen ‘we’-termen “we”, “wij”, “ons” en “onze” komen in alle thema’s voor in de buurt van de technologie-termen, zoals figuur 15 laat zien. Echter, figuur 15 lijkt erg op figuur 4 hierboven. Dat suggereert dat verschillen tussen thema’s wellicht eerder te verklaren zijn door toekenning van thema’s dan door de inhoud van de afleveringen.
We ook hebben nog gekeken naar het begrip ‘mens’ in Tegenlicht door te zoeken op “mens”, “mensen”, “menselijk”, “menselijke” en “mensheid”. Figuur 16 toont het resultaat.
Figuur 16. Het begrip ‘mens’ in de buurt van technologie-termen per thema.
Ook het begrip ‘mens’ wordt in alle thema’s in de buurt van de technologie-termen genoemd, zij het in veel mindere mate dan de termen “we”, “wij”, “ons”, “onze”. De scores zijn wel lager maar het patroon is hetzelfde. Dit zou erop kunnen duiden dat ‘mens’ over het algemeen in combinatie met “we”, “wij”, “ons”, “onze” wordt besproken maar of deze termen ook bij elkaar in de buurt staan, hebben we niet gemeten. De precieze relatie tussen ‘mens’ en “we”, “wij”, “ons”, “onze” is hier dus niet uit af te leiden.
Om meer inzicht in die relatie te krijgen, hebben we de samenhang tussen verschillende onderzochte termen gevisualiseerd. Hiervoor hebben we per term gekeken naar de 10 woorden ervoor en erna en geteld hoe vaak de andere termen daarin voorkomen. Dit geeft een maat voor hoe vaak de termen samen worden gebruikt. Figuur 17 geeft deze weer in absolute aantallen.
Samenhang
Figuur 17. De samenhang tussen de verschillende onderzochte begrippen op basis van absolute aantallen.
Het lijkt alsof de ‘we’-termen en de ‘mens’-termen een grote rol spelen en vooral met elkaar verbonden zijn. Ook zijn er sterkere banden tussen de ‘we’-termen en de toekomst-termen en tussen de we-termen en de technologie-termen maar veel minder met ‘verleden’ en ‘innovatie’. Figuur 18 toont de samenhang in relatieve zin, dat wil zeggen, op basis van percentages.
Figuur 18. De samenhang tussen de verschillende onderzochte begrippen in percentages.
Figuur 18 laat zien dat de samenhang veel gelijkmatiger is verdeeld: de ‘we’-termen en ‘mens’-termen zijn ongeveer even sterk met alle andere termen verbonden. De ‘we’-termen en de ‘mens’-termen komen dus voor in de buurt van alle andere termen. Dit, in combinatie met eerdere analyses, suggereert dat deze termen gewoon vaak voorkomen maar niet gekoppeld zijn aan een specifiek aspect van technologie. Dit voorbeeld onderstreept dat zorgvuldig nadenken over analyses, resultaten en hun presentaties nodig is om te voorkomen ze een verkeerde indruk wekken.
De bovenstaande analyses hebben laten zien in hoeverre bepaalde begrippen voorkomen in de transcripten van 20 jaar Tegenlicht. Zo kunnen we iets zeggen over wanneer de begrippen aan bod kwamen. Wat we niet kunnen zeggen is hoe er over werd gesproken: positief, neutraal of negatief, utopisch of dystopisch, hoopvol of ontmoedigend. Daarvoor zijn andere technieken nodig, zoals sentiment-analyse. Echter, de beschikbare technologie hiervoor werkt voor teksten het Nederlands vooral goed als teksten expliciet gaan over positieve of negatieve sentimenten, zoals recensies van restaurants en webwinkels. Voor algemene teksten is de technologie nog onvoldoende betrouwbaar.
We hebben ook besproken wat enkele van de beperkingen en uitdagingen zijn bij dit soort dataonderzoek en analyses. Natuurlijk zijn er meer geavanceerde technieken beschikbaar om data te analyseren, zoals algoritmes die zogenaamde word embeddings analyseren. Daarbij wordt gekeken naar de context waarin woorden worden gebruikt om de overeenkomst in betekenis te duiden en op die manier te tellen. Zoals bij elke keuze, heeft ook dit alternatief voor- en nadelen. Elke analyse wordt voorafgegaan door een aantal inhoudelijke keuzes. In dit geval betrof dat vooral een afbakening van termen waarop we wilden zoeken. Het testen, verbeteren en uitvoeren van analyses en visualiseringen vergt zorgvuldigheid dus ook tijd en aandacht. “Even word embeddings proberen” gaat dus niet. Met andere woorden: er zit een limiet aan het aantal analyses dat binnen een project kan worden uitgevoerd.
Conclusie
In deze Data Story hebben we onderzocht hoe in 20 televisieseizoenen Tegenlicht technologie aan bod is gekomen. Dat hebben we gedaan door in de transcripten van afleveringen te zoeken naar bepaalde begrippen. Daarbij hebben we gezocht op specifieke termen, waarmee we samengestelde woorden of afgeleide termen uitsloten. Dat heeft de resultaten beperkt maar heeft er wel voor gezorgd dat we weten wat we hebben gemeten. Tegelijkertijd is het lastig gebleken om te zeggen wat de resultaten precies representeren.
De analyses van 20 jaar Tegenlicht laten zien dat gaandeweg technologie in alle thema’s wordt behandeld. Dat maakt de ontwikkeling van technologie van iets specialistisch tot iets alledaags zichtbaar. De pieken in de termen die we zochten, die vooral samenhangen met digitale technologie, liggen over het algemeen in het tweede decennium van Tegenlicht, wat de opkomst en ontwikkeling van digitale technologie illustreert. De redactie geeft zelf aan dat ze vooral de gevolgen van deze ontwikkelingen behandelt (de Bruijn 2022c) en dat is terug te zien in onze analyses. In Tabel 2 is te zien waar grote ontwikkelingen zoals de komst van Google worden gevolgd door aandacht van Tegenlicht voor gerelateerde onderwerpen. Daarbij is niet te zeggen hoe erover gesproken werd, alleen dat erover gesproken werd.
De resultaten uit deze Data Story zijn misschien niet verrassend maar laten wel zien dat onderzoek met grote datasets niet automatisch tot allerlei antwoorden leidt, ook al kun je allerlei analyses uitvoeren en visualisaties maken. Net als digitale technologie na initiële enthousiasme nu op scepsis stuit, kan dezelfde gebeuren met data(-analyse), omdat het niet kan voldoen aan de torenhoge verwachtingen en omdat goed dataonderzoek veel zorgvuldigheid vereist. Meten is niet gelijk weten. Meten is onderzoeken.
Team
Onderzoeker: Willemien Sanders (UU en B&G)
Ontwikkelaars en visualisaties: Rana Klein (B&G), Mari Wigham (B&G)
Adviseur: William de Bruijn (VPRO), Geert Rozinga (VPRO)
Reviewers: Victor de Boer (VU), William de Bruijn (VPRO)
Met dank aan: Jeroen Beumer (VPRO), Koos van de Merbel (VPRO)
Bronnen
Bruijn, William de. 2021. ‘“Future Affairs”’, e-mail aan de auteurs, 8 november 2021.
Bruijn, William de. 2022a. ‘Data Story’, e-mail aan de auteurs, 30 mei 2022.
Bruijn, William de. 2022b. ‘RE: Pagina 7’, e-mail aan de auteurs, 7 juni 2022.
Bruijn, William de. 2022c. ‘RE: Feedback [Reacties in Rood]’, e-mail aan de auteurs, 21 juni 2022.
Bruijn, William de. 2022d. ‘Pagina 10’, e-mail aan de auteurs, 7 June 2022.
Bruijn, William de. 2022e. ‘Pagina 15’, e-mail aan de auteurs, 8 June 2022.
Cheng, Jacqui. 2007. ‘It’s Official: Google Announces Open-Source Mobile Phone OS,Android’. Ars Technica, 5 november 2007.
D’Ignazio, Catherine, and Lauren F. Klein. 2020. Data Feminism. Cambridge, MA: The MIT Press.
Gibbs, Samuel. 2015. ‘Google Maps: A Decade of Transforming the Mapping Landscape’. The Guardian, 8 February 2015.
iCulture. 2022. ‘iPhone-geschiedenis: de complete tijdlijn van de iPhone’. iCulture, januari 2022.
Trends. 2018. ‘Google wordt 20 jaar: de geschiedenis van het bedrijf in 15 mijlpalen’. Trends-NL, 3 september 2018.
Marr, Bernard (Ed.). 2016. Big Data in Practice: How 45 Successful Companies Used Big Data Analytics to Deliver Extraordinary Results. Chichester, UK: Wiley.
O’Neil, Cathy. 2017. Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. New York: B/D/W/Y Broadway Books.
-
Uit een eerste brainstorm met redactieleden kwamen ‘klimaat’ en ‘technologie’ beide als relevante onderwerpen voor een Data Story naar voren. Een eerste exploratie van ‘klimaat’ leverde onvoldoende handvatten voor een vervolg en daarop is overgestapt op het onderwerp ‘technologie’. Zie verder de Methodische verantwoording.
↩ -
De metadata van de afleveringen van Tegenlicht zijn te bekijken in de Clariah Media Suite. Deze werkt het best met Chrome. Het bekijken van afleveringen is alleen mogelijk door in te loggen via een Nederlandse universiteit of hogeschool.
↩ -
We keken ook naar woorden die verwijzen naar technologische oplossingen, zoals ‘algoritmes’ maar vonden er weinig.
↩