In de wereld van vandaag is Stylometrie een onderwerp dat grote relevantie heeft gekregen en de aandacht van een breed publiek heeft getrokken. Of het nu vanwege zijn impact op de samenleving, zijn relevantie in het professionele veld of zijn invloed op de populaire cultuur is, Stylometrie is een fundamenteel aspect geworden in het huidige panorama. In dit artikel zullen we alle facetten van Stylometrie grondig onderzoeken, vanaf de oorsprong tot de huidige evolutie, en een alomvattend perspectief bieden dat ons in staat stelt het belang en de reikwijdte ervan in verschillende contexten te begrijpen.
Stylometrie is de toepassing van onderzoek naar de stijl van meestal geschreven taal, maar wordt tevens toegepast op het gebied van muziek[1] en schilderkunst.[2] Stylometrie wordt vaak gebruikt om de auteur van anonieme en/of betwiste documenten te benoemen. Er zijn zowel wettelijke als academische en literaire toepassingen die variëren van de vraag over de authenticiteit van Shakespeares oeuvre tot aan forensische taalkunde.
Stylometrie is ontstaan uit eerdere technieken voor tekstanalyse. Een voorbeeld is het bewijs aangeleverd door Lorenzo Valla in 1439 dat de Donatio Constantini een vervalsing betreft was gebaseerd op de vergelijking van het Latijn uit het document met dat uit authentieke documenten uit de 4e eeuw.
De basis van stylometrie is uitgewerkt door de Poolse filosoof Wincenty Lutosławski. Lutosławski heeft de term stylometrie gemunt in zijn Franstalige werk Principes de stylométrie: Appliqués à la chronologie des œuvres de Platon. Hij gebruikte deze techniek om een chronologie te maken van Plato's werk.
Een van de meest bekende toepassingen van de stylometrie is de literatuurwetenschap: het wordt daar onder andere gebruikt om het auteurschap van betwiste of anonieme werken te bepalen.
Een voorbeeld hiervan is het betwiste auteurschap van de toneelstukken van Molière in het begin van de 20e eeuw; in 1919 stelde Pierre Louÿs voor dat Pierre Corneille de auteur van een bepaald aantal werken zou kunnen zijn geweest. Deze theorie kreeg steun van stylometrische analyses die het lexicon, grammaticale structuren en de rijmwoorden in teksten van beide auteurs bestudeerde. Echter, in 2019 is een onderzoek gepubliceerd door Florian Cafiero en Jean-Baptiste Camps waarin door hen geavanceerde stylometrische technieken werden toegepast om deze hypothese te bevestigen. In dit onderzoek bestudeerden ze een grote verzameling werken van Molière, Pierre Corneille, Thomas Corneille en andere theaterauteurs uit die periode. De resultaten toonden dat Molière over een eigen stijlprofiel zou beschikken die niet lijkt op die van Corneille en dat de betwiste werken weldegelijk door Molière zijn geschreven.[3]
Stylometrie en stylometrische methoden worden in forensische en juridische gebieden gebruikt om anonieme of verdachte communicatie te onderzoeken, met name in fraudeonderzoeken, bedreigingen en cybercriminaliteit. Door het vergelijken van onbekende bronnen met bronnen met een geïdentificeerde auteur, kan de kans worden bepaald of specifieke berichten door dezelfde persoon zijn gemaakt of geschreven.[4] In rechtszaken kan stylometrie als bewijs worden ingezet, zoals bij onderzoek naar plagiaat of onenigheid over intellectueel eigendom, maar ook bij moordonderzoeken zoals de moord op Grégory Villemin.
In sociolinguïstisch onderzoek wordt stylometrie ook toegepast; het helpt hierbij met het bestuderen van veranderingen in taal en schrijfstijlen door de jaren heen. Onderzoekers kunnen bijvoorbeeld door een aanzienlijke hoeveelheid tekst uit diverse tijdperken en periodes te analyseren een duidelijk inzicht verwerven in de ontwikkeling van taalgebruik en de invloeden hierop.
Kunstmatige intelligentie en machine learning is een relatief recente toevoeging van het toepassingsgebied van de stylometrie. Hierbij worden stylometrische methoden en technieken ingezet om AI systemen te begeleiden bij automatische tekstanalyse[5]; denk hierbij onder andere aan het automatisch detecteren van spam. Met name sociale mediaplatformen en zoekmachines gebruiken steeds vaker stylometrie om het (zoek)gedrag van gebruikers te bestuderen en aanbevelingen van inhoud/advertenties op basis hiervan aan te passen.[6]