Door uitgevers gepubliceerde teksten hebben een wat positievere toon dan teksten die door schrijvers zelf zijn gepubliceerd. Dat blijkt uit de statistische analyse door het computerprogramma Gertrude. Wie meer kans wil maken om door een uitgever te worden gepubliceerd, kan dus beter niet al te negatief schrijven.
Voor het bepalen voor het sentiment, ofwel de ‘valentie’ van een tekst, gebruikt Gertrude een lijst met duizenden woorden die een score hebben voor de mate van positiviteit of negativiteit. Een zeer positief woord is bijvoorbeeld ‘aaien’, terwijl ‘haat’ een erg negatief woord is. Door de waarden van de herkende woorden op te tellen en het gemiddelde te berekenen, wordt een gemiddelde valentiescore berekend.
Als hierbij weer de gemiddelden worden vergeleken tussen reeds uitgegeven teksten en zelf gepubliceerde teksten, blijkt een significant verschil. Door uitgevers gepubliceerde teksten hebben een gemiddelde valentie van 6,92, terwijl bij zelf gepubliceerde teksten de gemiddelde valentie 6,68 is. Hierbij had de tekst met de negatiefste woorden een gemiddelde van 4,13 en de positiefste tekst scoorde 8,46.
Compenseer voor negatieve woorden
Wil je als schrijver meer kans maken door een uitgever gepubliceerd te worden, dan is het een idee eens naar de gevoelslading van je woorden te kijken. Heb je veel matig negatieve – of enkele sterk negatieve woorden gebruikt, zoals bijvoorbeeld: ‘moord’, ‘haat’, ‘incest’, ‘wurgen’, ‘armoede’ of ‘virus’, om er enige te noemen, dan kan je proberen de negativiteit van je tekst te verminderen door negatieve woorden te schrappen. Of je kan hiervoor compenseren door meer positieve woorden te gebruiken zoals bijvoorbeeld: ‘verliefd’, ‘lachen’, ‘zomer’, ‘grappig’, ‘zoen’ of ‘reis’.
Gertrude is een machine learning systeem dat schrijvers de mogelijkheid biedt hun tekst te vergelijken met teksten die door professionele uitgevers zijn gepubliceerd. Het systeem is bedoeld als hulp voor schrijvers van fictionele teksten, zoals verhalen en romans. Gertrude is getraind met duizenden teksten die op internet openbaar voorhanden zijn, om onderscheid te maken tussen teksten van zelf publicerende schrijvers en teksten die gepubliceerd zijn door professionele uitgeverijen. Het systeem classificeert teksten en biedt de mogelijkheid een analyserapport te kopen.