Wat is ruis?
Ruis, of bijvangst, zijn berichten die niet overeenkomen met het doel van de zoekopdracht. Of simpel gezegd: ruis is alle irrelevante en ongewenste berichten tezamen. Ruis wil je beperken tot een zo laag mogelijk niveau zodat je als gebruiker niet overweldigt wordt door een grote hoeveelheid berichten en alleen de juiste berichten overblijven.
Welke soorten ruis zijn er?
Ruis komt in verschillende vormen voor en door ze te herkennen, wordt het makkelijker om de meest effectieve ruisverminderings-methodes toe te passen. Hieronder de 4 meest voorkomende vormen van ruis:
1. Dubbele betekenissen
Ruis door dubbele betekenissen wordt veroorzaakt door een woord of zin die meer dan één betekenis kan hebben. Ter illustratie: het woord ‘doorn’ kan op 2 manieren gebruikt worden. In het gezegde “hij is mij een doorn in het oog” of als in het Nederlandse dorp Doorn. Dit wordt pas ruis als je geïnteresseerd bent in een van de twee betekenissen.
2. Verkeerde context
Ruis wordt ook veroorzaakt door te zoeken in een te brede context van het onderwerp. Brede begrippen zoals ‘vuurwerk’ of ‘corona’ zijn hier een voorbeeld van. Corona wordt in deze tijd genoemd in elk bericht, zonder dat dit per se relevant is binnen het onderwerp waar je wel geïnteresseerd in bent (b.v. brand in teststraten, vaccinaties etc.).
Het risico van ruis is soms nog groter wanneer je zoekt op meerdere woorden tegelijkertijd, in een onbepaalde volgorde. Bijvoorbeeld de woorden ‘in elkaar slaan’: in die volgorde zijn berichten eerder relevant dan wanneer ze uit context worden gehaald, zoals in het voorbeeld hieronder.
3. Ongewenste bronnen
Een deel van sociale media-accounts plaatst eenduidige ongewenste berichten. Denk hierbij aan bots, seksadvertenties, advertenties van makelaars en Twitter-nieuws-accounts, maar ook nieuwswebsites en bedrijfs-gerelateerde accounts. Berichten van deze accounts zijn ruis als ze voorspelbare content plaatsen die irrelevant zijn aan het doel van de zoekstrategie.
4. Onbekende taal
Binnen PublicSonar is het mogelijk een voorkeurstaal in te stellen voor zoekopdrachten. Meestal staat deze voorkeur reeds ingesteld op Nederlands. Logischerwijs verwacht je hiermee alleen berichten op te halen die in deze taal geschreven zijn. Dit geldt voor alle bronnen met uitzondering van YouTube, Fora, Telegram en Nieuwswebsites.
Deze bronnen bepalen vooraf niet de taal van een bericht zodat de kans bestaat dat er ook berichten worden opgehaald met een andere taal.
Hoe lokaliseer ik oorzaken van ruis?
Voordat je ruis vermindert, is het belangrijk om de belangrijkste oorzaken te identificeren. Begin daarom altijd bij de Zoekopdrachten die de meeste berichten genereren.We raden aan om gebruik te maken van de verschillende widgets om de oorzaken van ruis te isoleren.
Bron Verfijning
Rechtsboven in de Case staat de optie Verfijn. Selecteer vervolgens de optie Bronnen om te zien welke van de bronnen de meeste berichten bevatten. Dit is belangrijk om te weten omdat hier mogelijk ook de meeste ruis tussen kan zitten.
Woordfrequentie
Gebruik de optie Woordfrequentie om snel mogelijke oorzaken van ruis te vinden. De 8 meest voorkomende woorden kunnen een indicatie geven van de soort (ruis) berichten die de zoekopdracht verzamelt. Door het woord te selecteren, filter je tijdelijk alle berichten met dit woord. Een woord uit de Woordfrequentie is ook toe te voegen aan de Zoekopdrachten of Filters. Selecteer de 3 puntjes (Meer) naast het woord om deze acties uit te voeren.
Accounts
Accounts tonen welke Twitteraars of Nieuwswebsites de meeste berichten posten binnen de case. Zoom snel in op Accounts door het account te selecteren of toe te voegen aan Zoekopdrachten en Filters. De Accounts staan naast Tijdlijn bovenaan in de case.
Hoe kan ik ruis verminderen?
Ruis verminderen begint vaak al bij het aanmaken van de case. Toch is dit niet in alle gevallen mogelijk bijvoorbeeld doordat een topic plotseling trending wordt, of doordat het moeilijk te voorspellen is waar de ruis vandaan komt.
De volgende methodes om ruis te verminderen zijn op elk moment in het proces toe te passen. Streef naar een 80-20 balans (80% relevant - 20 % ruis).
Methode | Uitleg | Type ruis | Voorbeeld |
Gerichte formulering | Formuleer zoektermen dermate specifiek dat het proportioneel is tot het beoogde zoek doel. | Dubbele betekenis/ verkeerde context |
|
AND combinaties | Combineer termen en bouwstenen met elkaar om gericht te zoeken. | Dubbele betekenis/verkeerde context |
|
Aanhalingsteken “” | Gebruik aanhalingstekens altijd als de volgorde van de woorden vast staan. | Verkeerde context |
|
Negeertermen op case-niveau | Voeg negeertermen toe aan een case, om hierop te negeren in de gehele case | Dubbele betekenis |
|
Accounts negeren/ rapporteren | Negeer of rapporteer Twitter-accounts en nieuwswebsites om er geen berichten meer van te verzamelen | Ongewenste bronnen |
|
Negeertermen op bouwsteen-niveau | Negeer termen in de hele bouwsteen (grote impact) | Dubbele betekenis |
|
Negeertermen op term-niveau | Negeer termen per term in de bouwsteen (kleinere impact) | Dubbele betekenis |
|
Onbekende taalfilter | Verberg YouTube, Fora, Telegram en berichten van Nieuwswebsites in een taal die niet overeenkomt met de taal van de Zoekopdracht | Onbekende taal |
|