Open navigation

Hoe verminder ik ruis?

Gewijzigd op: Ma, 23 Dec, 2024 om 7:17 PM

Wat is ruis?

Ruis, of bijvangst, zijn berichten die niet overeenkomen met het doel van de zoekopdracht. Of simpel gezegd: ruis is alle irrelevante en ongewenste berichten tezamen. Ruis wil je beperken tot een zo laag mogelijk niveau zodat je als gebruiker niet overweldigt wordt door een grote hoeveelheid berichten en alleen de juiste berichten overblijven.  


Welke soorten ruis zijn er?

Ruis komt in verschillende vormen voor en door ze te herkennen, wordt het makkelijker om de meest effectieve ruisverminderings-methodes toe te passen. Hieronder de 4 meest voorkomende vormen van ruis:

 

1. Dubbele betekenissen

Ruis door dubbele betekenissen wordt veroorzaakt door een woord of zin die meer dan één betekenis kan hebben. Ter illustratie: het woord ‘doorn’ kan op 2 manieren gebruikt worden. In het gezegde “hij is mij een doorn in het oog” of als in het Nederlandse dorp Doorn. Dit wordt pas ruis als je geïnteresseerd bent in een van de twee betekenissen. 


 

2. Verkeerde context

Ruis wordt ook veroorzaakt door te zoeken in een te brede context van het onderwerp. Brede begrippen zoals ‘vuurwerk’ of ‘corona’ zijn hier een voorbeeld van. Corona wordt in deze tijd genoemd in elk bericht, zonder dat dit per se relevant is binnen het onderwerp waar je wel geïnteresseerd in bent (b.v. brand in teststraten, vaccinaties etc.). 


Het risico van ruis is soms nog groter wanneer je zoekt op meerdere woorden tegelijkertijd, in een onbepaalde volgorde. Bijvoorbeeld de woorden ‘in elkaar slaan’: in die volgorde zijn berichten eerder relevant dan wanneer ze uit context worden gehaald, zoals in het voorbeeld hieronder. 


 

3. Ongewenste bronnen

Een deel van sociale media-accounts plaatst eenduidige ongewenste berichten. Denk hierbij aan bots, seksadvertenties, advertenties van makelaars en Twitter-nieuws-accounts, maar ook nieuwswebsites en bedrijfs-gerelateerde accounts. Berichten van deze accounts zijn ruis als ze voorspelbare content plaatsen die irrelevant zijn aan het doel van de zoekstrategie. 


 

4. Onbekende taal

Binnen PublicSonar is het mogelijk een voorkeurstaal in te stellen voor zoekopdrachten. Meestal staat deze voorkeur reeds ingesteld op Nederlands. Logischerwijs verwacht je hiermee alleen berichten op te halen die in deze taal geschreven zijn. Dit geldt voor alle bronnen met uitzondering van YouTube, Fora, Telegram en Nieuwswebsites. 


Deze bronnen bepalen vooraf niet de taal van een bericht zodat de kans bestaat dat er ook berichten worden opgehaald met een andere taal.


A close up of a white background

Description automatically generated


Hoe lokaliseer ik oorzaken van ruis?

Voordat je ruis vermindert, is het belangrijk om de belangrijkste oorzaken te identificeren. Begin daarom altijd bij de Zoekopdrachten die de meeste berichten genereren.We raden aan om gebruik te maken van de verschillende widgets om de oorzaken van ruis te isoleren. 

 

Bron Verfijning

Rechtsboven in de Case staat de optie Verfijn. Selecteer vervolgens de optie  Bronnen om te zien welke van de bronnen de meeste berichten bevatten. Dit is belangrijk om te weten omdat hier mogelijk ook de meeste ruis tussen kan zitten.


 

Woordfrequentie

Gebruik de optie Woordfrequentie om snel mogelijke oorzaken van ruis te vinden. De 8 meest voorkomende woorden kunnen een indicatie geven van de soort (ruis) berichten die de zoekopdracht verzamelt. Door het woord te selecteren, filter je tijdelijk alle berichten met dit woord. Een woord uit de Woordfrequentie is ook toe te voegen aan de Zoekopdrachten of Filters. Selecteer de 3 puntjes (Meer) naast het woord om deze acties uit te voeren.

 

A screenshot of a computer

Description automatically generated


Accounts

Accounts tonen welke Twitteraars of Nieuwswebsites de meeste berichten posten binnen de case. Zoom snel in op Accounts door het account te selecteren of toe te voegen aan Zoekopdrachten en Filters. De Accounts staan naast Tijdlijn bovenaan in de case.  



Hoe kan ik ruis verminderen?

Ruis verminderen begint vaak al bij het aanmaken van de case. Toch is dit niet in alle gevallen mogelijk bijvoorbeeld doordat een topic plotseling trending wordt, of doordat het moeilijk te voorspellen is waar de ruis vandaan komt. 


De volgende methodes om ruis te verminderen zijn op elk moment in het proces toe te passen. Streef naar een 80-20 balans (80% relevant - 20 % ruis). 


Methode

Uitleg

Type ruis

Voorbeeld

Gerichte formulering

Formuleer zoektermen dermate specifiek dat het proportioneel is tot het beoogde zoek doel. 

Dubbele betekenis/ verkeerde context

  • Vuurwerkverbod i.p.v. vuurwerk
  • Coronamaatregelen i.p.v. corona

AND combinaties

Combineer termen en bouwstenen met elkaar om gericht te zoeken. 

Dubbele betekenis/verkeerde context

  • Storm Gerda i.p.v. Gerda
  • Marktplein Amsterdam i.p.v. marktplein

Aanhalingsteken “”

Gebruik aanhalingstekens altijd als de volgorde van de woorden vast staan.

Verkeerde context

  • “In elkaar slaan”
  • “Den Haag”

Negeertermen op case-niveau

Voeg negeertermen toe aan een case, om hierop te negeren in de gehele case

Dubbele betekenis

  • Negeer op “doorn in het oog” om deze berichten uit te sluiten

Accounts negeren/ rapporteren

Negeer of rapporteer Twitter-accounts en nieuwswebsites om er geen berichten meer van te verzamelen

Ongewenste bronnen

  • @0314_Vacatures

Negeertermen op bouwsteen-niveau

Negeer termen in de hele bouwsteen (grote impact)

Dubbele betekenis

  • Negeer het woordje vacature om deze berichten uit te sluiten

Negeertermen op term-niveau

Negeer termen per term in de bouwsteen (kleinere impact)

Dubbele betekenis

  • Negeer het woordje saai in de term dood in de bouwsteen Slachtoffers

Onbekende taalfilter

Verberg YouTube, Fora, Telegram en berichten van Nieuwswebsites in een taal die niet overeenkomt met de taal van de Zoekopdracht

Onbekende taal

  • Vink de onbekende taalfilter aan om berichten uit andere talen te verbergen. 

 

 

Was dit antwoord nuttig? Ja Nee

Feedback versturen
Het spijt ons dat we u niet hebben kunnen helpen. Als u feedback geeft, kunnen we het artikel verbeteren.