Wat is het verschil tussen het gemiddelde en de mediaan?

0 weergave

Het gemiddelde berekent men door alle waarden op te tellen en te delen door het aantal waarden. De mediaan, daarentegen, is de middelste waarde in een geordende dataset. Terwijl het gemiddelde gevoelig is voor uitschieters, geeft de mediaan een robuuster beeld van het centrum, omdat extreme waarden er minder invloed op hebben.

Opmerking 0 leuk

Gemiddelde vs. Mediaan: Twee manieren om het midden te vinden

Bij het analyseren van data is het bepalen van het ‘midden’ een cruciale stap. Twee veelgebruikte maten hiervoor zijn het gemiddelde en de mediaan. Hoewel ze allebei een idee geven van de centrale tendens, verschillen ze significant in hun berekening en gevoeligheid voor extreme waarden, oftewel uitschieters. Het kiezen van de juiste maat hangt dan ook af van de specifieke dataset en de beoogde analyse.

Het gemiddelde (of aritmetisch gemiddelde): Dit is de meest bekende maat voor het midden. Het gemiddelde wordt berekend door alle waarden in een dataset bij elkaar op te tellen en vervolgens te delen door het totale aantal waarden. Simpel gezegd: de som gedeeld door het aantal.

  • Voorbeeld: Stel we hebben de volgende dataset van leeftijden: 25, 28, 30, 32, 35. Het gemiddelde is (25 + 28 + 30 + 32 + 35) / 5 = 30.

De mediaan: De mediaan is de middelste waarde in een geordende dataset. Om de mediaan te vinden, moet de dataset eerst van klein naar groot (of groot naar klein) worden gesorteerd. Als er een oneven aantal waarden is, is de mediaan simpelweg de middelste waarde. Bij een even aantal waarden is de mediaan het gemiddelde van de twee middelste waarden.

  • Voorbeeld (zelfde dataset): De geordende dataset is: 25, 28, 30, 32, 35. De mediaan is 30.

  • Voorbeeld (even aantal waarden): Dataset: 25, 28, 30, 32. De geordende dataset blijft: 25, 28, 30, 32. De mediaan is (28 + 30) / 2 = 29.

Het verschil in actie: de invloed van uitschieters

Het grootste verschil tussen gemiddelde en mediaan komt naar voren bij datasets met uitschieters. Uitschieters zijn extreme waarden die significant afwijken van de andere waarden in de dataset. Het gemiddelde is zeer gevoelig voor deze uitschieters; één extreme waarde kan het gemiddelde aanzienlijk verstoren en een vertekend beeld geven van het ‘typische’ waarde. De mediaan daarentegen is veel robuuster. Uitschieters hebben weinig tot geen invloed op de mediaan, omdat deze enkel afhankelijk is van de positie van de waarden in de geordende dataset, niet van hun absolute waarde.

  • Voorbeeld: Neem de dataset: 25, 28, 30, 32, 35, 100. Het gemiddelde is nu (25 + 28 + 30 + 32 + 35 + 100) / 6 = 40. De uitschieter (100) verhoogt het gemiddelde aanzienlijk. De mediaan blijft echter 31 ((30+32)/2).

Conclusie:

De keuze tussen gemiddelde en mediaan hangt af van de context. Het gemiddelde is geschikt voor datasets zonder uitschieters en waar de gemiddelde waarde relevant is. De mediaan is de betere keuze bij datasets met uitschieters of wanneer een robuuste maat voor de centrale tendens gewenst is. In sommige gevallen is het zelfs nuttig om beide maten te berekenen en te vergelijken om een completer beeld van de data te verkrijgen.