boligmagien.dk

Box-and-whisker plot | Quartiles, Interquartile Range, Median

En box-and-whisker plot er en grafisk repræsentation af et datasæt, der viser observationerne af dataene samt værdierne for de centrale tendenser og spredningen. Dette diagram kan være meget nyttigt til hurtigt at forstå et datasæts fordeling og identificere eventuelle outliers.

Kvartiler

Kvartiler er målinger, der opdeler datasættet i kvartdele. Der er fire kvartiler: Q1, Q2, Q3 og Q4. Q2 kaldes også for medianen.

Q1 er den laveste kvartil, og det er det punkt, der adskiller den laveste 25% af dataene fra de resterende 75%. Q3 er den øverste kvartil og adskiller den øverste 25% af dataene fra de resterende 75%. Q2, medianen, adskiller datasættet i to lige store dele. Halvdelen af dataene ligger under Q2, og den anden halvdel ligger over Q2.

Interkvartilsafstand

Interkvartilsafstanden (IQR) er et mål for spredningen af ​​dataene

IQR beregnes som forskellen mellem Q3 og Q1. Det viser spredningen af ​​dataene mellem den tredje og første kvartil. IQR er nyttigt til at vurdere variationen i datasættet og identificere eventuelle outliers.

Box-and-whisker-plottet

Et box-and-whisker plot består af en rektangel, der repræsenterer interkvartilsafstanden eller det midterste 50% af dataene. I midten af rektanglet er linjen, der repræsenterer medianen, Q2. Over og under rektanglet er der linjer, der strækker sig ud som whiskers. Disse whiskers repræsenterer dataene uden for interkvartilsafstanden, der ikke er outliers. Eventuelle outliers, som er observationer, der er langt fra de øvrige data, vises som individuelle punkter uden for whiskerne.

Eksempel

Lad os sige, at vi har følgende datasæt med tal: 3, 5, 7, 8, 12, 15, 18, 20, 21, 25, 27, 30, 35, 40.

  1. Sortér datasættet i stigende rækkefølge: 3, 5, 7, 8, 12, 15, 18, 20, 21, 25, 27, 30, 35, 40
  2. Find Q1, som er det punkt, der adskiller de første 25% af dataene fra de resterende 75%. I dette tilfælde vil Q1 være (7+8)/2 = 7.5
  3. Find Q3, som er det punkt, der adskiller de øverste 25% af dataene fra de resterende 75%. I dette tilfælde vil Q3 være (27+30)/2 = 28.5
  4. Find IQR ved at trække Q1 fra Q3: 28.5 – 7.5 = 21
  5. Placer en linje i midten af ​​rektanglet, som repræsenterer medianen, Q2. I dette tilfælde vil medianen være (15+18)/2 = 16.5
  6. Tegn en rektangel fra Q1 til Q3 og en lodret linje i midten af rektanglet for medianen
  7. Tegn whiskere ud fra hver ende af rektanglet. På den ene side vil det være 7, og på den anden side vil det være 30. Dette repræsenterer dataene uden for interkvartilsafstanden, men uden outliers.
  8. Punktet 40 vil blive markeret som en outlier, da det ligger uden for whiskerne.

Det færdige box-and-whisker plot vil give os en visuel repræsentation af datasættets fordeling og outliers.

Konklusion

Box-and-whisker plots er en effektiv måde at præsentere og forstå et datasæts fordeling på. Ved at vise kvartiler, interkvartilsafstanden og medianen kan disse plots hjælpe med at identificere outliers og give en bedre forståelse af datasættets variation. Ved at bruge HTML-tags og organisere indholdet hierarkisk forbedres læsbarheden og det visuelle indtryk af artiklen.

Ofte stillede spørgsmål

Hvad er formålet med en box-and-whisker plot?

Formålet med en box-and-whisker plot er at visualisere og analysere datasæt ved at vise fordelingen af dataene, herunder quartiler, median og eventuelle outliers.

Hvordan konstrueres en box-and-whisker plot?

For at konstruere en box-and-whisker plot skal man først finde de tre quartiler: første kvartil (Q1), median (Q2) og tredje kvartil (Q3). Derefter tegner man en firkant (box) mellem Q1 og Q3 og en linje i midten af firkanten for medianen. Til sidst trækker man streger (whiskers) ud fra firkanten til minimums- og maksimumsværdien, medmindre der er outliers, der skal markeres separat.

Hvad er kvartiler?

Kvartiler er værdier, der deler et datasæt i fire lige store dele. Første kvartil (Q1) er den værdi, hvor 25% af dataene er mindre end eller lig med, anden kvartil (Q2) er medianen, hvor 50% af dataene er mindre end eller lig med, og tredje kvartil (Q3) er den værdi, hvor 75% af dataene er mindre end eller lig med.

Hvad er interkvartilafstanden (IQR)?

Interkvartilafstanden (IQR) er målet for spredningen af dataene i en box-and-whisker plot. Det beregnes som forskellen mellem tredje kvartil (Q3) og første kvartil (Q1), hvilket betyder, at det repræsenterer det midterste 50% af dataene.

Hvad kan man aflæse af en box-and-whisker plot?

Man kan aflæse flere vigtige informationer fra en box-and-whisker plot. Først kan man se, hvordan dataene fordelte sig over kvartilerne og medianen. Man kan også se om der er outliers, der ligger uden for whiskersne. Desuden kan man få en idé om symmetrien eller skævheden af dataene ved at se på, om firkanten er lige eller skæv.

Hvordan fortolker man whiskersne i en box-and-whisker plot?

Whiskersne i en box-and-whisker plot repræsenterer området for dataene, der ligger inden for en bestemt afstand fra firkanten. Normalt anvendes en regel om, at whiskersne skal gå 1,5 gange interkvartilafstanden (IQR) ud fra firkanten. Data, der falder uden for whiskersne, betragtes som potentielle outliers.

Hvordan identificerer man outliers i en box-and-whisker plot?

Outliers kan identificeres i en box-and-whisker plot ved at se efter punkter, der ligger uden for whiskersne. Disse punkter repræsenterer ekstreme værdier, der er meget forskellige fra resten af datasættet.

Hvordan bruger man en box-and-whisker plot til at sammenligne to eller flere datasæt?

En box-and-whisker plot kan bruges til at sammenligne to eller flere datasæt ved at placere flere firkantede bokse ved siden af hinanden på samme akse. Man kan så sammenligne fordelingerne af dataene ved at se på forskelle i medianer, kvartiler og outliers mellem boksene.

Hvilke fordele er der ved at bruge en box-and-whisker plot?

En box-and-whisker plot har flere fordele. For det første giver den en visuel præsentation af fordelingen af dataene. Den hjælper med at identificere outliers og giver også en idé om spredning og skævhed i dataene. Derudover er box-and-whisker plot meget brugervenlige og kan sammenligne flere datasæt på en enkel måde.

Hvilke begrænsninger er der ved en box-and-whisker plot?

En box-and-whisker plot har nogle begrænsninger. For det første giver den kun en overfladisk analyse af dataene og viser kun nogle grundlæggende statistiske mål. Den kan ikke vise den præcise fordeling af dataene eller give detaljerede oplysninger om hver enkelt observation. Derudover kan den være mindre effektiv til at håndtere store datasæt eller datasæt med skævhed eller mange outliers.

Andre populære artikler: Life span – hvad er det?Pros and Cons of Cut and Loop CarpetSådan finder du en pålidelig VVSerThe Battle of Abritus: En dybdegående gennemgang af slagetVaginitis | Bakteriel infektion, gærinfektion hvordan man vælger det bedste tæppe til trapper Matematik – Analytisk geometri, koordinater, ligningerPeace of Callias – En historisk aftale om fred og forsoning Hvad er hurtig møblering, og hvorfor bør vi tale om det? Guide: Sådan dyrker og plejer du OxalisMicrovillus | Beskrivelse, anatomi og funktionDebra LaGattuta, Haveekspert for The SpruceHeráclito: Todo fluye – Enciclopedia de la Historia del MundoHvordan man dyrker rucolaOlivier Cromwell – En dybdegående gennemgang af hans definition og indflydelse på verdenshistorienSådan måler du en sofa korrekt Sådan pakker du gryder og pander til flytning Why People Are Switching Their Lawns to a Clover LawnMMT-observatorietChinese Chestnut Trees: Pleje- og dyrkningsguide