Posisjonstiltak, sentral tendens og spredning
- 2587
- 371
- Magnus Sander Berntsen
De Målinger av sentral, spredning og posisjons tendens, Dette er verdier som brukes til å tolke et sett med statistiske data på riktig måte. Disse kan arbeides direkte, som hentes fra den statistiske studien, eller de kan organiseres i grupper med like frekvens, noe som letter analysen.
De tre mest kjente sentrale trendtiltakene og noen av dens egenskaper. Kilde: f. Zapata.Målinger av sentral tendens
De tillater å vite om hvilke verdier de statistiske dataene er gruppert sammen.
Aritmetisk gjennomsnitt
Det er også kjent som gjennomsnittet av verdiene til en variabel og oppnås ved å legge til alle verdiene og dele resultatet med det totale antallet data.
-
Aritmetisk gjennomsnitt for data uten gruppering
Være en x -variabel som det ikke er data uten å organisere eller gruppere, det aritmetiske gjennomsnittet beregnes som følger:
Og i sammendraget notasjon:
Eksempel
Eierne av et vandrerhjem med fjellturist har til hensikt å vite hvor mange dager i gjennomsnitt besøkende som gjenstår i fasilitetene. For å gjøre dette ble det utført en registrering av dagene med varighet av 20 grupper av turister, og innhentet følgende data:
1; 1; 2; 2; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; 2; 2; 3; 4; 1
De gjennomsnittlige dagene turister blir værende er:
= 2.5 dager
-
Aritmetisk gjennomsnitt for grupperte data
Hvis de variable dataene er organisert i en absolutt frekvenstabell FYo Og klassesentre er x1, x2,..., xn, Gjennomsnittet beregnes av:
I summeringen av sommeren:
Median
Medianen til en gruppe N -verdier av variabel x er den sentrale verdien av gruppen, forutsatt at verdiene i økende grad blir bestilt. På denne måten er halvparten av alle verdiene lavere enn mote, og den andre halvparten er større.
-
Medium av ikke -grupperte data
Følgende tilfeller kan presenteres:
-Nummer n verdier av variabel x merkelig: Medianen er verdien som er bare midt i verdikruppen:
-Nummer n verdier av variabel x par: I dette tilfellet beregnes medianen som gjennomsnittet av de to sentrale verdiene i datagruppen:
Eksempel
For å finne medianen av turisthosteldataene blir de først bestilt fra minst til største:
1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 4; 4; 4; 4; 5; 5
Det kan tjene deg: Hva er den relative frekvensen og hvordan den beregnes?Datatummeret er til og med, derfor er det to sentrale data: x10 og xelleve Og ettersom begge er verdt 2, er gjennomsnittet også.
Median = 2
-
Medium av grupperte data
Følgende formel brukes:
Symbolene i formelen betyr:
-C: Intervallbredde som inneholder median
-BM: Nedre kant av det samme intervallet
-Fm: Antall observasjoner som inneholder intervallet som medianen tilhører.
-N: Total data.
-FBM: Antall observasjoner før intervallet som inneholder medianen.
Mote
Mote for ikke -grupperte data er den mest frekvensverdien, mens det for grupperte data er den mest frekvensklassen. Det regnes som mote som de mest representative data eller distribusjonsklasse.
To viktige egenskaper ved dette tiltaket er at et datasett kan ha mer enn en mote, og mote kan bestemmes for både kvantitative data og kvalitative data.
Eksempel
Fortsetter med dataene fra turisthjemmet, den som gjentas mest er 1, derfor er det vanligste at turister forblir 1 dag på vandrerhjemmet.
Målinger av spredning
Spredningstiltak beskriver hvor gruppert dataene rundt de sentrale tiltakene er.
Område
Det beregnes ved å trekke fra hoveddataene og mindre data. Hvis denne forskjellen er stor, er det et tegn på at dataene er spredt, mens de små verdiene indikerer at dataene er nær gjennomsnittet.
Eksempel
Utvalget for turisthosteldataene er:
Rekkevidde = 5-1 = 4
Forskjell
-
Varians for ikke -grupperte data
For å finne variansen s2 Det er nødvendig å først kjenne til det aritmetiske gjennomsnittet, deretter beregnes forskjellen til torget mellom hver data og gjennomsnittet, alle blir lagt til og delt på de totale observasjonene. Disse forskjellene er kjent som avvik.
Variansen, som alltid er positiv (eller null), indikerer hvor langt er observasjonene av gjennomsnittet: Hvis variansen er høy, er verdiene mer spredt enn når variansen er liten.
Eksempel
Variansen for dataene fra turisthjemmet er:
1; 1; 2; 2; 1; 4; 5; 1; 3; 4; 5; 4; 3; 1; 1; 2; 2; 3; 4; 1
= 1.95
-
Varians for grupperte data
For å finne variansen til en gruppe grupperte data, er de påkrevd: i) gjennomsnittet, ii) frekvensen fYo som er de totale dataene i hver klasse og iii) xYo eller klasseverdi:
Det kan tjene deg: Typer trekanterStandardavvik
Standardavviket er den positive kvadratroten til variansen, så den har en fordel i forhold til variansen: den kommer i de samme enhetene som variabelen som er undersøkt og har dermed en mer direkte idé enn det nære eller langt som er variabelen av gjennomsnittet.
-
Standardavvik for ikke -grupperte data
Det bestemmes ganske enkelt ved å finne kvadratroten av variansen for ikke -ristede data:
Eksempel
Standardavviket for turisthosteldata er:
S = √ (s2) = √1.95 = 1.40
-
Standardavvik for grupperte data
Det beregnes ved å finne kvadratroten til variansen for grupperte data:
Posisjonstiltak
Posisjonstiltak deler et ordnet sett med data i like deler. Medianen, i tillegg til å være et sentralt tendensmål er også et mål på posisjon, siden det deler helheten i to like store deler. Men du kan skaffe mindre deler med kvartiler, desiler og persentiler.
Kvartiler
Kvartiler deler settet i fire like deler, hver med 25 % av dataene. De er betegnet som q1, Q2 og q3 Og medianen er kvartilen q2. På denne måten er 25% av dataene under kvartilen q1, 50% under kvartilen q2 eller median og 75% under kvartilen q3.
Figur 2. Kvartiler deler datasettet i fire like deler. Kilde: f. Zapata.-
Kvartiler for ikke -grupperte data
Dataene bestilles og totalen er delt inn i 4 grupper med samme antall data hver. Posisjonen til den første kvartilen finnes av:
Q1 = (n+1)/4
Å være de totale dataene. Hvis resultatet er hele dataene som tilsvarer den posisjonen, men hvis det er desimal, er dataene som tilsvarer hele delen med følgende gjennomsnitt, eller for større presisjon er det lineært interpolert mellom nevnte data.
Eksempel
Posisjonen til den første kvartilen q1 For dataene fra turisthjemmet er:
Q1 = (n+1) / 4 = (20+1) / 4 = 5.25
Dette er plasseringen av kvartil 1, og ettersom resultatet er desimal, søkes data x data5 og x6, som er henholdsvis x5 = 1 og x6 = 1 og de er gjennomsnittlig, noe som resulterer:
Første kvartil = 1
1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 4; 4; 4; 4; 5; 5.
Posisjonen til den andre kvartilen q2 er:
Kan tjene deg: Teleskopisk sum: Hvordan det løses og løses øvelserQ2 = 2 (n+1)/4 = 10.5
Som er gjennomsnittet mellom x10 og xelleve og sammenfaller med medianen:
Andre kvartil = median = 2
Den tredje kvartilposisjonen beregnes av:
Q3 = 3 (n+1) / 4 = 3 (20+1) / 4 = 15.75
Det er også desimal, derfor er x gjennomsnittetfemten og x16:
1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 4; 4; 4; 4; 5; 5.
Men ettersom begge er verdt 4:
Tredje kvartil = 4
Den generelle formelen for plasseringen av kvartiler i uforsvarlige data er:
Qk = K (n+1)/4
Med k = 1,2,3.
-
Kvartiler for grupperte data
De beregnes lik median:
Forklaringen på symbolene er:
-BQ: Nedre kant av intervallet som inneholder kvartil
-C: Bredde på det intervallet
-Fq: Antall observasjoner inneholdt kvartilintervallet.
-N: Total data.
-FBQ: Antall data før intervallet som inneholder kvartil.
Dekiler og persentiler
Deciles og persentiler deler datasettet i henholdsvis 10 like deler og 100 like deler, og beregningen deres utføres analogt med kvartiler for kvartiler.
-
Deciles og persentiler for ikke -grupperte data
Formler brukes henholdsvis:
Dk = K (n+1)/10
Med k = 1,2,3… 9.
Desil d5 Det må være lik medianen.
Pk = K (n+1)/100
Med k = 1,2,3… 99.
Persentilen pfemti Det må være lik medianen.
Eksempel
I eksemplet med turisthjemmet, stillingen til D3 er:
D3 = 3 (20+1)/10 = 6.3
Hvordan er et desimaltall i gjennomsnitt x6 og x7, begge lik 1:
1; 1; 1; 1; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 4; 4; 4; 4; 5; 5
Betyr at 3 tideler av dataene er under x7 = 1 og de resterende ovenfor.
-
Deciles og persentiler for grupperte data
Formlene er analoge med kvartiler. D brukes til å betegne desilene og P for persentilene, og symbolene tolkes på lignende måte:
Den empiriske regelen
Når dataene distribueres symmetrisk og fordelingen er unimodal, er det en regel kalt Empirisk styre enten Regel 68 - 95 - 99, som grupperer dem i følgende intervaller:
- 68% av dataene er i intervallet:
- 95% av dataene er i intervallet:
- 99% av dataene er i intervallet:
Eksempel
I hvilket intervall er 95% av turisthosteldataene?
De er i intervallet: [2.5−1.40; 2.5+1.40] = [1.1; 3.9].
Referanser
- Berenson, m. 1985. Statistikk for administrasjon og økonomi. Inter -American s.TIL.
- Devore, J. 2012. Sannsynlighet og statistikk for ingeniørfag og vitenskap. 8. Utgave. Cengage.
- Levin, r. 1988. Statistikk for administratorer. 2. Utgave. Prentice Hall.
- Spiegel, m. 2009. Statistikk. Schaum -serien. 4 ta. Utgave. McGraw Hill.
- Walpole, r. 2007. Sannsynlighet og statistikk for ingeniørfag og vitenskap. Pearson.
- « Bestemmelseskoeffisientformler, beregning, tolkning, eksempler
- Sirkulære permutasjoner Demonstrasjon, eksempler, øvelser løst »