Målinger av sentral tendens til grupperte dataformler, øvelser

Målinger av sentral tendens til grupperte dataformler, øvelser

De Trendtiltak sentral De indikerer verdien som dataene om en distribusjon er. Det mest kjente er det gjennomsnittlige eller aritmetiske gjennomsnittet, som består i å legge til alle verdier og dele resultatet med det totale antallet data.

Imidlertid, hvis distribusjonen består av et stort antall verdier og ikke presenteres på en ryddig måte, er det ikke lett å utføre de nødvendige beregningene for å trekke ut den verdifulle informasjonen de inneholder.

Figur 1. Sentrale tendensmål for grupperte data er en god indikasjon på den generelle dataatferden

Det er grunnen til at de er gruppert i klasser eller kategorier, for å utdype en distribusjon av Frekvenser. Å utføre denne tidligere ordren av dataene, da er det lettere å beregne de sentrale tendensmålene, blant dem er:

-Halv

-Median

-Mote

-Geometrisk middel

-Harmonisk middel

Formler

Nedenfor har vi formlene for de sentrale tendensmålene for grupperte data:

Aritmetisk gjennomsnitt

Gjennomsnittet er det mest brukte for å karakterisere kvantitative data (numeriske verdier), selv om de er ganske følsom for de ekstreme distribusjonsverdiene. Det beregnes av:

Med:

-X: gjennomsnittlig eller gjennomsnittlig aritmetikk

-FYo: Klassefrekvens

-mYo: Klassemerket

-G: Klassenummer

-N: Total data

Median

For å beregne det, er det nødvendig å finne intervallet som inneholder observasjonen n/2 og interpolar for å bestemme den numeriske verdien av nevnte observasjon, ved hjelp av følgende formel:

Hvor:

-C: Intervallbredde som medianen tilhører

-BM: Nedre kant av nevnte intervall

-Fm: Antall observasjoner inneholdt i intervallet

-N/2: Total data delt på 2.

-FBM: Antall observasjoner før intervallet som inneholder medianen.

Derfor er medianen et posisjonstiltak, det vil si deler datasettet i to deler. De kan også defineres kvartiler, Deciles og Prosentiler, som deler fordelingen i henholdsvis fire, ti og hundre deler.

Kan tjene deg: Fourier Transform: Egenskaper, applikasjoner, eksempler

Mote

I grupperte data blir klassen eller kategorien som inneholder de fleste observasjonene søkt. Dette er Modal klasse. En distribusjon kan ha to eller flere moter, i hvilket tilfelle det kalles Bimodal og Multimodal, henholdsvis.

Du kan også beregne mote i grupperte data etter ligningen:

Med:

-L1: Nedre grense for klassen der mote er

1: Det gjenstår mellom frekvensen av modalklassen og frekvensen av klassen som går foran den.

2: Trekk mellom frekvensen av modalklassen og frekvensen av klassen som følger den.

-C: Intervallbredde som inneholder mote

Harmonisk middel

Det harmoniske gjennomsnittet er betegnet med h. Når du har et sett med n Verdier x1, x2, x3..., det harmoniske gjennomsnittet er det omvendte eller gjensidige av det aritmetiske gjennomsnittet av det inverse av verdiene.

Det er lettere å se det gjennom formelen:

Og når du har grupperte data, blir uttrykket transformert til:

Hvor:

-H: Harmonisk gjennomsnitt

-FYo: Klassefrekvens

-mYo: Klassemerke

-G: Klassenummer

-N = f1 + F2 + F3 +..

Geometrisk middel

Hvis du har n Positive tall x1, x2, x3..., dets geometriske gjennomsnitt beregnes av n-EME av produktet av alle tall:

Når det gjelder grupperte data, kan det påvises at desimal logaritmen til den geometriske gjennomsnittlige loggen G, er gitt av:

Hvor:

-G: Geometrisk middel

-FYo: Klassefrekvens

-mYo: Klassemerket

-G: Klassenummer

-N = f1 + F2 + F3 +..

Forholdet mellom H, G og X

Det er alltid sant at:

H ≤ g ≤ x

Mest brukte definisjoner

Følgende definisjoner er nødvendige for å finne verdiene beskrevet i de forrige formlene:

Frekvens

Frekvensen er definert som antall ganger et faktum gjentas.

Område

Det er forskjellen mellom hoved- og mindreverdien, som er til stede i distribusjonen.

Antall klasser

For å vite hvor mange klasser vi grupperer dataene, bruker vi noen kriterier, for eksempel følgende:

Kan tjene deg: 17 begrunnet problemer

Grenser

De ekstreme verdiene for hver klasse eller intervall kalles grenser og hver klasse kan ha begge godt definerte grenser, i hvilket tilfelle den har en nedre grense og en større. Eller det kan ha åpne grenser, når et område er gitt, for eksempel verdier som er større eller lavere enn et visst tall.

Klassemerke

Den består ganske enkelt av midtpunktet i intervallet og beregnes i gjennomsnitt den øvre grensen og den nedre grensen.

Intervallbredde

Dataene kan grupperes i klasser av lik eller forskjellig størrelse, dette er bredden eller amplituden. Det første alternativet er det mest brukte, ettersom det letter beregningene, selv om det i noen tilfeller er viktig at klasser har ulik bredde.

Bredden c Fra intervallet kan det bestemmes ved følgende formel:

C = rekkevidde / nc

Hvorc Det er antall klasser.

Trening løst

Nedenfor har vi en serie hastighetsmålinger i km/t, tatt med radar, som tilsvarer 50 biler som passerte gjennom en gate i en viss by:

Figur 2. Tabell for øvelsen løst. Kilde: f. Zapata.

Løsning

Dataene som presenteres er ikke organisert, så det første trinnet er å gruppere dem i klasser.

Trinn for å gruppere dataene og bygge tabellen

Trinn 1

Finn området R:

R = (52 - 16) km/t = 36 km/t

Steg 2

Velg antall klasser nc, I henhold til de gitte kriteriene. Ettersom det er 50 data, kan vi velge nc = 6.

Trinn 3

Beregn bredden c av intervallet:

C = rekkevidde /nc = 36/6 = 6

Trinn 4

Skjemaklasser og gruppedata som følger: For første klasse A er den nedre grensen valgt så snart den nedre verdien som er til stede i tabellen legges til denne verdien av C = 6, tidligere beregnet, og den oppnår dermed den øvre grensen for førsteklasses.

Det fortsetter på samme måte å bygge resten av klassene, som vist i følgende tabell:

Kan tjene deg: Hva er et Capicúa -nummer? Egenskaper og eksempler

Hver frekvens tilsvarer en farge i figur 2, på denne måten sikres det at ingen verdi rømning fra å bli regnskapsført for.

Gjennomsnittlig beregning

X = (5 x 18.5 +25 x 25.0 + 10 x 31.5 + 6 x 38.0 + 2 x 44.5 + 2 x 51.0) ÷ 50 = 29.03 km/t

Median beregning

Medianen er i klasse 2 av tabellen, siden det er de første 30 distribusjonsdataene.

-Intervallbredde som medianen tilhører: C = 6

-Nedre kant av intervallet der medianen er: BM = 22.0 km/t

-Antall observasjoner inneholdt i intervallet fm = 25

-Total data delt på 2: 50/2 = 25

-Antall observasjoner før intervallet som inneholder median: fBM = 5

Og operasjonen er:

Median = 22.0 + [(25-5) ÷ 25] × 6 = 26.80 km/t

Mote

Mote finnes også i klasse 2:

-Intervallbredde: C = 6

-Nedre grense for klassen der mote er funnet: l1 = 22.0

-Trekk mellom frekvensen av modalklassen og frekvensen av klassen som går foran den: Δ1 = 25-5 = 20

-Trekk mellom frekvensen av modalklassen og frekvensen av klassen som følger: Δ2 = 25 - 10 = 15

Med disse dataene er operasjonen:

Mote = 22.0 + [20 ÷ (20 + 15)] x6 = 25.4 km/t

Beregning av det geometriske middel

N = f1 + F2 + F3 +... = 50

Logg G = (5 x log 18.5 + 25 x log 25 + 10 x log 31.5 + 6 x log 38 + 2 × log 44.5 + 2 x log 51) /50 =

Logg G = 1.44916053

G = 28.13 km/t

Harmonisk gjennomsnittlig beregning

1/h = (1/50) x [(5/18.5) + (25/25) + (10/31.5) + (6/38) + (2/44.5) + (2/51)] = 0.0366

H = 27.32 km/t

Sammendrag av sentrale tendensmål

Variablene -enhetene er km/t:

-Media: 29.03

-Median: 26.80

-Mote: 25.40

-Geometriske medier: 28.1. 3

-Harmonisk middel: 27.32

Referanser

  1. Berenson, m. 1985. Statistikk for administrasjon og økonomi. Inter -American s.TIL.
  2. Canavos, g. 1988. Sannsynlighet og statistikk: applikasjoner og metoder. McGraw Hill.
  3. Devore, J. 2012. Sannsynlighet og statistikk for ingeniørfag og vitenskap. 8. Utgave. Cengage.
  4. Levin, r. 1988. Statistikk for administratorer. 2. Utgave. Prentice Hall.
  5. Spiegel, m. 2009. Statistikk. Schaum -serien. 4 ta. Utgave. McGraw Hill.
  6. Behandling av grupperte data. Gjenopprettet fra: Itchihuahua.Edu.MX.
  7. Walpole, r. 2007. Sannsynlighet og statistikk for ingeniørfag og vitenskap. Pearson.