Hypergeometriske distribusjonsformler, ligninger, modell

Hypergeometriske distribusjonsformler, ligninger, modell

De Hypergeometrisk distribusjon Det er en diskret statistisk funksjon, tilstrekkelig til å beregne sannsynligheten i tilfeldige eksperimenter med to mulige resultater. Tilstanden som kreves for å anvende den er at det er små populasjoner, der ekstraksjonene ikke erstattes og sannsynligheten ikke er konstante. 

Derfor, når et element i befolkningen er valgt til å vite resultatet (sant eller usant) av en viss egenskap, kan det samme elementet ikke velges igjen.

Figur 1. I en populasjon av skruer som dette er det sikkert mangelfulle prøver. Kilde: Pixabay.

Det neste elementet som er valgt er således mer sannsynlig å oppnå et sant resultat, hvis det forrige elementet hadde et negativt resultat. Dette betyr at sannsynligheten varierer, i den grad elementene i prøven blir trukket ut.

De viktigste applikasjonene for hypergeometrisk distribusjon er: kvalitetskontroll i prosesser med liten populasjon og beregning av sannsynligheter i tilfeldige spill.

Når det gjelder den matematiske funksjonen som definerer hypergeometrisk fordeling, består dette av tre parametere, som er:

- Befolkningselementer nummer (n)

- Prøvestørrelse (m) 

- Antall hendelser i den komplette befolkningen med et gunstig (eller ugunstig) resultat av det karakteristiske undersøkte (n).

[TOC]

Formler og ligninger

Den hypergeometriske distribusjonsformelen gir sannsynlighet P om hva x Gunstige tilfeller av en viss egenskap oppstår. Måten å skrive det matematisk, avhengig av kombinatoriske tall er:

I forrige uttrykk N, n og m De er parametere og x variabelen i seg selv. 

-Total befolkning er N.

-Antall positive resultater av et visst binært kjennetegn med hensyn til den totale befolkningen er n.

-Antall elementer i prøven er m.

I dette tilfellet, X Det er en tilfeldig variabel som tar verdi x og P (x) indikerer sannsynligheten for forekomst av x Gunstige tilfeller av karakteristikken som er studert.

Viktige statistiske variabler

Andre statistiske variabler for hypergeometrisk distribusjon er:

- Halv μ = m*n/n

- Forskjell σ^2 = m*(n/n)*(1-n/n)*(n-m)/(n-1)

- Typisk avvik σ som er kvadratroten til variansen.

Modell og egenskaper 

For å komme til hypergeometrisk distribusjonsmodell er den basert på sannsynligheten for å få x Gunstige tilfeller i en størrelse prøve m. Denne prøven inneholder elementer som oppfyller eiendommen som studeres og elementer som ikke gjør det.

La oss huske det n representerer antall gunstige tilfeller i den totale befolkningen av N gjenstander. Da vil sannsynligheten bli beregnet slik:

Kan tjene deg: Vektorrom: base og dimensjon, aksiomer, egenskaper

P (x) = (antall måter å skaffe x# på mislykkede måter)/(# total måter å velge)

Når vi uttrykker ovennevnte i form av kombinatoriske tall, er følgende sannsynlighetsfordelingsmodell nådd:

Hovedegenskapene for hypergeometrisk distribusjon

Er følgende:

- Prøven må alltid være liten, selv om befolkningen er stor.

- Elementene i prøven blir trukket ut fra en, uten å innlemme dem igjen i befolkningen.

- Eiendommen som skal studeres er binær, det vil si at den bare kan ta to verdier: 1 enten 0, O vel EKTE enten forfalskning.

I hvert trinnutvinningstrinn endres sannsynligheten avhengig av de tidligere resultatene.

Tilnærming ved binomial distribusjon

En annen egenskap til hypergeometrisk distribusjon er at den kan tilnærmes ved binomial distribusjon, betegnet som Bi, Så lenge befolkningen N være stor og minst 10 ganger større enn prøven m. I dette tilfellet ville det være slik:

P (n, n, m; x) = bi (m, n/n, x)           

Så lenge n er stor og n> 10m

Eksempler

Eksempel 1

Anta at en maskin som produserer skruer og akkumulerte data indikerer at 1% kommer ut med feil. I en boks med n = 500 skruer vil antallet defekter være:

N = 500 * 1/100 = 5

Sannsynligheter gjennom hypergeometrisk distribusjon

Anta at fra den boksen (det vil si av den befolkningen) tar vi en prøve av M = 60 skruer.

Sannsynligheten for at ingen skrue (x = 0) av prøven etterlater defekt er 52,63%. Dette resultatet oppnås når du bruker hypergeometrisk distribusjonsfunksjon:

P (500, 5, 60; 0) = 0.5263

Sannsynligheten for at x = 3 prøveskruer lar være mangelfull er: P (500, 5, 60; 3) = 0,0129.

På den annen side er sannsynligheten for at x = 4 skruer på sekstitallet av prøven etterlater defekt: P (500, 5, 60; 4) = 0,0008.

Til slutt er sannsynligheten for at x = 5 skruer i den prøven ut med defekt: P (500, 5, 60; 5) = 0.

Men hvis du vil vite sannsynligheten for at det i den prøven er mer enn 3 mangelfulle skruer, må den akkumulerte sannsynligheten oppnås, og legge til:

P (3)+P (4)+P (5) = 0,0129+0,0008+0 = 0,0137.

Dette eksemplet er illustrert i figur 2, oppnådd ved bruk av Geogebra Bruk av gratis programvare på skoler, institutter og universiteter.

Figur 2. Eksempel på hypergeometrisk distribusjon. Utarbeidet av f. Zapata med Geogebra.

Eksempel 2

Et spansk dekk dekk har 40 kort, hvorav 10 har gull og de resterende 30 har ikke det. Anta at 7 kort er trukket ut fra det dekket, som ikke kommer tilbake til dekk.

Kan tjene deg: sentral symmetri: egenskaper, eksempler og øvelser

Hvis X er antall gullgull i de 7 kortene som er trukket ut, blir sannsynligheten for at X OROS i en utvinning av 7 kort er gitt av den hypergeometriske distribusjonen P (40,10,7; x).

La oss se på dette: For å beregne sannsynligheten for å ha 4 gull i en utvinning av 7 kort bruker vi den hypergeometriske distribusjonsformelen med følgende verdier:

Og resultatet er: 4,57% sannsynlighet.

Men hvis du vil vite sannsynligheten for å skaffe mer enn 4 kort, må vi legge til:

P (4)+P (5)+P (6)+P (7) = 5,20%

Løste øvelser

Følgende sett med øvelser er ment å illustrere og assimilere konseptene som er presentert i denne artikkelen. Det er viktig at leseren prøver å løse dem på egen hånd, før han ser på løsningen.

Oppgave 1

En profylaktisk fabrikk har funnet at av hver 1000 kondomer produsert av en viss maskin er 5 mangelfulle. For å utføre kvalitetskontroll blir 100 kondomer tatt tilfeldig og partiet avvises hvis det er minst en eller mer mangelfull. Svare:

a) Hvilken mulighet må være en 100 parti kassert?

b) Er dette kvalitetskontrollkriteriet effektivt?

Løsning

I dette tilfellet vises veldig store kombinatoriske tall. Beregningen er vanskelig, med mindre en tilstrekkelig datamaskinpakke er tilgjengelig.

Men fordi det er en stor populasjon og utvalget er ti ganger mindre enn den totale befolkningen, kan du bruke tilnærmingen til hypergeometrisk fordeling på grunn av binomial distribusjon:

P (1000,5,100; x) = bi (100, 5/1000, x) = bi (100, 0.005, x) = c (100, x)*0.005^x (1-0.005)^(100-x)

I forrige uttrykk C (100, x) Det er et kombinatornummer. Da vil sannsynligheten for at Haya mer enn en mangel vil bli beregnet som følger:

P (x> = 1) = 1 - Bi (0) = 1-.6058 = 0.3942

Det er en utmerket tilnærming, sammenlignet med verdien oppnådd når du bruker hypergeometrisk distribusjon: 0.4102

Det kan sies at 40% sannsynlighet mye 100 profylaktikk bør kastes, noe som ikke er veldig effektivt.

Men å være litt mindre krevende i kvalitetskontrollprosessen og kaste.

Oppgave 2

En plasttaco -maskin fungerer på en slik måte som for hver 10 stykker, en er deformert. I en 5 -stykke prøve må muligheten være en stykke defekt.

Løsning

Befolkning: n = 10

Kan tjene deg: Pythagorean identiteter: Demonstrasjon, eksempel, øvelser

Tall n defekt for hver n: n = 1

Prøvestørrelse: m = 5

P (10, 1, 5; 1) = C (1.1)*C (9.4)/C (10.5) = 1*126/252 = 0.5

Derfor er det 50% sannsynlighet for at i en prøve på 5 kommer en taco deformert ut.

Øvelse 3

I et møte med unge videregående skoler er det 7 damer og 6 herrer. Blant jentene, 4 studere humaniora og 3 vitenskaper. I gruppen av gutter studerer 1 humaniora og 5 vitenskaper. Beregn følgende:

a) Valg av tre jenter tilfeldig: Hva er sannsynligheten for at alle studerer humaniora?.

b) Hvis tre deltakere er valgt tilfeldig til vennens møte: hva er tre av dem, uavhengig av sex, studer de tre eller humaniora også alle tre?.

c) Velg nå to tilfeldige venner og ring x til det tilfeldige variabelen "antall av dem som studerer humaniora". Blant de to valgte, bestem den gjennomsnittlige eller forventede verdien av x og variansen σ^2.

Løsning på 

Befolkningen er det totale antallet jenter: n = 7. De som studerer humaniora er n = 4, av totalen. Den tilfeldige prøven av jenter vil være m = 3.

I så fall er sannsynligheten for at de tre er humaniora gitt av den hypergeometriske funksjonen:

P (n = 7, n = 4, m = 3, x = 3) = c (4, 3) c (3, 0) / c (7, 3) = 0.1143

Så er det 11.4% sannsynlighet for at tre tilfeldige chicas studerer humaniora.

Løsning b

Verdiene som skal brukes er:

-Befolkning: n = 14

-Mengde som studerer bokstaver er: n = 6 og

-Prøvestørrelse: M = 3.

-Antall venner som studerer humaniora: x

I følge dette betyr x = 3 at de tre studiene humaniora, men x = 0 betyr at ingen studerer humaniora. Sannsynligheten for at de tre studerer den samme er gitt av summen:

P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0.0560 + 0.1539 = 0.2099

Deretter har vi 21% sannsynlighet for at tre møtedeltakere, valgt tilfeldig, studerer det samme.

Løsning c

Her har vi følgende verdier:

N = 14 Total befolkning av venner, n = 6 Totalt antall i befolkningen som studerer humaniora, er størrelsen på prøven M = 2.

Håpet er:

E (x) = m * (n/n) = 2 * (6/14) = 0.8572

Og variansen:

σ (x)^2 =  m*(n/n)*(1-n/n)*(n-m)/(n-1) = 2*(6/14)*(1-6/14)*(14-2)/(14 -1) =

= 2*(6/14)*(1-6/14)*(14-2)/(14-1) = 2*(3/7)*(1-3/7)*(12) (13)  = 0.4521

Referanser

  1. Diskrete sannsynlighetsfordelinger. Gjenopprettet fra: Biploot.usal.er
  2. Statistikk og sannsynlighet. Hypergeometrisk distribusjon. Hentet fra: Projectodescartes.org
  3. CDPYE-UGR. Hypergeometrisk distribusjon. Gjenopprettet fra: UGR.er
  4. Geogebra. Klassisk geogebra, sannsynlighetsberegning. Gjenopprettet fra Geogebra.org
  5. Enkelt skifterett. Løst hypergeometriske distribusjonsøvelser. Gjenopprettet fra: probafacil.com
  6. Minitab. Hypergeometrisk distribusjon. Hentet fra: støtte.Minitab.com
  7. University of Vigo. Hoved diskrete distribusjoner. Gjenopprettet fra: Anapg.nettsteder.Uvigo.er
  8. Vitutor. Statistikk og kombinatorisk. Hentet fra: Vitutor.nett
  9. Weisstein, Eric w. Hypergeometrisk distribusjon. Gjenopprettet fra: Mathworld.Wolfram.com
  10. Wikipedia. Hypergeometrisk distribusjon. Gjenopprettet fra: er.Wikipedia.com