Punktlig estimat

Punktlig estimat

Vi forklarer hva som er poengestimering, dens egenskaper, metoder. I tillegg setter vi et eksempel og løste øvelser

Hva er det punktlige estimatet?

De Punktlig estimat Av de statistiske parametrene til en eller annen populasjonskarakteristikk, er det en som utføres fra en eller flere prøver av nevnte karakteristikk, representert som tilfeldig variabel.

Befolkningen kan være forskjellige: Kvinnene i en by, pasienter på et sykehus, skruene produsert av en viss bransje i løpet av en måned og mange andre.

I befolkningen av kvinner i en by kan en statistisk studie fokusere på forskjellige kjennetegn ved denne befolkningen: for eksempel størrelsen på sko, høyde, midje, hårfarge, antall barn, alder og utallige av andre egenskaper.

Når befolkningen og karakteristikken som ønsker å gjennomgå en statistisk studie er valgt, velges en størrelse prøve n, som vanligvis er ganske mindre enn størrelse N av den totale befolkningen.

Egenskaper for punktlig estimering

Kjent dataene til en prøve, som er representert med en tilfeldig variabel X, Disse er representert av et sett med n Reelle tall: (x1, x2,.. ., xn).

Med disse dataene kan en statistikk over utvalget beregnes:

  • Eksempel betyr: = (x1+x2,.. ., +xn)/n.
  • Eksempel på varians: S2 = [x1 ~ )2 +.. . +(xn )2]/n.
  • Kvasi-variza prøve: SC2 = [x1 ~ )2 +.. . +(xn )2]/(N 1).
Normal fordeling av en populasjon med sentral verdi μ og Sigma -avvik σ

På den annen side, Befolkningsgjennomsnitt μ og Befolkningsvarians σ2 De vil kreve kunnskap om all data fra den totale befolkningen, som har en størrelse N >> n. Følgelig er det ofte umulig å kjenne nøyaktig populasjonsparametrene.

Med tanke på dette tilnærmer populasjonsverdiene vanligvis med prøveverdier, tilnærming kjent som Punktlig estimat. SDet vil være bra eller dårlig, avhengig hovedsakelig av datamengden og kvaliteten på prøven. Prøven er kjent som Estimator.

Kan tjene deg: Cotangent avledet: beregning, demonstrasjon, øvelser

En god estimator må ha noen ønskelige egenskaper eller egenskaper:

  • Sammenheng
  • Minimum variasjon 
  • Effektivitet.

1.- Sammenheng

Et utvalg må ha tilstrekkelig antall data slik at estimering av parametrene er konsistent. For eksempel, hvis tre eller flere prøver tas og prøvestatistikk er veldig ulik hverandre, vil det ikke være aktuelt å ta noen av disse resultatene som et spesifikt estimat. 

I de fleste tilfeller er det nok å ta prøver av større antall data, slik at de statistiske parametrene oppnådd fra dem begynner å vise konvergens eller tilfeldighet, alltid med en viss toleranse. I tilfelle det ikke er noen konvergens, til tross for økningen i data, bør kvaliteten deres gjennomgås, siden de kunne ha skjevhet, eller de rett og slett ble tatt dårlig.

2.- Minimum variabilitet

Hvis flere estimatorer er tilgjengelige hvis gjennomsnittsverdier sammenfaller med en viss toleranse, er de som har den minste prøvevariansen valgt.

3.- Effektivitet

En estimator er effektiv fra det øyeblikket eksemplene på strømpene har en tendens til null, ettersom n har en tendens til uendelig. Er det som kalles Asymptotisk effektivitet av estimatoren.

Metoder

Nedenfor er noen praksiser eller metoder som gjør det mulig å lage et vellykket punktlig estimat av populasjonsparametrene, fra en prøve.

1.-Tilfeldig partisjon

Den tilfeldige partisjonen av en prøve for å sjekke konsistens brukes. Denne metoden består av å ta en prøve av n størrelse og dele den tilfeldig i to prøver, av N/2 -størrelse hver.

Hvis utvalget og utvalgsvariansen sammenfaller med et visst antall viktige tall, vanligvis 2 eller 3 figurer, kan det sies at det er sammenheng mellom dem.

Kan tjene deg: Multiplikativ prinsipp: telleteknikker og eksempler

På den annen side, hvis det er tilfeldigheter på nivå med signifikante tall mellom de statistiske parametrene beregnet med den originale N -størrelsesprøven og de to subsams, er det også konvergens, og det kan bekreftes at prøvestørrelsen er tilstrekkelig. Ellers ville det være nødvendig å ta tilleggsdata, for å heve mengden eksempler på data.

2.- Mode -metode

Denne metoden er å matche øyeblikkene av en tilfeldig prøve av N -størrelse, med de som er oppnådd fra utvalgets distribusjonskandidat. Hvis kandidatfordelingen har M -parametere, vil det være nødvendig å matche M -øyeblikk.

3.- Maksimal troverdighetsmetode

Han ble foreslått av Fisher, en av foreldrene til statistisk vitenskap, for omtrent hundre år siden. Det består i å optimalisere eller maksimere sannsynligheten for forekomst av et visst sett med prøveverdier.

Eksempel

Anta at oppførselen til en viss populasjonsvariabel følger en eksponentiell fordeling, hvis sannsynlighetstetthet er gitt av:

 f (x; λ) = λ ⋅ exp (−λemt)

Det er helt klart en enkelt parameterfordeling λ.

For å lage et estimat av nevnte populasjonsparameter, kan en tilfeldig prøve av N -størrelse brukes, hvis resultater er som følger: (x1, x2,.. ., xn)

Det første øyeblikket av prøven oppnås, som er gjennomsnittsverdien, gjennom:

= (x1 + x2 +… + Xn) / n

Det kan påvises at det første øyeblikket med eksponentiell distribusjon er integralen av 0 til uendelig til x⋅f -funksjonen (x; λ), og resultatet er 1/λ.

I likhet med utvalgsmomentet med befolkningsfordelingen konkluderes det med at det spesifikke estimatet av λ er 1/.

Løste øvelser

Oppgave 1

På en studie utført med 100 data ble det bestemt at gjennomsnittlig tid som en person tar for å visualisere en YouTube -video, når varslingen er mottatt, er 3 minutter. Finn tidssannsynlighetsfordelingen som brukes til å se videoen, når varselet er mottatt.

Det kan tjene deg: y = 3sen (4x) funksjonsperiode

Løsning

Det vil antas at den maksimale sannsynligheten for at en person gjennomgår en video oppstår like etter varselet, men hvis den går lang tid etter den, er sannsynligheten for at personen ser videoen veldig lav.

Dette er den typiske oppførselen til en eksponentiell fordeling, derfor kan populasjonsatferd modelleres gjennom følgende sannsynlighetsfordeling, for tid T (i minutter), målt fra varselet:

 f (t; λ) = λ ⋅ exp (−λemt)

I denne typen distribusjoner er håpet eller gjennomsnittet = 1/λ, som forklart i forrige seksjon. Deretter kan du fra prøveinformasjonen tilnærme λ:

λ ≈ ⅓.

Oppgave 2

En undersøkelse gjøres med et enkelt spørsmål, hvis mulige svar er: ja (1) eller ikke (0). Resultatene fra undersøkelsen der alle svarte var: 26 ja og 14 nei.

Under antagelsen at svaret er tilfeldig, så fordelingen av disse resultatene er en Binomial distribusjon hvis sannsynlighet er:

P = p26 · (1 --p)14

Det kan påvises at maksimum av denne funksjonen skjer når P tar verdien 26/40, og dette er verdien som gjør at de oppnådde prøveverdiene.