Vés al contingut

Prova Z

De la Viquipèdia, l'enciclopèdia lliure

Una prova Z és qualsevol prova estadística per a la qual la distribució sota la hipòtesi nul·la es pot aproximar mitjançant una distribució normal. La prova Z comprova la mitjana d'una distribució. Per a cada nivell de significació en l'interval de confiança, la prova Z té un únic valor crític (per exemple, 1,96 per a un 5% bilateral), cosa que la fa més convenient que la prova t de Student, els valors crítics de la qual es defineixen per la mida de la mostra (mitjançant els graus de llibertat corresponents). Tant la prova Z com la prova t de Student tenen similituds, ja que ambdues ajuden a determinar la significació d'un conjunt de dades. Tanmateix, la prova Z s'utilitza rarament a la pràctica perquè la desviació poblacional és difícil de determinar.[1]

Aplicabilitat

[modifica]

A causa del teorema del límit central, moltes estadístiques de prova tenen una distribució aproximadament normal per a mostres grans. Per tant, moltes proves estadístiques es poden realitzar convenientment com a proves Z aproximades si la mida de la mostra és gran o es coneix la variància de la població. Si la variància poblacional és desconeguda (i per tant s'ha d'estimar a partir de la mateixa mostra) i la mida de la mostra no és gran ( n < 30), la prova t de Student pot ser més adequada (en alguns casos, n < 50, com es descriu a continuació).[2]

Procediment

[modifica]

La manera de realitzar una prova Z quan T és una estadística que té una distribució aproximadament normal sota la hipòtesi nul·la és la següent:

Primer, estimeu el valor esperat μ de T sota la hipòtesi nul·la i obteniu una estimació s de la desviació estàndard de T.[3]

En segon lloc, determineu les propietats de T: unicua o bilateral.

Per a la hipòtesi nul·la H0 : μ μ0 vs. la hipòtesi alternativa H1 : μ < μ0, és de cua inferior/esquerra (unicua).

Per a la hipòtesi nul·la H0 : μ μ0 vs. la hipòtesi alternativa H1 : μ > μ0, és de cua superior/dreta (unicua).

Per a la hipòtesi nul·la H0 : μ = μ0 vs. hipòtesi alternativa H1 : μ μ0, és bilateral.

En tercer lloc, calculeu la puntuació estàndard: quins valors p unilaterals i bilaterals es poden calcular com a Φ( Z ) (per a proves de cua inferior/ esquerra ), Φ( − ) (per a proves de cua superior/dreta) i 2Φ( − | Z |) (per a proves bilaterals), on Φ és la funció de distribució acumulativa normal estàndard.[4]

Ús en proves d'ubicació

[modifica]
  1. El terme "prova Z " s'utilitza sovint per referir-se específicament a la prova de localització d'una mostra que compara la mitjana d'un conjunt de mesures amb una constant determinada quan es coneix la variància de la mostra. Per exemple, si les dades observades X 1,... , X n són (i) independents, (ii) tenen una mitjana comuna μ, i (iii) tenen una variància comuna σ 2, aleshores la mitjana mostral X té mitjana μ i variància .
  2. La hipòtesi nul·la és que el valor mitjà de X és un nombre donat μ₀. Podem utilitzar X com a estadística de prova, rebutjant la hipòtesi nul·la si X − μ 0 és gran.
  3. Per calcular l'estadística estandarditzada , necessitem conèixer o tenir un valor aproximat per a σ², a partir del qual puguem calcular . En algunes aplicacions, σ2 és conegut, però això no és habitual.
  4. Si la mida de la mostra és moderada o gran, podem substituir la variància mostral per σ2, donant una prova de complement. La prova resultant no serà una prova Z exacta, ja que no es té en compte la incertesa en la variància de la mostra; tanmateix, serà una bona aproximació tret que la mida de la mostra sigui petita.
  5. Una prova t es pot utilitzar per tenir en compte la incertesa en la variància mostral quan les dades són exactament normals.
  6. Diferència entre la prova Z i la prova t : La prova Z s'utilitza quan la mida de la mostra és gran ( n > 50) o es coneix la variància de la població. La prova t s'utilitza quan la mida de la mostra és petita ( n < 50) i la variància poblacional és desconeguda.
  7. No hi ha cap constant universal en la qual la mida de la mostra es consideri generalment prou gran per justificar l'ús de la prova de complements. Regles generals típiques: la mida de la mostra ha de ser de 50 observacions o més.
  8. Per a mostres grans, el procediment de la prova t dona valors de p gairebé idèntics que el procediment de la prova Z.
  9. Altres proves de localització que es poden realitzar com a proves Z són la prova de localització de dues mostres i la prova de diferències aparellades.[5]

Condicions

[modifica]

Perquè la prova Z sigui aplicable, s'han de complir certes condicions.

  • Els paràmetres de molèstia s'han de conèixer o estimar amb alta precisió (un exemple d'un paràmetre de molèstia seria la desviació estàndard en una prova de localització d'una mostra). Les proves Z se centren en un únic paràmetre i tracten tots els altres paràmetres desconeguts com a fixos en els seus valors reals. A la pràctica, gràcies al teorema de Slutsky, es pot justificar la "connectació" d'estimacions consistents dels paràmetres molestos. Tanmateix, si la mida de la mostra no és prou gran perquè aquestes estimacions siguin raonablement precises, és possible que la prova Z no funcioni bé.
  • L'estadística de prova ha de seguir una distribució normal. Generalment, s'apel·la al teorema del límit central per justificar la suposició que una estadística de prova varia normalment. Hi ha molta recerca estadística sobre la qüestió de quan una estadística de prova varia aproximadament normalment. Si la variació de l'estadístic de prova és fortament no normal, no s'hauria d'utilitzar una prova Z.

Si s'introdueixen estimacions dels paràmetres molestos tal com s'ha comentat anteriorment, és important utilitzar estimacions adequades per a la manera com es van mostrejar les dades. En el cas especial de les proves Z per al problema de localització d'una o dues mostres, la desviació estàndard habitual de la mostra només és adequada si les dades s'han recollit com una mostra independent.

En algunes situacions, és possible dissenyar una prova que tingui en compte adequadament la variació en les estimacions dels paràmetres molestos dels connectors. En el cas de problemes de localització d'una i dues mostres, això es fa amb una prova t.

Exemple

[modifica]

Suposem que en una regió geogràfica concreta, la mitjana i la desviació estàndard de les puntuacions en una prova de lectura són 100 punts i 12 punts, respectivament. El nostre interès rau en les puntuacions de 55 estudiants d'una escola en particular que van obtenir una puntuació mitjana de 96. Podem preguntar-nos si aquesta puntuació mitjana és significativament inferior a la mitjana regional, és a dir, si els estudiants d'aquesta escola són comparables a una mostra aleatòria simple de 55 estudiants de la regió en conjunt o si les seves puntuacions són sorprenentment baixes?

Primer calculeu l'error estàndard de la mitjana:

on és la desviació estàndard de la població.

A continuació, calculeu la puntuació z, que és la distància entre la mitjana de la mostra i la mitjana de la població en unitats de l'error estàndard:

En aquest exemple, tractem la mitjana i la variància de la població com a conegudes, cosa que seria apropiada si tots els estudiants de la regió haguessin estat avaluats. Quan els paràmetres de la població són desconeguts, s'hauria de dur a terme una prova t de Student.

La puntuació mitjana de l'aula és de 96, que són −2,47 unitats d'error estàndard de la mitjana de la població de 100. Si busquem la puntuació z en una taula de la probabilitat acumulativa de la distribució normal estàndard, trobem que la probabilitat d'observar un valor normal estàndard per sota de −2,47 és aproximadament 0,5 − 0,4932 = 0,0068. Aquest és el valor p unilateral per a la hipòtesi nul·la que els 55 estudiants són comparables a una mostra aleatòria simple de la població de tots els examinats. El valor p bilateral és aproximadament 0,014 (el doble del valor p unilateral).

Una altra manera de dir les coses és que amb probabilitat 1 − 0,014 = 0,986, una mostra aleatòria simple de 55 estudiants tindria una puntuació mitjana de la prova dins de 4 unitats de la mitjana de la població. També podríem dir que amb un 98,6% de confiança rebutgem la hipòtesi nul·la que els 55 examinats siguin comparables a una mostra aleatòria simple de la població de examinats.

La prova Z ens indica que els 55 estudiants d'interès tenen una puntuació mitjana inusualment baixa en comparació amb la majoria de mostres aleatòries simples de mida similar de la població de candidats. Una deficiència d'aquesta anàlisi és que no considera si la mida de l'efecte de 4 punts és significativa. Si en comptes d'una aula, consideréssim una subregió que conté 900 estudiants amb una puntuació mitjana de 99, s'observaria gairebé la mateixa puntuació z i valor p. Això demostra que si la mida de la mostra és prou gran, diferències molt petites respecte al valor nul poden ser estadísticament molt significatives. Vegeu les proves d'hipòtesis estadístiques per a una discussió més detallada d'aquest tema.

Ocurrència i aplicacions

[modifica]

Per a l'estimació de màxima probabilitat d'un paràmetre

[modifica]

Les proves de localització són les proves Z més conegudes. Una altra classe de proves Z sorgeix en l'estimació de màxima versemblança dels paràmetres en un model estadístic paramètric. Les estimacions de màxima versemblança són aproximadament normals sota certes condicions, i la seva variància asimptòtica es pot calcular en termes de la informació de Fisher. L'estimació de màxima versemblança dividida pel seu error estàndard es pot utilitzar com a estadística de prova per a la hipòtesi nul·la que el valor poblacional del paràmetre és igual a zero. Més generalment, si és l'estimació de màxima probabilitat d'un paràmetre θ, i θ 0 és el valor de θ sota la hipòtesi nul·la,

es pot utilitzar com a estadística de prova Z.

Quan s'utilitza una prova Z per a estimacions de màxima versemblança, és important tenir en compte que l'aproximació normal pot ser deficient si la mida de la mostra no és prou gran. Tot i que no hi ha cap regla simple i universal que estableixi la mida de la mostra per utilitzar una prova Z, la simulació pot donar una bona idea de si una prova Z és adequada en una situació determinada.

Les proves Z s'utilitzen sempre que es pot argumentar que una estadística de prova segueix una distribució normal sota la hipòtesi nul·la d'interès. Moltes estadístiques de prova no paramètriques, com ara les estadístiques U, són aproximadament normals per a mides de mostra prou grans i, per tant, sovint es realitzen com a proves Z.

Comparació de les proporcions de dos binomis

[modifica]

La prova Z per comparar dues proporcions és un mètode estadístic que s'utilitza per avaluar si la proporció d'una determinada característica difereix significativament entre dues mostres independents. Aquesta prova aprofita la propietat que les proporcions de la mostra (que és la mitjana de les observacions procedents d'una distribució de Bernoulli) són asimptòticament normals sota el teorema del límit central, cosa que permet la construcció d'una prova Z.

L'estadística z per comparar dues proporcions es calcula mitjançant:

On:

  • = proporció de la mostra a la primera mostra
  • = proporció de la mostra a la segona mostra
  • = mida de la primera mostra
  • = mida de la segona mostra
  • = proporció agrupada, calculada com a , on i són el recompte d'èxits en les dues mostres.

L'interval de confiança per a la diferència entre dues proporcions, basat en les definicions anteriors, és:

On:

  • és el valor crític de la distribució normal estàndard (per exemple, 1,96 per a un nivell de confiança del 95%).

L'EDM per quan s'utilitza la fórmula de la prova Z (bilateral) per comparar dues proporcions, incorporant valors crítics per a i , i els errors estàndard de les proporcions:

On:

  •  : Valor crític per al nivell de significació.
  •  : Quantil per a la potència desitjada.
  • Quan se suposa que el nul és correcte.

Referències

[modifica]
  1. «What Is a Z-Test?» (en anglès). [Consulta: 17 maig 2025].
  2. «Numeracy, Maths and Statistics - Academic Skills Kit» (en anglès). [Consulta: 17 maig 2025].
  3. «BRIEF SUMMARY OF Z-TESTS» (en anglès). [Consulta: 17 maig 2025].
  4. «Key Statistics Terms #13: Z-Test» (en anglès). [Consulta: 17 maig 2025].
  5. «What is a Z-test?» (en anglès americà). [Consulta: 17 maig 2025].