👩🏽‍🌾 👩🏽‍🤝‍👨🏿 👨🏽‍⚖️ Teste de Wilcoxon: um ponto ideal para os praticantes 🧜🏼 🍮 ⚾️

Na prática de processamento de resultados de observação, a distribuição da população geral é desconhecida ou (para variáveis aleatórias contínuas) difere da distribuição normal, de modo que o uso de métodos estatísticos clássicos não é razoável e pode levar a erros. Neste caso, são utilizados métodos independentes (ou livres) da distribuição da população em geral - métodos não paramétricos.

O artigo discute de um ponto de vista unificado três testes de amostra única que são frequentemente encontrados na prática: o teste de sinal, o teste t e o teste de Wilcoxon de posto sinalizado, um procedimento não paramétrico cujo poder é comparável ao poder do teste t no caso de uma amostra normalmente distribuída e excede o poder do teste t se a distribuição da amostra tiver "caudas mais pesadas" em comparação com a distribuição normal.

1. Defina um modelo para o modelo de localização como segue. Let $X_1, X_2, \ ldots, X_n$ - denotar uma amostra aleatória obtida de acordo com a seguinte lei

$X_i = \ theta + e_i,$

onde se assume que os erros aleatórios $e_1, e_2, \ ldots, e_n$ são variáveis aleatórias independentes e igualmente distribuídas com uma densidade de distribuição contínua f (t) simétrica em torno de zero.

2 . Sob a condição de simetria, qualquer parâmetro de posição , incluindo a média e a mediana, é igual a $\ theta$ . Considere a hipótese

$H_0: \ theta = 0, ~~~ H_a: \ theta> 0.$

3. Para testar essa hipótese, considere três testes que são frequentemente usados na prática: o teste do sinal, o teste t e o teste de Wilcoxon.

3.1. O teste de sinais clássicos ( teste de sinais) é baseado em estatísticas

$S = \ sum_ {i = 1} ^ nsign (X_i),$

sinal (t) = - 1,0,1 para onde , t <0, t = 0, t> 0 respectivamente. Deixe ser

$S ^ + = \ #_ i \ {X_i> 0 \}.$

S = 2S ^ + - n . , ( , , ). H_0 , S ^ + 1/2 . s ^ + – S ^ + p-value $P_ {H_0} (S ^ + \ geq s ^ +) = 1-F_B (s ^ + - 1; n; 0,5)$ , F_B (t; n; p) – (R pbinom

cdf ).

, H_0 () f (t) .

3.2. t- (t-test) .

$T = \ sum_ {i = 1} ^ nsinal (X_i) \ cdot | X_i |.$

, f (t) . t- t-

$t = \ frac {\ bar {X}} {s / \ sqrt {n}},$

$\ bar {X}$ , . , t- n-1 . t_0 . p-value t- $P_ {H_0} (t \ geq t_0) = 1-F_T (t_0; n-1)$ , $F_T (t; \ nu)$ – t- c $\ nu$ (R pt

cdf t-). p-value , .

3.3. t- , t- .

(signed-rank Wilcoxon test) , . R | X_i | $| X_1 |, \ ldots, | X_n |$ , .

$W = \ sum_ {i = 1} ^ nsinal (X_i) \ cdot R | X_i |.$

t-, , H_0 f (t) .

. , , W ^ + ,

$W ^ + = \ sum_ {X_i> 0} R | X_i | = \ frac {1} {2} W + \ frac {n (n + 1)} {4}.$

p-value $P_ {H_0} (W ^ + \ geq w ^ +) = 1-F_ {W ^ +} (w ^ + - 1; n)$ , $F_ {W ^ +} (x; n)$ – (R psignrank

cdf W ^ + ).

4. . : , t- $\ theta$ . .

4.1. $\ theta$ ,

$\ hat {\ theta} = med \ {X_1, X_2, \ ldots, X_n \}.$

$0 <\ alpha <1$ $\ theta$ $(1- \ alpha) 100 \%$ $\ left (X _ {(c_1 + 1)}, X _ {(n-c_1)} \ right)$ , XI)} – - , c_1 – $\ alpha / 2$ p = 1/2 . e_i . , - $\ alpha$ .

4.2. $\ theta$ , t- $\ bar {X}$ . $\ bar {X} \ pm t _ {\ alpha / 2, n-1} \ cdot [s / \ sqrt {n}]$ , $t _ {\ alpha / 2, n-1}$ – $\ alpha / 2$ t- n-1 . e_i .

4.3. $\ theta$ , - (Hodges-Lehmann)

$\ hat {\ theta} _W = med_ {i \ leq j} \ left \ {\ frac {X_i + X_j} {2} \ right \}.$

$A_ {ij} = (X_i + X_j) / 2$ , $i \ leq j$ (Walsh averages) . $A _ {(1)} <\ cdots <A _ {(n (n + 1) / 2)}$ . $(1- \ alpha) 100 \%$ $\ theta$ $\ left (A _ {(c_2 + 1)}, A _ {(n (n + 1) / 2-c2)} \ right)$ , c_2 – $\ alpha / 2$ signed-rank Wilcoxon . e_i . , W ^ + – $\ left \ {0,1, ..., n (n + 1) / 2 \ right \}$ n ^ 2 . , , , $\ alpha$ .

5. ( ) A B . , ?

, A B. $\ theta$ . R t- $H_0: \ theta = 0, H_a: \ theta> 0.$

> Store_A <- c(82, 69, 73, 43, 58, 56, 76, 65)
> Store_B <- c(63, 42, 74, 37, 51, 43, 80, 62)
> response <- Store_A - Store_B

> wilcox.test(response, alternative = "greater", conf.int = TRUE)

	Wilcoxon signed rank exact test

data:  response
V = 32, p-value = 0.02734
alternative hypothesis: true location is greater than 0
95 percent confidence interval:
   1 Inf
sample estimates:
(pseudo)median 
          7.75 

> t.test(response, alternative = "greater", conf.int = TRUE)

	One Sample t-test

data:  response
t = 2.3791, df = 7, p-value = 0.02447
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 1.781971      Inf
sample estimates:
mean of x 
     8.75

wilcox.test()

W ^ + , p-value , - $\ theta$ $95 \%$ $\ theta$ . - t.test()

. , 0,05 , , A .

, . , t- t- « » .

Teste de Wilcoxon: um ponto ideal para os praticantes

More articles: