Teste de Wilcoxon: um ponto ideal para os praticantes

Na prática de processamento de resultados de observação, a distribuição da população geral é desconhecida ou (para variáveis ​​aleatórias contínuas) difere da distribuição normal, de modo que o uso de métodos estatísticos clássicos não é razoável e pode levar a erros. Neste caso, são utilizados métodos independentes (ou livres) da distribuição da população em geral - métodos não paramétricos.





O artigo discute de um ponto de vista unificado três testes de amostra única que são frequentemente encontrados na prática: o teste de sinal, o teste t e o teste de Wilcoxon de posto sinalizado, um procedimento não paramétrico cujo poder é comparável ao poder do teste t no caso de uma amostra normalmente distribuída e excede o poder do teste t se a distribuição da amostra tiver "caudas mais pesadas" em comparação com a distribuição normal.





1. Defina um modelo para o modelo de localização como segue. Let X_1, X_2, \ ldots, X_n- denotar uma amostra aleatória obtida de acordo com a seguinte lei





X_i = \ theta + e_i,

onde se assume que os erros aleatórios e_1, e_2, \ ldots, e_nsão variáveis ​​aleatórias independentes e igualmente distribuídas com uma densidade de distribuição contínua f (t)simétrica em torno de zero.





2 . Sob a condição de simetria, qualquer parâmetro de posição XI, incluindo a média e a mediana, é igual a \ theta. Considere a hipótese





H_0: \ theta = 0, ~~~ H_a: \ theta> 0.

3. Para testar essa hipótese, considere três testes que são frequentemente usados ​​na prática: o teste do sinal, o teste t e o teste de Wilcoxon.





3.1. O teste de sinais clássicos ( teste de sinais) é baseado em estatísticas





S = \ sum_ {i = 1} ^ nsign (X_i),

sinal (t) = - 1,0,1para onde , t <0, t = 0, t> 0respectivamente. Deixe ser





S ^ + = \ #_ i \ {X_i> 0 \}.

S = 2S ^ + - n. , XI ( , , n). H_0, S ^ + n 1/2. s ^ +S ^ + p-value P_ {H_0} (S ^ + \ geq s ^ +) = 1-F_B (s ^ + - 1; n; 0,5), F_B (t; n; p)n p(R pbinom



cdf ).





, S H_0 () f (t).





3.2. t- (t-test) .





T = \ sum_ {i = 1} ^ nsinal (X_i) \ cdot | X_i |.

, T f (t). t- t-





t = \ frac {\ bar {X}} {s / \ sqrt {n}},

\ bar {X} s, . , t t- n-1 . t_0 t. p-value t- P_ {H_0} (t \ geq t_0) = 1-F_T (t_0; n-1), F_T (t; \ nu)– t- c \ nu (R pt



cdf t-). p-value , .





3.3. t- , t- .





(signed-rank Wilcoxon test) , . R | X_i | XI | X_1 |, \ ldots, | X_n |, .





W = \ sum_ {i = 1} ^ nsinal (X_i) \ cdot R | X_i |.

t-, C, S H_0 f (t).





C . , C, W ^ +,





W ^ + = \ sum_ {X_i> 0} R | X_i | = \ frac {1} {2} W + \ frac {n (n + 1)} {4}.

p-value P_ {H_0} (W ^ + \ geq w ^ +) = 1-F_ {W ^ +} (w ^ + - 1; n), F_ {W ^ +} (x; n)n(R psignrank



cdf W ^ +).





4. . : , t- \ theta. .





4.1. \ theta,





\ hat {\ theta} = med \ {X_1, X_2, \ ldots, X_n \}.

0 <\ alpha <1 \ theta (1- \ alpha) 100 \% \ left (X _ {(c_1 + 1)}, X _ {(n-c_1)} \ right), XI)}eu- , c_1\ alpha / 2 n p = 1/2. e_i. , - n \ alpha.





4.2. \ theta, t- \ bar {X}. \ bar {X} \ pm t _ {\ alpha / 2, n-1} \ cdot [s / \ sqrt {n}], t _ {\ alpha / 2, n-1}\ alpha / 2 t- n-1 . e_i.





4.3. \ theta, - (Hodges-Lehmann)





\ hat {\ theta} _W = med_ {i \ leq j} \ left \ {\ frac {X_i + X_j} {2} \ right \}.

A_ {ij} = (X_i + X_j) / 2, i \ leq j (Walsh averages) . A _ {(1)} <\ cdots <A _ {(n (n + 1) / 2)} . (1- \ alpha) 100 \% \ theta \ left (A _ {(c_2 + 1)}, A _ {(n (n + 1) / 2-c2)} \ right), c_2\ alpha / 2 signed-rank Wilcoxon . e_i . , W ^ +\ left \ {0,1, ..., n (n + 1) / 2 \ right \} n ^ 2. , , , \ alpha .





5. ( ) A B . , ?





, A B. \ theta . R t- H_0: \ theta = 0, H_a: \ theta> 0.





> Store_A <- c(82, 69, 73, 43, 58, 56, 76, 65)
> Store_B <- c(63, 42, 74, 37, 51, 43, 80, 62)
> response <- Store_A - Store_B

> wilcox.test(response, alternative = "greater", conf.int = TRUE)

	Wilcoxon signed rank exact test

data:  response
V = 32, p-value = 0.02734
alternative hypothesis: true location is greater than 0
95 percent confidence interval:
   1 Inf
sample estimates:
(pseudo)median 
          7.75 

> t.test(response, alternative = "greater", conf.int = TRUE)

	One Sample t-test

data:  response
t = 2.3791, df = 7, p-value = 0.02447
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
 1.781971      Inf
sample estimates:
mean of x 
     8.75 
      
      



wilcox.test()



W ^ +, p-value , - \ theta 95 \% \ theta. - t.test()



. , 0,05, , A .





, . , t- t- « » .








All Articles