Na prática de processamento de resultados de observação, a distribuição da população geral é desconhecida ou (para variáveis aleatórias contínuas) difere da distribuição normal, de modo que o uso de métodos estatísticos clássicos não é razoável e pode levar a erros. Neste caso, são utilizados métodos independentes (ou livres) da distribuição da população em geral - métodos não paramétricos.
O artigo discute de um ponto de vista unificado três testes de amostra única que são frequentemente encontrados na prática: o teste de sinal, o teste t e o teste de Wilcoxon de posto sinalizado, um procedimento não paramétrico cujo poder é comparável ao poder do teste t no caso de uma amostra normalmente distribuída e excede o poder do teste t se a distribuição da amostra tiver "caudas mais pesadas" em comparação com a distribuição normal.
1. Defina um modelo para o modelo de localização como segue. Let - denotar uma amostra aleatória obtida de acordo com a seguinte lei
onde se assume que os erros aleatórios são variáveis aleatórias independentes e igualmente distribuídas com uma densidade de distribuição contínua
simétrica em torno de zero.
2 . Sob a condição de simetria, qualquer parâmetro de posição , incluindo a média e a mediana, é igual a
. Considere a hipótese
3. Para testar essa hipótese, considere três testes que são frequentemente usados na prática: o teste do sinal, o teste t e o teste de Wilcoxon.
3.1. O teste de sinais clássicos ( teste de sinais) é baseado em estatísticas
para onde ,
respectivamente. Deixe ser
. ,
( , ,
).
,
.
–
p-value
,
–
(R
pbinom
cdf ).
,
()
.
3.2. t- (t-test) .
,
. t- t-
, . ,
t-
.
. p-value t-
,
– t- c
(R
pt
cdf t-). p-value , .
3.3. t- , t- .
(signed-rank Wilcoxon test) , .
, .
t-, ,
.
. ,
,
,
p-value ,
–
(R
psignrank
cdf ).
4. . : , t- . .
4.1. ,
,
–
- ,
–
.
. , -
.
4.2. , t-
.
,
–
t-
.
.
4.3. , - (Hodges-Lehmann)
,
(Walsh averages) .
.
,
–
signed-rank Wilcoxon .
. ,
–
. , , ,
.
5. ( ) A B . , ?
, A B. . R t-
> Store_A <- c(82, 69, 73, 43, 58, 56, 76, 65)
> Store_B <- c(63, 42, 74, 37, 51, 43, 80, 62)
> response <- Store_A - Store_B
> wilcox.test(response, alternative = "greater", conf.int = TRUE)
Wilcoxon signed rank exact test
data: response
V = 32, p-value = 0.02734
alternative hypothesis: true location is greater than 0
95 percent confidence interval:
1 Inf
sample estimates:
(pseudo)median
7.75
> t.test(response, alternative = "greater", conf.int = TRUE)
One Sample t-test
data: response
t = 2.3791, df = 7, p-value = 0.02447
alternative hypothesis: true mean is greater than 0
95 percent confidence interval:
1.781971 Inf
sample estimates:
mean of x
8.75
wilcox.test()
, p-value , -
. -
t.test()
. , , , A .
, . , t- t- « » .