Title: Apresenta
1VALIDAÇÃO CRUZADA EM ANÁLISE BASEADA EM MODELO DE
EFEITOS PRINCIPAIS ADITIVOS E INTERAÇÃO
MULTIPLICATIVA (AMMI)
Carlos Tadeu dos Santos Dias
Escola Superior de Agricultura Luiz de Queiroz
/ ESALQ / USP
Departamento de Ciências Exatas
2(No Transcript)
3Interação Genótipo/Ambiente (GxE)
Adaptação específica de genótipos em ambientes
Métodos estatísticos tradicionais
-Análise conjunta de ensaios multiambientes
-Regressão linear simples e múltipla (Eberhart
Russel, 1966) Não é informativa se a
linearidade falha
Métodos multivariados
-PCA (Análise de Componentes Principais)
-Análise de Agrupamento
-AMMI
4AMMI ? ANOVA e PCA
Modela efeitos principais e interação de uma
forma sequencial
? são estimados usando mínimos quadrados
- É conduzida via decomposição em valores
singulares - (DVS) aplicado á matriz residual de
interação.
Incorpora componentes aditivos e multiplicativos
em uma análise de mínimos quadrados
integrada e poderosa
5Problema Geral
Número de componentes multiplicativos a ser
retido no modelo (com o objetivo de
adequadamente explicar o padrão na interação)
Propostas Mandel (1961, 1969, 1971), Gollob
(1968), Gauch Zobel (1988), Cornelius (1993),
Piepho (1994 and 1995). Fisher e Mackenzie
(1923).Todas consideram a proporção de variância
acumulada pelos componentes.
Validação-Cruzada como uma metodologia
preditiva.
Problema Específico
Otimizar o processo de validação cruzada
6Sumário do modelo AMMI
Sumário da metodologia disponível para
selecionar o número de componentes
multiplicativos no modelo
Descrever dois métodos baseados no
procedimento leave-one-out que otimiza o processo
de validação cruzada
7Supor n genótipos em p ambientes com r
repetições. A média de cada combinação
modelada por
8Estimativas
? De uma ANOVA da matriz nYp
Os resíduos dessa matriz constituem a matriz de
interação
termos da interação multiplicativa
? DVS da matriz nGEp
9através do k-ésimo valor singular de GE
é um resíduo adicional.
10Correspondência entre DVS e PCA
raiz quadrada do k-ésimo maior autovalor da
matriz (GE) (GE) ou (GE)(GE)
11fornece a proporção da variância devido a
interação GxE no k- ésimo componente.
representam pesos para o genótipo i e ambiente j
naquele componente da interação, respectivamente.
devido GE ser por construção uma matriz de
desvios centrada na média e com média nula.
12(No Transcript)
13(No Transcript)
14Em geral, ao melhorista de plantas interessa
predizer o comportamento de um genótipo.
Critérios de avaliação
POS-DICTIVO x Modelo PREDITIVO
(Ajustado-via teste F)
(Predições)
Para fazer Predições Métodos que são
essencialmente data-based e livres de
distribuições teóricas terão maior generalidades
15Tais métodos envolvem reamostragem de um
determinado conjunto de dados, usando técnicas
tais como jacknife, bootstrap e validação
cruzada (Avaliação preditiva)
y111 y112 y11r y121
y12r etc.
(i) Dados para o ajuste do AMMI
Aleatoriamente dividida em dois subgrupos
(ii) Dados para validação
16As respostas são preditas para uma família de
modelos AMMI (?s m) e esses são comparados com
os respectivos dados de validação, calculando as
diferenças entre esses valores.
Assumimos que
dados padrão ruído
dados1 padrão ruído1
dados2 padrão ruído2
17Para o que segue, queremos predizer o elemento
xij da matriz X por meio do modelo
18Krzanowski (1982)
- O algoritmo para validação cruzada
Agora considere o preditor
Note é feito o máximo uso dos outros elementos
de X.
19Gabriel (2002)
- Toma uma mistura de regressão e aproximação de
uma matriz de posto-inferior como base para
predição.
- O algoritmo para validação cruzada
- Para uma matriz X (n x p), use a partição
e aproxime a submatriz
obtenha o resíduo da validação cruzada,
Então prediga x11 por
20(3) Esses resíduos e valores ajustados podem ser
resumidos por PRESS(m)/np e
21Com cada método, a escolha de m pode ser baseada
em uma apropriada função de PRESS(m)/np.
22Krzanowski sugere o uso da estatística
Dm número de GL required para ajustar o m-ésimo
componente. Dmnp-2m
Dr número de GL restante após ajustar o m-ésimo
componente. D1(n-1)p,
DrDr-1-(np-(m-1)2), r2,3,,(n-1).
Wm representa o incremento na informação
preditiva fornecida pelo m-ésimo componente,
dividido pela informação preditiva média em cada
um dos componentes restantes.
23Tabela 1- Dados de vinte amostras solo e cinco
variáveis (Kendall, 1980, p.20, baseado em
Krzanowski, 1988).
24Tabela 2 - Dados de quarenta afídeos e dezenove
variáveis (Jeffers, 1967, baseado em Krzanowski,
1987).
25Tabela 3 - Análise de efeitos principais aditivos
e interação multiplicativa dos dados de
Hernández e Crossa (2000), para a análise dos
cinco primeiros componentes principal de
interação (IPCA).
26Tabela 4- Dados (produção média de grãos) de um
ensaio de variedades de trigo oito genótipos
testados durante seis anos (1990-1995).
27Tabela 5- Análise de validação cruzada e métodos
leave- one-out para os dados Hernandéz e Crossa
(2000).
28Teste F distribucional indicou dois componentes
Validação cruzada por aleatorização três
componentes
Leave-one-out um componente
Como avaliar estas diferenças?
29Métodos baseados no teste F dependem pesadamente
das suposições distribucional (normalidade dos
dados e validade das distribuições F para os
quadrados médio) o que pode não ser apropriado
em muitos casos.
O teste F pode apresentar recomendações
conflitantes para um particular conjunto de
dados.
O teste F seleciona muitos componentes de
interação.
30- Parece que um método de validação cruzada baseado
- em dados deve ser mais apropriado.
Validação cruzada por aleatorização tem uma
grande parte dos dados que fica fora do conjunto
de validação.
? Métodos Leave-one-out faz o mais eficiente
uso dos dados e resulta em modelos mais
parsimoniosos (AMMI 1)
31- CORNELIUS, P.L. 1993. Statistical tests and
retention of terms in the additive main effects
and multiplicative interaction model for cultivar
trials. Crop Sci. 3311861193 - EBERHART, S.A. RUSSELL, W.A. Stability
parameters for comparing varieties. Crop
Science,v.6, n.1, p.36-40, 1966 - FISHER, R.A. and MACKENZIE,W.A. (1923). The
manurial response of different potato varieties.
Journal of Agricultural Science, xiii. 311-320 - GAUCH JUNIOR, H.G. ZOBEL, R.W. Predictive ans
postdictive sucess of statistical analysis of
yield trials. Theoretical and Applied Genetics,
New York, v.76, p.1-10, 1988 - MANDEL, J. Non-additivity in two-way analysis of
variance. Journal of the American Statistical
Association, v.56, p.878-888, 1961 - MANDEL, J. The partitioning of interactions in
analysis of variance. Journal of Research of the
National Bureau of Standards , Series B,
Washington, v.73, p.309-328, 1969 - MANDEL, J. A new analysis of variance model for
non-adittive data. Technometrics, Alexandria, - v.13, n.1, p.1-18, 1971
32- PIEPHO, H.P. 1994. Best linear unbiased
prediction (BLUP) for regional yield trials a
comparison to additive main effects and
multiplicative interaction (AMMI) analysis.
Theor. Appl. Genet. 89647654 - PIEPHO, H.P. 1995. Robustness of statistical test
for multiplicativeterms in additive main effects
and multiplicativeinteraction model for cultivar
trial. Theor. Appl. Genet. 90438443