Apresenta - PowerPoint PPT Presentation

1 / 32
About This Presentation
Title:

Apresenta

Description:

atrav s do k- simo valor singular de GE os res duos dessa matriz ... (DVS) Parti o ortogonal O modelo AMMI fornece a propor o da vari ncia ... – PowerPoint PPT presentation

Number of Views:67
Avg rating:3.0/5.0
Slides: 33
Provided by: ProfC8
Category:

less

Transcript and Presenter's Notes

Title: Apresenta


1
VALIDAÇÃO CRUZADA EM ANÁLISE BASEADA EM MODELO DE
EFEITOS PRINCIPAIS ADITIVOS E INTERAÇÃO
MULTIPLICATIVA (AMMI)
Carlos Tadeu dos Santos Dias
Escola Superior de Agricultura Luiz de Queiroz
/ ESALQ / USP
Departamento de Ciências Exatas
2
(No Transcript)
3
Interação Genótipo/Ambiente (GxE)
Adaptação específica de genótipos em ambientes
Métodos estatísticos tradicionais
-Análise conjunta de ensaios multiambientes
-Regressão linear simples e múltipla (Eberhart
Russel, 1966) Não é informativa se a
linearidade falha
Métodos multivariados
-PCA (Análise de Componentes Principais)
-Análise de Agrupamento
-AMMI
4
AMMI ? ANOVA e PCA
Modela efeitos principais e interação de uma
forma sequencial
  • Efeitos principais

? são estimados usando mínimos quadrados
  • PCA
  • É conduzida via decomposição em valores
    singulares
  • (DVS) aplicado á matriz residual de
    interação.

Incorpora componentes aditivos e multiplicativos
em uma análise de mínimos quadrados
integrada e poderosa
5
Problema Geral
Número de componentes multiplicativos a ser
retido no modelo (com o objetivo de
adequadamente explicar o padrão na interação)
Propostas Mandel (1961, 1969, 1971), Gollob
(1968), Gauch Zobel (1988), Cornelius (1993),
Piepho (1994 and 1995). Fisher e Mackenzie
(1923).Todas consideram a proporção de variância
acumulada pelos componentes.
Validação-Cruzada como uma metodologia
preditiva.
Problema Específico
Otimizar o processo de validação cruzada
6
Sumário do modelo AMMI
Sumário da metodologia disponível para
selecionar o número de componentes
multiplicativos no modelo
Descrever dois métodos baseados no
procedimento leave-one-out que otimiza o processo
de validação cruzada
7
Supor n genótipos em p ambientes com r
repetições. A média de cada combinação
modelada por
8
Estimativas
? De uma ANOVA da matriz nYp
Os resíduos dessa matriz constituem a matriz de
interação
termos da interação multiplicativa
? DVS da matriz nGEp
9
através do k-ésimo valor singular de GE
é um resíduo adicional.

10
Correspondência entre DVS e PCA
raiz quadrada do k-ésimo maior autovalor da
matriz (GE) (GE) ou (GE)(GE)
11
fornece a proporção da variância devido a
interação GxE no k- ésimo componente.
representam pesos para o genótipo i e ambiente j
naquele componente da interação, respectivamente.
devido GE ser por construção uma matriz de
desvios centrada na média e com média nula.
12
(No Transcript)
13
(No Transcript)
14
Em geral, ao melhorista de plantas interessa
predizer o comportamento de um genótipo.
Critérios de avaliação
POS-DICTIVO x Modelo PREDITIVO
(Ajustado-via teste F)
(Predições)
Para fazer Predições Métodos que são
essencialmente data-based e livres de
distribuições teóricas terão maior generalidades
15
Tais métodos envolvem reamostragem de um
determinado conjunto de dados, usando técnicas
tais como jacknife, bootstrap e validação
cruzada (Avaliação preditiva)
y111 y112 y11r y121
y12r etc.
(i) Dados para o ajuste do AMMI
Aleatoriamente dividida em dois subgrupos
(ii) Dados para validação
16
As respostas são preditas para uma família de
modelos AMMI (?s m) e esses são comparados com
os respectivos dados de validação, calculando as
diferenças entre esses valores.
Assumimos que
dados padrão ruído
dados1 padrão ruído1
dados2 padrão ruído2
17
Para o que segue, queremos predizer o elemento
xij da matriz X por meio do modelo
18
Krzanowski (1982)
- O algoritmo para validação cruzada
Agora considere o preditor
Note é feito o máximo uso dos outros elementos
de X.
19
Gabriel (2002)
- Toma uma mistura de regressão e aproximação de
uma matriz de posto-inferior como base para
predição.
- O algoritmo para validação cruzada
  1. Para uma matriz X (n x p), use a partição

e aproxime a submatriz
obtenha o resíduo da validação cruzada,
Então prediga x11 por
20
(3) Esses resíduos e valores ajustados podem ser
resumidos por PRESS(m)/np e
21
Com cada método, a escolha de m pode ser baseada
em uma apropriada função de PRESS(m)/np.
22
Krzanowski sugere o uso da estatística
Dm número de GL required para ajustar o m-ésimo
componente. Dmnp-2m
Dr número de GL restante após ajustar o m-ésimo
componente. D1(n-1)p,
DrDr-1-(np-(m-1)2), r2,3,,(n-1).
Wm representa o incremento na informação
preditiva fornecida pelo m-ésimo componente,
dividido pela informação preditiva média em cada
um dos componentes restantes.
23
Tabela 1- Dados de vinte amostras solo e cinco
variáveis (Kendall, 1980, p.20, baseado em
Krzanowski, 1988).
24
Tabela 2 - Dados de quarenta afídeos e dezenove
variáveis (Jeffers, 1967, baseado em Krzanowski,
1987).
25
Tabela 3 - Análise de efeitos principais aditivos
e interação multiplicativa dos dados de
Hernández e Crossa (2000), para a análise dos
cinco primeiros componentes principal de
interação (IPCA).
26
Tabela 4- Dados (produção média de grãos) de um
ensaio de variedades de trigo oito genótipos
testados durante seis anos (1990-1995).
27
Tabela 5- Análise de validação cruzada e métodos
leave- one-out para os dados Hernandéz e Crossa
(2000).
28
Teste F distribucional indicou dois componentes
Validação cruzada por aleatorização três
componentes
Leave-one-out um componente
Como avaliar estas diferenças?
29
Métodos baseados no teste F dependem pesadamente
das suposições distribucional (normalidade dos
dados e validade das distribuições F para os
quadrados médio) o que pode não ser apropriado
em muitos casos.
O teste F pode apresentar recomendações
conflitantes para um particular conjunto de
dados.
O teste F seleciona muitos componentes de
interação.
30
  • Parece que um método de validação cruzada baseado
  • em dados deve ser mais apropriado.

Validação cruzada por aleatorização tem uma
grande parte dos dados que fica fora do conjunto
de validação.
? Métodos Leave-one-out faz o mais eficiente
uso dos dados e resulta em modelos mais
parsimoniosos (AMMI 1)
31
  • CORNELIUS, P.L. 1993. Statistical tests and
    retention of terms in the additive main effects
    and multiplicative interaction model for cultivar
    trials. Crop Sci. 3311861193
  • EBERHART, S.A. RUSSELL, W.A. Stability
    parameters for comparing varieties. Crop
    Science,v.6, n.1, p.36-40, 1966
  • FISHER, R.A. and MACKENZIE,W.A. (1923). The
    manurial response of different potato varieties.
    Journal of Agricultural Science, xiii. 311-320
  • GAUCH JUNIOR, H.G. ZOBEL, R.W. Predictive ans
    postdictive sucess of statistical analysis of
    yield trials. Theoretical and Applied Genetics,
    New York, v.76, p.1-10, 1988
  • MANDEL, J. Non-additivity in two-way analysis of
    variance. Journal of the American Statistical
    Association, v.56, p.878-888, 1961
  • MANDEL, J. The partitioning of interactions in
    analysis of variance. Journal of Research of the
    National Bureau of Standards , Series B,
    Washington, v.73, p.309-328, 1969
  • MANDEL, J. A new analysis of variance model for
    non-adittive data. Technometrics, Alexandria,
  • v.13, n.1, p.1-18, 1971

32
  • PIEPHO, H.P. 1994. Best linear unbiased
    prediction (BLUP) for regional yield trials a
    comparison to additive main effects and
    multiplicative interaction (AMMI) analysis.
    Theor. Appl. Genet. 89647654
  • PIEPHO, H.P. 1995. Robustness of statistical test
    for multiplicativeterms in additive main effects
    and multiplicativeinteraction model for cultivar
    trial. Theor. Appl. Genet. 90438443
Write a Comment
User Comments (0)
About PowerShow.com