Title: Slo
1Složitejší (mnohorozmerné) metody
- strucný nástin možností vybraných metod
2Path analysis
- presný ceský preklad by byl neco jako analýza
cesticek - Viz též SEM (Structural Equation Modelling treba
ve programu Statistica je to o neco širší
pojem), prípadne causal modelling
3Klasická (mnohonásobná) regrese
- Mnoho prediktoru, jedna odpoved
- Ve skutecnosti - dlouhé kauzální retezce - v
prírode mnohá promenná je ovlivnovaná, a zároven
ovlivnuje - vede ke kauzálním sítím
4Napríklad typický hydrobiologický model
Dravé ryby
Ostatní náhodné vlivy (prípadne tady muže být
teplota, chemie vody etc.
Planktonožravé ryby
Zooplankton
Fytoplankton
5Príklad ze skript
6Mluvíme sice o kauzálním modelování
- Ale kauzalita je vnesena našimi predstavami o
systému, nikoliv experimentální manipulací - Prístupy použití se liší, podle toho jak moc
dovolíme, aby náš iniciální model o kauzálních
závislstech byl korigován na základe dat
7Metoda je užitecná predevším tam,
- kde nemužeme (alespon nekteré) promenné menit
experimentálne - Oblíbená v evolucní biologii
- Ale i v ekologii (zvlášt na úrovni ekosystému a
spolecenstev ve vetších prostorových škálách) - Pozor pri interpretaci kauzality
8Popsáno srozumitelne pro biology
- Bill Shipley 2004 Cause and Correlation in
Biology A User's Guide to Path Analysis,
Structural Equations and Causal Inference.
Cambridge University Press. - James B. Grace 2006 Structural Equation Modeling
and Natural Systems. Cambridge University Press.
9(Hierarchické) klasifikace
- Deláme stromecky (ale nejen je)
10Cíl klasifikace
- Vytvorit skupiny objektu, které jsou vnitrne
homogenní, ale odlišné od ostatních
11Typická data (matice)
Snímek císlo
12Mohu klasifikovat
- snímky, podle podobnosti druhového složení
(dostanu skupiny podobných snímku - pak jim treba
mužu nejak ríkat Seslerietum) - druhy, podle vzájemné podobnosti (korelace)
rozšírení (dostanu skupiny druhu s podobnými
ekologickými nároky)
13Typická data
Chci získat skupiny podobných individuí - pozor,
data jsou na ruzných stupnicích
14Klasifikace
- Numerická taxonomie, numerická fenetika,
kladistické metody - Numerické taxonomie (dríve predevším fenetika),
dnes podstatne širší pojetí - Kladistika - fylogenetika - konstrukce
fylogenetických stromu - dnes prakticky
samostatné odvetví
15Klasifikace
- S ucením vs. bez ucení
- Hierarchické vs. nehierarchické
- Hierarchické - divisivní vs. algomerativní
16Shluková analýza
- Hierarchická, aglomerativní metoda, výsledkem
strom - Princip - nejprve spoctu matici podobností mezi
všemi páry, pak konstruuju strom
17Prži shlukové analýze pamatuj
- Je zásadním zpusobem ovlivnena tím, jakou mám
míru podobnosti mezi objekty (tzv.
(dis)similarity measure, príp. resemblance
function). Pokud mám data merená na ruzných
škálách, musím standardizovat. Míry bývají casto
specifické pro ruzná odvetví
18Pri shlukové analýze pamatuj
- Velmi duležitý je i shlukovací algoritmus
- Predvolby (default) v programu Statistica jsou v
drtivé vetšine nevhodné pro biologické úcely - je
treba je príslušne zmenit
19Shluková analýza mi udelá skupiny vždy
- ale já je nechci, chci vizualizovat podobnostní
strukturu ve složení spolecenstev
20Ordinace chci dostat(pro složení spolecenstev)
odrinacní diagram, kde podobné snímky budou
blízko sebe, podobné druhy budou blízko sebe, a
druhy budou mít optima v blízkosti snímku, kde se
vyskytují
21Ordinacní diagram
Urtica
Chenopodium
Cactus
Nymphea
Menyanthes
Comarum
Aira
Drosera
Blízkost znací podobnost
22Ordinacní diagram
Nutrients
Urtica
Chenopodium
Cactus
Nymphea
Menyanthes
Water
Comarum
Aira
Drosera
Mužu mít i vysvetlující promenné - bud je
promítám ex post, nebo tzv. constrained
ordinations.
23Ruzné metody
- Correspondence analysis, Principal component
analysis, factor analysis - Oblíbené v ekologii, ale i v taxonomii (ukáže,
zda jsou mezi druhy prechody), a také v
psychologii
24Constrained ordinations i pro hodnocení pokusu
25Diskriminacní analýza
- Príklad Mám diploida a tetraploida - ale nemužu
pokaždé pocítat chromozomy - ptám se - jsem
schopen najít pravidlo na základe merených
morfologických znaku (jako jejich lineární
kombinaci), které mi dve ploidie od sebe odliší?
26(No Transcript)
27Pri aplikaci
- pozor na dukaz kruhem (expert mi urcil dva druhy
hlavne na základe délky prašníku, ale to já
nevím a já pak dokážu, že dva dané druhy
existují, a perfektne se odlišují délkou
prašníku).
28Jiná úspešná aplikace ve Škodovce (MB, už dávno)
- V rámci povinných prohlídek sledovali
zamestnance, a meli data o tlaku, cholesterolu,
zda kourí, váhu, výšku etc. - a zda do 10-ti let od prohlídky dostal ci
nedostal infarkt. - Získali kombinaci znaku, která predikuje -
chlapce, dej si pozor, speješ k infarktu.
29Podobnou vec udelají i klasifikacní stromy
- Založeny na jiném principu (není zde aditivita
efektu)
30Co užitecného jsme neprobrali v celé
Biostatistice (neúplný výber)
- Power analysis (jakou mám šanci zamítnout H0)
- Složitejší modely ANOVA (a obecne GLM)
- Zobecnené lineární modely
- Prakticky nic z metod mnohorozmerných
- Bayesovskou statistiku
31Kde se mužu o statistických metodách dozvedet více
- Moderní regresní metody (Šmilauer)
- Vizualizace dat (Šmilauer)
- Plánování a hodnocení ekologických experimentu
(Lepš Šmilauer) - Praktikum mnohorozmerných metod (Lepš Šmilauer)