Title: Neline
1Nelineární závislosti
- Co delat, když závislost prímkou neproložím
2Jaké mám možnosti
- Transformace - pomuže prakticky jen u monotónních
závislostí - je treba si dát pozor - transformace
prediktoru mení jen tvar, transformace odpovedi i
pravdepodobnostní charakteristiky
3Jaké mám možnosti
- Polynomiální regrese - libovolnou funkci lze
nahradit (v omezeném rozsahu hodnot prediktoru)
polynomem - Užiju, když verím, že reziduály budou náhodne a
rovnomerne rozloženy kolem polynomu - Tradicní názvy kvadratická regrese, kubická
regrese
4Polynomiální regrese
Ya ß1X ß2X2 ß3X3 ßmXm e
Je to vlastne aplikace mnohonásobné lineární
regrese, kde prediktory jsou X, X2, X3 atd.
Pocítá se stejne (tj. opet kriterium nejmenšího
souctu residuálních ctvercu, které má opet
(normálne) jedno minimum). Obdobný význam má i
R2, obdobne se pocítají testy významnosti (tj.
celková ANOVA modelu, a testy pro jednotlivé
cleny polynomu).
Takže opet predpokládám, že e je aditivní,
nezávislé na predikované hodnote (homogenita
variance).
5Se zvyšujícím se stupnem polynomu stoupá
flexibilita
1
2
3
4
5
Pozor! Zvyšující se složitost nemusí znamenat
lepší predikcní schopnost
6Stepwise regression - postupne zesložituji model
7Stepwise regression - postupne zesložituji model
-kvadratická regrese muže být vysoce prukazná, i
když lineární regrese prukazná není
Prukaznost kvadratického clenu mužeme chápat jako
dukaz nelinearity vztahu
8Polynomiální regresi užíváme obvykle, když
- vidíme, že vztah není lineární, ale nemáme žádnou
predstavu, jak by funkcní závislost mela vypadat - Nepamatuji se, že bych videl rozumné použití
polynomu vyššího než tretího stupne
9Jaké mám možnosti
- Mám predstavu (treba z nejaké teorie), jak má
závislost vypadat, a verím, že reziduály budou
náhodne kolem predikované hodnoty, tj model je - Yf(X) e X zde znací vektor, muže se tedy
jednat o více vysvetlujících promenných - Odhadujeme opet metodou nejmenšího souctu ctvercu
10Na rozdíl od metod lineární regrese (vcetne
polynomiální) je nutné hledat minimum metodami
numerické matematiky - nemusí existovat
analytické rešení, ani není jistota, že nalezené
minimum je minimem globálním. Numerický postup
1. Zderivovat podle všech odhadovaných parametru.
2. Položit všechny derivace rovny nule. 3.
Vyrešit soustavu.
Numerické rešení rovnice f(x)0
11Na rozdíl od metod lineární regrese (vcetne
polynomiální) je nutné hledat minimum metodami
numerické matematiky - nemusí existovat
analytické rešení, ani není jistota, že nalezené
minimum je minimem globálním. Numerický postup
1. Zderivovat podle všech odhadovaných parametru.
2. Položit všechny derivace rovny nule. 3.
Vyrešit soustavu.
Numerické rešení rovnice f(x)0 Newtonova metoda
f(x)
x1
x2
x3
x
Muj odhad x
12Nevýhody numerického rešení
- Ne vždy konverguje
- Nekdy najde jen lokální minimum (i tam se
derivace rovnají nule), a nemáme moc možností
overit, jaké to minimum je - Potrebujeme pocátecní odhady hodnot parametru
13Analogie - kulicka padá dolu
14Ruzné lokální regrese - nedostanu funkci, pro
každý kousek platí trochu jiná
15Vím, jaké má asi rozdelení odpoved
- Zobecnené lineární modely
- Jsou schopny odrážet typ rozdelení, (tedy i to,
jakých hodnot muže odpoved nabývat (treba že
pravdepodobnost prežití musí být mezi nulou a
jednickou)
16Typický príklad - logistická regrese