Title: Nincs diac
1A két vagy több független változó elemzéséhez
használható különbözo módszerek (Dawson, Trapp,
2001)
2A többszörös elemzés a klinikai orvostudományban,
egy példa
Volpato, S et al Cardiovascular Disease,
Interleukin-6 and Risk of Mortality in Older
Women. The Womens Health and Aging Study.
Circulation, 103, 947, 2001 620 gt65 éves no,
anamnézis, orvosi vizsgálat, vérvétel, különbözo
gyulladásos markerek meghatározása IL-6, CRP,
albumin 3 éves követés (PROSPEKTÍV VIZSGÁLAT), a
halálozás és ennek okának regisztrálása
3Az alap szérum IL-6 szint és a 3 éves mortalitás
4A különbözo IL-6 szérumszintu betegek demográfiai
és egészségügyi jellemzoi
5Kérdés
- Mennyivel nagyobb a kockázatuk (relatív rizikó) a
magas IL-6 szintu egyéneknek a közepes és az
alacsony IL-6 szintu egyénekhez viszonyítva arra,
hogy 3 éven belül meghaljanak? Prospektív
vizsgálat, RR számolható. - A feladat az, hogy matematikai módszerekkel
kiküszöböljük az egyéb tényezoket, amelyek a
három IL-6 szintu csoportban különböznek és így
adjunk választ a fenti kérdésre - Ebbol a célból különbözo modelleket építünk fel,
és a logisztikus regresszió módszerével végezzük
el a számítást.
6A 3 éves mortalitás nyers és adjusztált relatív
rizikója (95 CI) az IL-6 szérumszint szerint
7Kiechl, S. et al. Chronic Infections and the
Risk of Carotid Atherosclerosis. Circulation,
103, 1064, 2001
- Bruneck tanulmány 1990, 826 40-79 éves egyén,
carotis duplex scan carotis atherosclerosis
foka, plakkok száma). - A vizsgált egyéneknél rögzítették, hogy
szenvednek-e valamilyen krónikus légúti, húgyúti,
fogászati vagy egyéb infekcióban. - A vizsgált egyének vérében megmértek egyes a
krónikus infekciókra jellemzo laboratóriumi
markereket)
8KÉRDÉSEK
- 1) VAN-E ÖSSZEFÜGGÉS A KRÓNIKUS FERTOZÉSEK
KLINIKAI ÉS LABORATÓRIUMI JELEI ÉS A CAROTIS
ATHEROSCLEROSIS MÉRTÉKE KÖZÖTT A VIZSGÁLAT
IDOPONTJÁBAN (keresztmetszeti vizsgálat)2) VAN-E
ÖSSZEFÜGGÉS A KRÓNIKUS FERTOZÉSEK KLINIKAI ÉS
LABORATÓRIUMI JELEI ÉS AZ ÚJ CAROTIS PLAKKOK
KIFEJLODÉSE KÖZÖTT (prospektív vizsgálat) - Számítás módja többszörös lépcsozetes
logisztikus regressziós analízis
9500 egyénben a kezdeti vizsgálatkor nem találtak
carotis plakkot, közülük 125-ben fejlodött ki
carotis plakk az 5 éves megfigyelési ido alatt.
Mi jelezte ezt elore? OR kategorikus igen/nem,
folyamatos 1 SD növekedés
10Tsobuno Y et al. Green Tea and the Risk of
Gastric Cancer in Japan. NEJM 344, 632, 2001.
- 1984, 26311 gt 40 éves Miyagi tartomány, kérdoív
zödtea fogyasztás mértéke - Követési ido 1999 748 személy-év 1982 dec.-ig.
419 gyomorrák, diagnózis idopontja - Kérdés befolyásolja-e a zöldtea fogyasztás a
gyomorrák kifejlodésének az esélyét? - Számítás Cox regressiós analízis, relatív rizikó
(prospektív vizsgálat) alap lt1 csésze/nap. A
gyomorrák kimenetelét esetleg még befolyásoló
változók (confounding variables) életkor, nem,
ulcus az anamnézisban, dohányzás, alkohol, rizs,
hús/zöldség fogyasztás
11A zöldtea fogyasztás és a gyomorrák
kifejlodésének relatív rizikója
12Többszörös logisztikus regresszió
- Számszeruen (odds ratio formájában) fejezi ki az
összefüggést egy független változó és egy
dichotóm (beteg/nem beteg, férfi/no, magas/nem
magas, stb.) függo változó között úgy, hogy ezt
az összefüggést a többi független változóhoz
illeszti (adjusted) tehát matamatikai
módszerekkel a többi független változó hatását
kiküszöböli. A cél általában a predikció. - Példa Az AIDS definíciójának megfelelo
opportunista infekciók vagy tumorok elofordulása
elorehaladott HIV betegségben szenvedo
betegekben. A betegeket folyamatosan két reverz
transzkriptáz gátló szerrel kezelték, és két
csoportra randomizálták. Az egyik csoport egy
proteáz inhibitort (Ritonavir) is kapott, a másik
csak placebot az alapkezelés mellett. 16 hétig
regisztrálták az AIDS definíciójának megfelelo
opportunista infekciók vagy tumorok
elofordulását. (Cameron et al. Lancet 351, 543,
1998)
13Relatív rizikó (relative risk) , esély-arány
(odds ratio)
14(No Transcript)
15Relatív rizikó
- Relatív rizikó A/AB osztva C/CD-vel a
példában 119/543 osztva 205/547-el
0.22/0.370.59 (95 CI 0,48-0.71), tehát az AIDS
kifejlodésének a relatív kockázata a Ritonavírral
kezelt csoportban csaknem a fele a szokásos
kezelést kapott betegek kockázatának
16Esély-arány (OR)
- Eloször mindkét csoportban kiszámítjuk az esélyét
annak, hogy egy esemény, példánkban az AIDS
kifejlodése, bekövetkezzen. Ez A/B, ill C/D,
tehát példánkban 119/4240.28, ill. 205/3420.60.
A két esély arány tehát A/B osztva C/D-vel,
0.28/0.600.47 (95 CI 0.33-0.67). Tehát a
ritonavírrel is kezelt betegeknek az esélye arra,
hogy bennük AIDS fejlõdjön ki. kevesebb, mint
fele annak, amely a ritonavirrel nem kezelt
betegek esetében áll fenn. - EZ AZ ÖSSZEFÜGGÉS AZONBAN CSAK AKKOR IGAZ, HA A
KÉT CSOPORT MÁS SZEMPONTBÓL NEM KÜLÖNBÖZIK
EGYMÁSTÓL. HA IGEN TÖBBSZÖRÖS LOGISZTIKUS
REGRESSZIÓ VAGY MÁS HASONLÓ ELJÁRÁS ELVÉGZÉSE
SZÜKSÉGES
17A logisztikus regresszió során alkalmazott
számítási mód
- A lineáris regresszióval ellentétben, amelynél a
számítás az ún. legkisebb négyzetek módszerén
alapszik, a logisztikus regresszió számítási
módja az un. maximum likehood ratio kiszámítása.
Ez, mint minden valószínuség-arány számítás,
exponenciális, tehát a természetes logaritmus
alapra vonatkozik. Ezt átalakítjuk úgy, hogy az
egyenlet mindkét oldalán ln-t számítunk.
18A logisztikus regresszió egyenlete
- odds (bekövetkezik/nem következik be, A/B)
P/1-P. Ha a ln-át vesszük, ln (odds) ln (P/1-P)
ßo ßII - Ha ezt az egyes független változók szerint
részeire bontjuk, akkorln (odds) ßo X1ß1
X2ß2.... - A ßo azt jelenti, hogy a ln(odds) mennyivel
egyenlo, ha minden független változó 0. A ß1
érték egyenlo az X változóra vonatkozó OR
ln-ával, stb.
19A logisztikus regresszió egyenlete (folyt.)
- A 0 hipotézisünk az, hogy a vizsgált változók
által meghatározott esély-arány (OR) nem
különbözik 1-tol, tehát ezek a változók nem
növelik az adott esemény bekövetkeztének
valószínuségét. Ennek az OR-nek vesszük a ln-át,
majd az egyenletet úgy alakítjuk át, hogy ezt az
OR-t felbontjuk az egyes változók által
meg-határozott OR-ekre, pontosabban ezek
ln-áraln (OR) X1(lnOR1) X2(lnOR2).... - Az egyes komputer programmok vagy a ß vagy az OR
értékeket adják meg, átszámíthatók ß ln(OR)
20Modell felépítés a logisztikus regresszióban
- Hasonló a lineáris regresszióhozmanuálisautomati
kus forward selection
backward elimination
stepwise selection - A számítógépes programok méroszámot adnak (vö R2
a lineáris regressziónál), amely az egyes
modellek jóságát (goodness of fit) fejezik ki.
21A többszörös logisztikus regresszióval
kapcsolatos legfontosabb kérdések
- Elegendo a megfigyelések száma? (5-10-szer több
eset, mint változó) - A modell megfelelo-e? Ha van interakció az egyes
változók között, ezt a modell felépítésnél
figyelembe kell és lehet is venni. - Van-e az eredményeknek biológiai értelme?
(automatikus modellfelépítés!) - Ha váratlan összefüggés jön ki, lehet véletlen,
de lehet értelme is hipotézis felállítás, de
ellenorzés új vizsgálatban!!!
22Példa a többszörös logisztikus regresszióra
(Burián et al, Circulation, 2001)
23Kérdés
- A négy paraméter elore képes-e jelezni, hogy egy
adott egyén az ISZB-s beteg vagy
kontroll-csoportba tartozik? - Számítás többszörös logisztikus
regressziófüggetlen változók HDL-koleszterin, a
triglicerid és az anti-hsp60 szintek (folyamatos
változók, 1 SD változás) és a Chl, pneumoniae
(nominális 0 (szeroneg), 1 (szeropoz)Függo
változó csoport 0 kontroll, 1 ISZB
24STATISTICA OUTPUT
Model Logistic regression (logit) N of 0's48
1's241 Dep. var CSOPORT Loss Max likelihood
(MS-err. scaled to 1) Final loss 115,14789192
Chi?(4)29,591 p,00001
Const.B0
LOGHSP60 HDL_CHOL TRIGLICE CHL_PNEU Estimate -,74
,9383 -,186086 ,51 ,71548 SE
,68 ,2997 ,284498
,18 ,36015 t(284) -1,08
3,1305 -,654084 2,81
-1,98662 p-level ,28 ,0019
,513587 ,01 ,04792 -95CL
-2,08 ,3483 -,746078 ,15
-1,42439 95CL ,61 1,5282
,373907 ,86
-,00658 Wald's khi2 1,16 9,8000 ,427826
7,88 3,94668 p-level ,28
,0017 ,513062 ,00
,04697 OR (unit ch) ,48 2,5556 ,830202
1,66 ,48896 -95CL ,12 1,4167
,474223 1,16 ,24066 95CL 1,84 4,6101
1,453402 2,37 ,99344
25STATISTICA OUTPUT
Model Logistic regression (logit) N of 0's40
1's240 Dep. var CSOPORT Loss Max likelihood
(MS-err. scaled to 1) Final loss 102,66727851
Chi?(4)24,331 p,00007
Const.B0
HDL_CHOL TRIGLICE CHL_PNEU LOG_HSP6 Estimate ,71
9607 -,85900 ,149 -,81825 ,9662 SE ,786326 ,3
6820 ,156 ,38000 ,3214 t(275) ,915151 -2,33294
,956 -2,15327 3,0061 p-level ,360914
0,02037 ,340 ,03217 ,0029 -95CL -,828377
-1,58386 -,158 -1,56634 ,3335 95CL
2,267590 -,13414 ,456 -,07016 1,5990 Wald's
khi2 ,837501 5,44259 ,914 4,63657 9,0368 p-lev
el ,360119 ,01966 ,339 ,03130 ,0026 OD
(u.ch) 2,053625 ,42359 1,161 ,44120 2,6281 -95
CL ,436758 ,20518 ,854 ,20881 1,3958 95CL 9
,656101 ,87447 1,577 ,93224 4,9482
26SPSS output
27Milyen jó a modell? (Goodness of fit) SPSS
A measure of how well the model fits the data. It
is based on the squared differences between the
observed and predicted probabilities. A small
observed significance level for the
goodness-of-fit statistic indicates that the
model does not fit well.
28MIHEZ SZÁMÍTSUK AZ ODDS RATIOT?
- Ha a független változó kategorikus, foleg, ha
bináris, akkor OK (beteg/nem beteg, dohányzik/nem
dohányzik, férfi/no, stb.). - Ha viszont a független változó folyamatos, akkor
koncepcionálisan nehéz felfogni, hogy egy egység
pl. 1 SD változás mit jelent. Megoldásokértelmes
kategóriákat állítok fel pl. életkorban 10
év,binárissá teszem a független változót (
alacsony/nem alacsony, magas/nem magas labor.
lelet, IQ, stb.)
29HOL HÚZZUK MEG A HATÁRT?
- A binárissá átalakítandó független változó
minden adatát (a függo változó eredményétol
függetlenül!!!) sorba rendezzük és megállapítjuk,
hol van a 90. percentilis, a legfelsobb
(legalsóbb) kvartilis, tercilis, esetleg a medián
határa. (legtöbb program megcsinálja) - Ezután megvizsgáljuk, hogy a függo változóhoz
tartozó két csoportban a magas/nem magas stb.
kategóriába tartozó független változó hány
esetben fordul elo - Végül a logisztikus regressziós egyenletbe
bevisszük mint bináris változót (nem magas 0,
magas 1) ezt a független változót, és
kiszámítatjuk az OR-t
30Anti-hsp60 legfelso kvartilis vs. többi
- Példánkban az anti-hsp60 legfelso kvartilisának
határa 183,24 AU/ml. - Ezután átkódoljuk a változót, úgy, hogy 0
lt183.24, 1 gt183.24. - Megszámoltatjuk a géppel, hogy a beteg, ill
kontroll csoportban hány 0 és 1 anti-hsp60
antitest szintu egyén van. - HSP60KV HSP60KV Row
- G_10 G_21 Totals
- G_10 51 3 54
- G_21 175 73 248
- All Grps 226 76 302
- Végül elvégezzük a logisztikus analízist a
folyamatos változót a binárissal helyettesítve
31STATISTICA OUTPUT
Const.B0 HDL_CHOL TRIGLICE HSP60_M_ CHL
_PNEU Estimate 2,06560 -,79768 ,1339 2,00283 -,
92184 SE ,54187 ,34038 ,1409 ,62255 ,36728 t(28
7) 3,81201 -2,34351 ,9505 3,21714 -2,50987 p-le
vel ,00017 ,01979 ,3426 ,00144 ,01263 -95CL ,9
9906 -1,46764 -,1434 ,77749
-1,64475 95CL 3,13214 -,12773 ,
4112 3,22817 -,19892 Wald's khi214,531405,49206
,9035 10,35002 6,29946 p-level ,00014 ,01911 ,
3419 ,00130 ,01208 OR(u.ch) 7,89002 ,45037 1,14
33 7,40998 2.34 -95CL 2,71574 ,23047 ,8664 2,
17600 1.18 95CL 22,92288 ,88009 1,5086 25,233
39 4.66
32SPSS output
33A logisztikus regressziós számítással megoldható
problémák
- Az egyes vizsgált változók hatásának
számszerusítése esély-arány (95 CI) formájában - Ha két változó egymástól független és nem
befolyásolják egymás hatását, akkor vizsgálni
lehet, hogy van-e együttes hatásuk (joint effect) - A a két változó egymástól független, de
befolyásolják egymás hatását, számszerusíteni
lehet ezt a kölcsönhatást (interakciót) is
34Független egymást nem befolyásoló változók
- Mind a magas anti-hsp60 szint, mind a Chl. pneum.
fertozöttség összefüggésben van az ISZB-vel (OR
7.47 (2.18-25.2), ill. 2.17 (1.18-4.66). - A két változó között nincs korreláció Spearman
r - 0.007 (p0.91) - Számítsuk ki a magas anti-hsp60 szint OR-át, a
Chl.pneum. szeronegatívoknál (2.06 (1.12-3.78))
és a Chl. pneum. szeropozitívoknál (3.85
(2.63-5.62). Tehát az ISZB és a magas anti-hsp
közötti összefüggés fennáll a Chl. pneumoniae
fertozéstol függetlenül, a két változó nem
(gyengén?) befolyásolja egymást
35(No Transcript)
36Két változó együttes hatása
37Az alap szérum IL-6 szint és a 3 éves mortalitás
38A korábbi cardiovascularis betegség (CVB) hatása
az IL-6 és a mortalitás közötti összefüggésre
(interakciót találtak, p0.09)
39A családi rizikó predikciója a koleszterin, HDL
és a nem alapján, az interakció hatása
B
S.E.
Wald
df
p
R
CHOL ,6335 ,2985 4,5031 1
,0338 ,1494 HDL -2,4635 ,9827
6,2846 1 ,0122 -,1954 NEM
-,4027 ,4848 ,6899 1 ,4062
,0000 Constant ,8494 1,5590 ,2968
1 ,5859 INTERAKCIÓ BEÉPÍTVE CHOL
-,6148 ,8546 ,5175 1 ,4719
,0000 HDL -2,4323 ,9994 5,9231
1 ,0149 -,1870 NEM -4,1402
2,5648 2,6058 1 ,1065 -,0735 CHOL by
NEM ,8909 ,5979 2,2203 1 ,1362
,0443 Constant 6,0057 3,7456
2,5710 1 ,1088
40A családi rizikó predikciója a koleszterin és HDL
alapján fiúkban
Variable B S.E. Wald df
Sig R CHOL ,3208 ,3799
,7132 1 ,3984 ,0000 HDL -2,9730
1,4563 4,1674 1 ,0412
-,1864 Constant 2,3467 1,9864 1,3957
1 ,2374
41A családi rizikó predikciója a koleszterin és HDL
alapján lányokban
Variable B S.E. Wald df
Sig R CHOL 1,1179 ,4946
5,1094 1 ,0238 ,2507 HDL
-1,8774 1,4030 1,7907 1 ,1808
,0000 Constant -2,7346 2,4150 1,2821
1 ,2575
42A két vagy több független változó elemzéséhez
használható különbözo módszerek (Dawson, Trapp,
2001)
43Kovariancia analízis (ANCOVA)
- A lineáris regressziós analízis speciális
formája, a confounding variable hatásának
hatékony kiküszöbölésére alkalmas. Feltételezése
az, hogy a confounding variable minden szintjén a
függo és független változó közötti regressziós
egyenes meredeksége azonos, és csak az y tengely
metszéspontja különbözik. A bonyolult képlettel
számolható analízis végeredménye egyszeru egy
adott független váltózó hatást segítségével
számszerusíteni lehet.
44Cox regresszió vagy proportional hazard model
- A klinikai biometria egyik legfontosabb módszere,
a vezeto orvostudományi folyóiratokban a cikkek
jelentos hányadában alkalmazott eljárás. A
prospektív vizsgálatok értékelési módszere. A
lényege azt az idot is figyelembe veszi az
analízisnél, amely a vizsgált esemény (outcome,
független váltózó) bekövetkezéséig a vizsgálat
kezdetétol eltelt. Így az. Un. túlélési görbék
analízisénél alkalmazzák elsosorban. Mint minden
ilyen vizsgálat esetében, az adatok egy része un.
censored data, mivel a vizsgálat befejezésekor a
vizsgált egyének egy részénél óhatatlanul nem
következett még be a vizsgált esemény, de nem
zárható ki, hogy a jövoben majd még bekövetkezik.
Ezért a megfigyelési periódus végén azokat,
akiknél nem következett még be a vizsgált
esemény, olyanoknak tekintjük, mint akiknél ez
nem is fog bekövetkezni.
45Egyéb eljárások
- Discriminant analysis célja az, hogy az outcome
bekövetkezését elorejelzo csoportokat (változók
kombinációit) körülhatárolja. A vizsgált egyének
e módszer segítségével két vagy több csoportba
sorolhatók - Log-linear analysis a 2x2 mezonél nagyobb
kontingencia táblázatok (minden független változó
nominális vagy kategóriákba sorolt) értékelési
módszere. Nem szükségszeruen különbözteti meg
azt, hogy melyik változó függo és melyik
független. - Factor analysis, cluster analysis minden
változót függetlennek tekintünk, a cél a vizsgált
egyének vagy dolgok,ill. ezek változásait mutatók
egymással rokonítható csoportokba való besorolása