An - PowerPoint PPT Presentation

1 / 12

About This Presentation

Title:

An

Description:

cota derecha el valor de una variable de la que s lo se sabe que se encuentra ... que un dato se acote (a la derecha) viene dado por la funci n de supervivencia ... – PowerPoint PPT presentation

Number of Views:36

Avg rating:3.0/5.0

Slides: 13

Provided by: Itz67

Category:

Tags: antes | de | derecha | izquierda | siempre

more less

Transcript and Presenter's Notes

Title: An

1
Análisis de supervivencia Tema 5 Itziar
Aretxaga
2
Transformadas de Fourier
3
Correlaciones con límites superiores e inferiores
? Coeficiente generalizado de rangos de Kendall o
test BHK (Brown, Hollander Korwar)
Recomendaciones funciona para variables
ordinales o continuas derivadas de cualquier
distribución, pero en condiciones de muchas
ligaduras, deja de ser efectivo. El test es no
paramétrico. Método con m detecciones y n
cotas (límites superiores o inferiores), donde

y bij de define de forma análoga
con las y La significancia de que x,y sean
independientes viene dada por zS/sS que está
distribuida de forma normal
(Isobe et al 1986, ApJ, 306, 490)
4
Métodos de regresión con valores censados
En Estadística se denomina cota derecha el
valor de una variable de la que sólo se sabe que
se encuentra entre A,8 límite inferior
cota izquierda el valor de una variable de la que
sólo se sabe que se encuentra entre -8,C
límite superior En Astrofísica nos encontramos
casi siempre con cotas izquierdas, mientras que
las técnicas de análisis de supervivencia se han
desarrollado para cotas derechas. Sin embargo, es
posible transformar unas en otras mediante una
constante M CiM-Ai Ejemplo 30,24-,11,19-
con M30 se convierten en 0,6,19,11 ?
Algoritmo EM de expectación y maximización
(Nelson Hahn 1972) Sea xi,yii1,,nm tal
que fijado x, la distribución de y sea gaussiana.
El test es paramétrico, y análogo a un ajuste por
mínimos cuadrados. Definimos los residuos del
ajuste lineal dado por los coeficientes ak, bk y
la desviación estándar del ajuste sk como La
probabilidad de que un punto se detecte en un
intervalo ?z es La probabilidad de que un dato
se acote (a la derecha) viene dado por la función
de supervivencia
(Isobe et al 1986, ApJ, 306, 490)
5
Métodos de regresión con valores censados
La función de probabilidad de tener m
observaciones detectadas y n acotadas viene dada
por tomando logaritmos Los parámetros vienen
de la maximización donde la variancia El
método implica 1. estimar a1, b1, s1 de una
regresión por mínimos cuadrados sin utilizar los
valores censados. 2.
estimar los valores acotados
3. calcular a2, b2, s2
4. estimar e iterar hasta que
converja
cte
?z ?y/?k
(codificado en IRAF)
(Isobe et al 1986, ApJ, 306, 790)
6
(Isobe et al 1986, ApJ, 306, 790)
7
Métodos de regresión con valores censados
Para mejorar la convergencia en el caso de muchas
cotas (Aitkin 1981) se redefine Los
errores en los parámetros vienen dados por la
diagonal de la matriz de covariancia VI-1 donde

(Isobe et al 1986, ApJ, 306, 790)
8
Métodos de regresión con valores censados
? Algoritmo EM con el estimador de
Kaplan-Meier El estimador de Kaplan-Meier provee
de una estimación no paramétrica de la función de
supervivencia. Se define la muestra de riesgo
R(zi) como el conjunto de datos que, con toda
seguridad, no se ha detectado antes de
zi. Ejemplo y(1) lt y(2) lt y(3) lt y(4) Ry(1)
y(1), y(2), y(3), y(4) , Ry(2)y(2),y(3),y
(4) , Ry(4)y(4) no existe la muestra de
riesgo de valores censados El estimador de
Kaplan-Meier se define formalmente como donde
los zi han sido indexados de forma creciente
z1znm
ni es el tamaño de la muestra de riesgo R(zi)
di es el
número de detecciones con valor zi
es una función escalón decreciente
que sólo salta en las detecciones.

xi ni di 1-di /ni
S(xi)
0 8 1
0.8750 1
3
6 1 0.8333 0.8750 Ejemplo
0,6,19,11,3,19,6,2 6
5 1 0.8000 0.7292

19 2 2 0.0000
0.5833
gt19
0
(Feigelson Nelson 1985, ApJ, 293, 192)
9
Métodos de regresión con valores censados
Para realizar un ajuste con este método se debe
obtener una estimación de los coeficientes ak, bk
sin tomar en cuenta los valores censados, y de
forma iterativa encontrar el valor más probable
de los coeficientes con donde los pesos
y
se ordenan de forma creciente. Los coeficientes
en el paso k serán Buckley James (1979)
recomiendan usar como estimador de la desviación
estándar sk la fórmula empírica Donde D denota
que sólo se utilizan valores detectados. El error
de la pendiente es
y puede estimar la significancia del
ajuste
10
Métodos de ajuste con valores censados
caso general
Para el caso general de querer obtener el ajuste
de una función no-lineal f(x,a), definimos de
igual manera los residuos y podemos plantear la
maximización de la probabilidad que en
general, puede no tener una solución analítica.
Lo que siempre se puede intentar es la
minimización con un algoritmo adaptable, tal como
amoeba.
Ejemplo
(Aretxaga, Hughes Dunlop MNRAS, 2003, in prep)
11
Comparación de distribuciones con cotas
Suposiciones tests no paramétricos formulados
para cotas derechas Sean los valores de
una distribución, donde i recorre las
distribuciones i1,2 y j recorre el número de
puntos j1,2,...,Ni y Aij denota las cotas
Método se formula la hipótesis nula de que las
dos distribuciones son iguales. Sean y1lt y2lt ...lt
yr con rN1N2 los valores detectados en ambas
distribuciones de forma conjunta, ordenados de
forma creciente. Se definen las
variables La estadística de rangos lineales
con cotas se calcula mediante donde wj son
pesos asociados a diferentes estadísticas
(Feigelson Nelson 1985, ApJ, 293, 192)
12
Comparación de distribuciones con cotas
Para n grande, Ln es aproximadamente gaussiana,
con media 0 y variancia de forma que a un
nivel h se puede decir que las dos distribuciones
difieren si donde zh/2 es el
intervalo para el cual el área de la distribución
normal entre -zh/2,zh/2 es igual a 1-h , y la
significancia de este resultado viene dada por el
área de la distribución normal con valores
mayores que Ejemplo 30,24-,11,19-,27,11,24,28-
y 3,23,17-,8-,10,5- se convierten en
cotas derechas con una traslación con M30.
Utilizando las definiciones del análisis de
supervivencia tenemos N18, N26, n14,
r7 logrank da Ln2.5 sn1.1 que es
significante con una probabilidad p0.032 Gehan
da Ln 23 sn11 que es significativo con una
probabilidad p0.056 Latta (1981) introduce unos
nuevos pesos que dan lugar al test Peto-Prentice,
que supuestamente es menos sensible a diferencias
de acotado
(Feigelson Nelson 1985, ApJ, 293, 192)

Write a Comment

User Comments (0)