Alicia Dickenstein - PowerPoint PPT Presentation

About This Presentation
Title:

Alicia Dickenstein

Description:

C mo tomar decisiones (favorables) sobre hechos que suceden azarosamente? ... 1 o 0 (nunca sale ceca o nunca sale cara) 501. 1/1000 o 999/1000. 51. 1/100 o 99/1000 ... – PowerPoint PPT presentation

Number of Views:49
Avg rating:3.0/5.0
Slides: 37
Provided by: mateD
Category:

less

Transcript and Presenter's Notes

Title: Alicia Dickenstein


1
Probable mente Semana de la Matemática 2005
  • Alicia Dickenstein

2
  • Por qué los casinos ganan siempre?
  • (sin hacer trampa)

3
Cómo tomar decisiones (favorables) sobre hechos
que suceden azarosamente?
4
Por qué los casinos ganan siempre? (sin hacer
trampa) Cómo tomar decisiones (favorables)
sobre hechos que suceden azarosamente? Teoría
de probabilidades
5
Si tiramos una moneda no cargada
p(cara) p(ceca) 1/2
6
Si tiramos una moneda cargada
p(cara) 1 - p(ceca)
p(cara) p(ceca) caras
1/2 1/2 50
1/4 3/4 25
1 0 100
p 1-p 100 p
7
Si tiramos dos monedas no cargadas
p(2 caras) p(2 cecas) 1/4
p(1 cara y 1 ceca)
8
Si tiramos dos monedas no cargadas
p(2 caras) p(2 cecas) 1/4
p(1 cara y 1 ceca) 1/2
9
Si hay 3 monedas no cargadas


10
p(3 caras) 1/8

p(2 caras y 1 ceca)
11
Si hay 3 monedas
p(3 caras) 1/8

p(2 caras y 1 ceca) 3/8
12
Problema
  • Se tiene una moneda cargada, con probabilidad p
    de salir cara y q 1-p de salir ceca
  • p (y q) son desconocidas
  • Cómo usar esta moneda cargada para hacer una
    apuesta justa (pareja) entre dos personas?

13
(Una) respuesta
  • Se tira 2 veces la moneda sucesivamente, esto es
    considerado 1 tiro..
  • Uno de los jugadores elige primero cara y luego
    ceca, el otro elige primero ceca y luego cara.
  • Se tira la moneda hasta que salgan 2 facetas
    distintas en un tiro (doble)

14
Por que es una apuesta justa?
  • p(cara-cara) p. p p2
  • p(ceca-ceca) q. q q2
  • p(cara-ceca) p. q
  • P(ceca-cara)q. p
  • Ambos jugadores tienen probabilidad p.q q.p de
    ganar

Notar que p2 q2 2 pq (pq)2 12 1
15
Pero
  • Cuál es el número esperado de tiros hasta que
    salgan dos facetas distintas??

16
Respuesta
  • En general, el número esperado E de tiradas para
    que se produzca un suceso con probabilidad u de
    suceder, hasta que suceda es igual a 1/u
  • Porque
  • E 1. u (E1)(1-u),
  • y se despeja
  • E 1/u.
  • Ya que o sucede en una tirada, o estamos en el
    punto de partida nuevamente, salvo que ya
    pagamos una tirada

17
En nuestro caso
  • La probabilidad de que salgan dos facetas
    distintas en un tiro (doble) es
  • u 2 p (1-p)
  • Por lo tanto, el valor esperado del número de
    tiros hasta que salga cara-ceca o ceca-cara es
  • E 1/ 2 p (1-p)

18
Por ejemplo
p(cara) nro. esperado de tiros
1/2 2
¼ o 3/4 3
1/10 o 9/10 6
1/100 o 99/1000 51
1/1000 o 999/1000 501
1 o 0 (nunca sale ceca o nunca sale cara) ?
19
Los favoritos en los deportes
  • Supongamos que el equipo argentino es tan bueno
    que tiene probabilidad de ganarle 7 de cada 10
    veces a cualquier otro equipo del mundo, o sea la
    probabilidad p de que gane cualquier partido es
  • p 7/10
  • Cuál es la probabilidad de ganar 4 partidos
    (octavos de final, cuartos de final, semifinal y
    final)?

20
Respuesta
  • (7/10)4 0, 2401
  • O sea, la probabilidad de ganar cualquier partido
    individual es del 70 , pero la probabilidad de
    ganar los 4 es de menos del 25 (24,01)

21
p1 es la probabilidad de ganar un partidop4 es
la corresp. probabilidad de ganar los 4
p1 en p4 en
0,5 1/2 50 0,0625 6,25
0,6 60 0,1296 13
0,7 70 0,2401 24
0,8 80 0,40 40
0,9 90 0,6561 65
0,84 84 0,5 1/2 50
22
Para favorecer al favorito
  • Como en la NBA por ejemplo
  • Gana el equipo que gane el mayor numero de
    partidos entre 3, 5 o 7 partidos disputados entre
    los dos equipos !

23
En porcentajes (aproximados)
Prob. de ganar 1 partido X 100 Prob. de ganar al menos 2 de 3 x 100 Prob. de ganar al menos 3 de 5 x 100 Prob. de ganar al menos 4 de 7 x 100
60 65 68 71
70 78 84 87
50 50 50 50
40 35 32 29
24
La pregunta indiscreta
  • Supongamos que se quiere conocer, por ejemplo, el
    porcentaje de adolescentes de menos de 16 años
    que han probado alguna droga.

25
La pregunta indiscreta
  • Supongamos que se quiere conocer, por ejemplo, el
    porcentaje de adolescentes de menos de 16 años
    que han probado alguna droga.
  • Puede estimarse este valor sin violar la
    privacidad de nadie?
  • O sea, puede obtenerse informacion veraz de la
    población en general sin tener informacion veraz
    de ningun individuo en particular?

26
Se entrega al entrevistado una moneda (no
cargada) y el entrevistado se compromete a lanzar
la moneda en privado y de acuerdo al resultado
  • Si al tirar la moneda sale cara, responde
  • SI,
  • cualquiera sea la respuesta verdadera
  • Si al tirar la moneda sale ceca, responde
  • SI o NO,
  • de acuerdo a la verdad.

27
Entonces, sin tener ninguna información sobre si
un individuo que respondió SI, probó la droga o
no, se puede estimar
de respuestas SI de adolescentes que probaron la droga
60 20
65 30
50 0
80 60
28
La fórmula es
  • p(SI) p(SI/ salio ceca) . ½ p(SI/ salio
    cara). ½
  • p(SI/ salio ceca) ½ 1. ½
  • p(SI) se estima como
  • p (SI) nro. de respuestas SI/ nro total de
    entrevistados
  • De donde
  • p(SI/ salio ceca) 2. (p(SI) -1/2)
  • O bien
  • de verdaderas respuestas SI 2 ( de
    respuestas SI obtenidas 50).

29
Imaginemos un dado tetraedral... con caras A,T,
C, G
30
gthg17_dna rangechr1738464686-38473085 5'pad0
3'pad0 revCompFALSE strand? repeatMaskingnoneA
TCCAGAAGTCTAGTATACATCTCAAAATTCATGCATCTGGCCGGGCACAG
TGGCTCACACCTGCAATCCCAGCACTTTGGGAGGCCGAGGTGGGTGGATT
ACCTGAGGTCAGGAGTTTAAGACCAGCCTGGCCAACATGGTAAAACCCCA
TCTCTACTAAAAATACAAGTATTAGCCAGGCATTGTGGCAGGTGCCTGTA
ATCCCAGCTACTCGGGAGGCTGAGGCAGGAAAATCACTTGAACCGGGAGG
CGGAGGTTGGAGTGAGCTGAGATCGTGCTACCGCACTCCATGCACTCTAG
CCTGGGCAACAGAACGAGATGCTGTCACAACAACAACAACAACAACAACA
ACAACAACAACAACAACAACAAATTCTCACATCTAAAACAGAGTTCCTGG
TTCCATTCCTGCTTCCTGCCTTTCCCACTCCCCCATATTCCCTACCATGC
CTTCTTCATCTAATTTAATATTACTAACAAGATCTATTGTTCAAGCCAAA
ACCCAAGTGTCACTCCTTCAATTTCTCTTTACCTTATCCTCCAAATTTAA
TCCATTAGCAAGTCCTCTCTTCAAACCCATCCCAAACCAACCTTGTTTTT
AACCATCTCCACACCACCAATTACCACAAGGATAAAATCTGAATTCCTTA
CCACCAAATACTATGTGATCTGGCCCTCATCTATGACCTTCTCCCATTCC
TTGTGTAATCTCTGCCTCCACACATAATTTGCAAATTACTCCAGCTACAC
TGGCCTATTATTATTATTATTATTATTTTTGAGACGGAGTCTTGCTCTTT
CGCCCAGCCTGGAGTGCAGTGGCGCAATCTCAGCTCACTGCAATCTCCGC
CTCCTGGGTTCAAGCGATTCTCCTGCCCCAGCCTCCCAAGTAGCTGTGAT
TACAGGCACATGCCACCATTCCCAGCTAATTTTTTTTTGTTTTTGAGATG
GAGTTTCACTCTTGTTGCCCAGGCTGGAGTGCAATGGTGCGATCTCAGCT
CACCACAACCTCCACCTCCCGGGTTGATGAAGTGATTCTCTTGTCTCAGC
CTCCCGTGTAGCTGGGATTAGAGGCACGCGCCACCACGCTGGGCAAATTT
TTGTATTTTTAGTAGAGACAGGGTTTCTACCTCAGTGATCTGTCCGCCTT
GACCTCCCAAAGTGCTGGGATTACAGGAATGAGCCACCACACCCAGCCGT
GCCCAGCTAATTTTTGCATTTTTTAGTAGAGATGGGGTTTTGCCACGTTG
GCCAGGCTGGTCTCAAACTCCTGACCTCAGGGGATCTGCCTGCCTCGGCC
TCCTAGAGTGCTGGAATTACAGGTGTGAGCCACTGTGCCCGAACCTTTTA
TCATTATTATTTCTTGAGACAGGAGTCTTGCTCTGTCGTTCAGGCTGGAG
TGCAGTGATGCGATCTTGGCTCACTGTAACTCCTACCTTTCGGTTCAAGT
GATTCTCCTGCCTCAGCCTCTGGAGTAGCTGGGATTACAGGCACTGGGAT
TACAGGCACACACCACCACACCATGCTAGTTTTTTGTATTTTTAGTAGAG
ATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAAG
TGATTTGCCTGCCTTGGCTTCCCAAAGTGCTGGGATTATAGGCACGAGCC
ACCACACACGACCAACATTGGCCTATCTTTTAAAAAATAAACCAAGCTCT
GGCCGGGCACAGTGGCTCACACCTGTGATCCCAGCACTTTGGGAGGTTGA
GGTGGTTGGATCACTTGAGTTCAGGAGTTTGAGACCAGCCTGACCAACGT
GGTAAAACCCCATCTCTACTAAAAATAAAAACTAGTCGGGTGTGGTAGCA
CGCGTGCCTGTAATACCAGCTACTCAGGAGGCCAAGGCAGGAGAATTGCT
TGAACCCAGGAGACAGAGTTTGCAGTGAGCCAAGATTGTGCCACTGCACT
CCAGCCTGGGGGATAGAGGGAGACACCATCTCAAAAAAACCAAAATACAG
AAATCAAAAAACCACACTCATTATTACCTCAAGACCTTTATGTTTGCTAT
TCCTCTGCCTATAAGATGCATTCCCTTCATTTTTCAAGGACAATTATTTC
TTGTTATTTAGGTCTCAGCTCAATTTTTTCAGAAAGGCTTTCCCTGGCCT
CCTTAAACGAAAGTAATCAACAACCTTTGACAGCTAATACTATTCCACTG
TTCTGTATATTTCTCCATAGCATTTATTGTTATCTTAAATTCATCTTTAT
TGTGTATCTCCCCTCGACAGAACCTGAATCCTACCAGGGACTTAGTTAGT
CTTATTTACTGTTGCATTCCTAGTGCCCAGAACACAGTAGGCTCCCAATA
AATAGCCACTGAATAAAAGTTAAAACCAACAAAAATAATCATTTAATTAA
TTATGAATACATCGAATTGTGCACAATAGTTTATAAAATTACTTTTTTTT
TTTTTTTAAGACAGGGTCTCATTCTGTCTCACAGGCTGGAGTGCAGTGGT
GCAATCTAGGCTCACTGCAACCTCCGCCTCCCGGGTTCAAGTGATTCTCC
TGCCTCAGCCTCCCCAGCAGCTAGGATTACAGGCACATGCCACCACGCTC
GACTAATTTTTTTGTGTTTTTAGTAGAGACAAGGTTTCACCATGTTGACC
AGGCTGGTCTCGAACTCCTGACCTCAAGTGATCCACCTGCCTTGGCCACT
CAAAGTGCTGGGATTATAGGCATGAGCCACCACGCCTGGCCTATAAAATT
ACTTTCACATTTCATTTTGCCTGATCTGTTGTCACAGAAGTTCTCAGATG
GCTGTTCTGAAATTATTCCTCCTCCTACACTCTATCTTATTTACTTCTCA
CTGTTCTCAGTATCATAAAGTGCAACATCTTTTTGAAGCAATCTGAATTA
TAAACAGATACATTTGCATGTATATATATGTATATATGCATATGCACACA
CACACTTTTTTTTTTTTAAGAGACAGGGTCTTGCTCTGTGCAAGTGCAAG
AGTGCAATGGTATGATCATAGCTCACTGCAGCCTTGAACTCCTGGGCTCA
AGTGATTCTTCTGGCTTAGCTTCCTCAGTAGCTAAGACTACAGAAGCACA
CTGCCATGCCCGGCTAATTAAAAAAAAATTTTGTGGAGACAGAGTCTCAC
TATGTTGCCCAGGCTGGTTTCAAACTCCTGGCCTCAAGTAATCTTCCTGT
CTCAGCCTCCCAAAGGGCTGAGATTATAAGTGTGAGCCACTGCATCTGGA
CTGCATATTAATATGAAGAGCTTTTCTTCAACAACAGTGAACAGTTTTCT
ACAAAGGTATATGCAAGTGGGCCCACTTCTTGTTCTTATGAATCTTTTCT
TTCCTTTTATAAAACTCCTTTTCCTTTCTCTTTTCCCCAAAGAAAGGACT
GTTTCTTTTGAAATCTAGAACAAATGAGAACAGAGGATATCCTGGTTTGC
GCTGCAAAATTTTTTTTTTTTTTAAGACGGAGTCTCGCTCTGTTGCCAGG
TTGGAGTGCAGTGGCACGATCTTGGCTCATTGCAACCTCCACCTCCCGGG
TTCAAGAGATTCTCCTGCCTCAGCCTCCTGAGTAGCTGGAACTAAAGGCG
CATGCCACCACGCTGAGTAATTTTTTGTATTTTAGTAGAGACAGGGTTTC
ACCATGTTGCCCAGGCTGATCTCGAACTCCTGAGCTCAGGCAATCTGCCT
GTCTTGGCCTCCCACAGTGTTAGGATTACAGGCATGAGCCACTGCACCCG
ATTTTTTTTTTCTTTTGATGGAGTTTTGCTCTTGTTGCCCAGGTTAGAGT
GCAATGATGCGATCTCAGCTCACTGCAACCCCCGCCTCCCAGGTTCAAGT
GATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGAATTACAGGCAAGTGCCA
CCAAGCCCGGCTAATTTTGTATTTTTAGTAGAAACGGGGTTTCTCCATGT
TGGTCAGGCTGGTCTTGAACTCCCGACATCAGGTGATCCAAGCGCCTCAG
CCTCCCAAAGCGCTGGGATTATAGGTATGAGCCACAGTGCAGGCCTGCAT
AATTCTTGATGATCCTCATTATCATGGAAAATTTGTGCATTGTTAAGGAA
AGTGGTGCATTGATGGAAGGAAGCAAATACATTTTTAACTATATGACTGA
ATGAATATCTCTGGTTAGTTTGTAACATCAAGTACTTACCTCATTCAGCA
TTTTTCTTTCTTTAATAGACTGGGTCACCCCTAAAGAGATCATAGAAAAG
ACAGGTTACATACAGCAGAAGAACGTGCTCTTTTCACGGAGATAGAGAGG
TCAGCGATTCACAAAAGAGCACAGGAAGAATGACAGAGGAGAGGTCCTTC
CCTCTAAAGCCACAGCCCTTTAATAAGGCTTGTAGCAGCAGTTTCCTTCT
GGAGACAGAGTTGATGTTTAATTTAAACATTATAAGTTTGCCTGCTGCAC
ATGGATTCCTGCCGACTATTAAATAAATCCCTAGCTCATATGCTAACATT
GCTAGGAGCAGATTAGGTCCTATTAGTTATAAAAGAGACCCATTTTCCCA
GCATCACCAGCTTATCTGAACAAAGTGATATTAAAGATAAAAGTAGTTTA
GTATTACAATTAAAGACCTTTTGGTAACTCAGACTCAGCATCAGCAAAAA
CCTTAGGTGTTAAACGTTAGGTGTAAAAATGCAATTCTGAGGTGTTAAAG
GGAGGAGGGGAGAAATAGTATTATACTTACAGAAATAGCTAACTACCCAT
TTTCCTCCCGCAATTCCTAGAAAATATTTCAGTGTCCGTTCACACACAAA
CTCAGCATCTGCAGAATGAAAAACACTCAAAGGATTAGAAGTTGAAAACA
AAATCAGGAAGTGCTGTCCTAAGAAGCTAAAGAGCCTCAGTTTTTTACAC
TCCCAAGATCAATCTGGATTTATGATTCTAAAACCCCTGGTGACAGAATC
AGAGGCTGAAAACACCACTAATTATAACCAGCAGGTATGGATATTTGGAA
GTCTAGGGGAGGCTGA TATGAAGTTAAGACCAGAGGAAATATCTGTCCA
CTCCCTCTTCTCAACACCCATCTTCTAGACGCCAAGGCTAGCTATAGATC
TCCATTATAGTGTTCAAGGAATTAGGAATTATCCATGTCAATAGTTTTGA
TTAATGTGGACGGAGAACATCTATATTACTAGATGGCAATATGTGAAAGA
AGAAAACAGTATTGTTGAAAACCTAAATCTGAAATGTCAATGTAATGACA
AATTTTCACCCCTAGAATGTCTACCTGGGGAGTCCTAACCCTCTAATATT
CCCCTGAGAGGGATGGGAGAATACAGTGCAGAGCTTTTATATAAGTATTT
CAGAAAGCAGTAGCTAAAGAATCACTTGTTTATTTCCCAGTGTTTCAAAG
GCCCTTCTGAAGAACTAAGCAAACTAAGGAAAGACCATTTAGTTTTAAAC
AGGAGAAATGTATTTAACTAAATCCTAAACACAGCAGGCTATCTGCAAGC
AGCAGCAGCAGCAGCAGCCATGCTCCCTCACAGAATCCTTACAATTTTTG
AAGTTTTTTGTTTAACTGCTACAAAAGCCGATTTAGTAACATTTATTACA
CTTAAAAACTTCAGTTCATTTGTAGTTCAAAGCAAATGTATTGGCTTTGA
GTTTAAAGACTGAACTACTTTAGATTTGATTTGCATTTTTTTTTTTTTTT
TTTTTTGAGATGCAGTCTTGCTCTGTCAGCCAGGCTGGAGTGCAGTGGCT
GGATCTCAGCTCACGGCAAGCTCTGCCTCCTGGGTTCATGCCATTCTCCT
GCCTCAGCCTCCTGAGTAGCTGGGACTACAGATGCCCGCCACCATGCCCG
GCTAATTTTTTGTATTTTTACTAGAGATGGGGTTTCACCGTGTTAGCCAG
GATGGTCTCGATCTCCTGACCTCGTGATCTGCCCGCCTTGGCCCCCCAAA
GCGCTGGGATTACAGGCCTGAGCCACCACGCTTGGCATCTTTTTACCTTT
CATTAACTTTGATGCAAACCTATAGCTTAAGGTATCTTAAACTTTAATGA
CATTTTTCTCTAAAATAGTAGTTTGTAATAACTTGTTCTGGCACCTGGCT
CCAATGAACACTACCCTCTGACCCTGTGGTATAATTTTCATGAGTAAGTG
GAAACCTAAGATCTTAGAAGTTCAACGGCAATGTGTCCAAGGGGTTTAGA
TCCTCTCCTTAAGTGCCTGTATCTCTGTGAAAAGAATCATCATAGGCTAG
GCGCGATGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCGAGGTAGG
TGGATCACCTGAGGTCGGGAGTCCAAGACCAGCCTGACTGACATGGAAAA
ACCCTGTCTCTACTAAAAATACAAAATTAGGTATGGTGGTGCATTCCTGT
AATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCGGGA
GGGGGAGGTTGCAGCAAGCCAAGATCGTGCCATTGCACTCCAGCAGCCTG
GGCAACAAGAGTGAAAAACTACACCTCAAAAACAAAAACAAAAACAAAAG
AATCATCATCAAGTGAACTGGAACACATCCAGAGAACTAATTTTGTTAGA
AAGATTTTAGAGTTGAGCCACACAATCTGCATCTTCTGCGTCCTCCATGC
ACTCGTCTGCTTTCTGGAGCCCCATGAGTGAGTCTTAATCCTGTTCCAGA
TAACAGTTCTCTTCCGGGTAACGGTTCTTCAGATACTTGAAGACAGTGTC
TTATTTCCTTAAATCTTCTCATTTCTTCTTCAAAAGACAGTATTTCAAGT
TACTTTTATGTATCTTTACCATCTACCTCTGGATAAACACTCTCCAATTT
GTCAGTGACCATGTTAAAAACCAAGCACGGTGCTTAAAACTGACATCATC
TTTCAGGCAATCACTCCATTGGAGAATACAGTGGGGCTCTGGATCTGTAC
TTCACTTGCTCCAGAGCCTCTGCTTGTGTTAATACGGCCCAGTTTCAAAT
AAGCATTTTTAGCAGCCCTGAAATGTGTACTCAGATTTAGTTTATAGTCA
ACTAAAAACACCCAGAGGTCTCCTGTATTACACAAGTTATAATTAAAACC
TTAAAAGAGAAAGGTATAGGACAAATGATCTGTCTCCTCCCTTTTTTGCT
TTTTCATATGTTAAGACTATCTCGGAGCTGTTATCAGACTTTTTTCCTGA
AAAACTCTCAACAATACTCAAACTAGGTGTTACATGAAGCTGGGGTCTCC
AGGTTTTGCCTCACTTGTTCTTTCTTTTGTTGTTGTTGAGACAGAGTCTC
ACTCTGTCGCCAGGCTGGAGTGCAGTGGCAGGATCTCAGCTGACTGCAAC
CTCAGCCTCCAGAGTTCAAGCAATTCTTCTGTGTCAGCCTCCCAAGTAGC
TGGGATTACAGGTGCACACCACCACGCCCAGCCA
31
La secuencia de 42 bases
TTTAATTGAAAGAAGTTAA TTGAATGAAAATGATC AACTAAG
32
La secuencia de 42 bases
TTTAATTGAAAGAAGTTAA TTGAATGAAAATGATC AACTAAG
Está presente en el genoma de 10
vertebrados Hombre, chimpancé, ratón, rata,
perro, pollo, rana, pez, cebra, pez fugu,
tetraodón
33
En The Mathematics of PhylogenomicsLior
Pachter and Bernd Sturmfelshttp//arxiv.org/abs/m
ath.ST/0409132Ver también el libro Algebraic
Statistics for Computational BiologyCambridge
University Press, 2005
  • La probabilidad (de acuerdo al modelo de
    evolución de Jukes-Cantor) de que esto haya
    ocurrido por azar es aproximadamente igual a
  • 10 -50 0, 0..01
  • (50 cifras decimales)

34
Conjetura
  • Esta secuencia de 42 bases estaba en un ancestro
    común a todos estos vertebrados

35
Muchas gracias por venir!
TAGAGACGGGGGTTTCACAATGTTGGCCA
36
Agradecemos a Lior Pachter y Bernd
Sturmfels por autorizarnos a reproducir la figura
de su personaje DiaNA creado para su
libro Algebraic Statistics for Computational
Biology Cambridge University Press, 2005
Write a Comment
User Comments (0)
About PowerShow.com