Title: Programmazione Dinamica: tecnica risolutiva che conduce all
1Programmazione Dinamica tecnica risolutiva che
conduce allottimo, non fornisce algoritmi
risolutivi generali.
- Stadi fasi in cui il problema è scomposto (es.
Unità temporali), s sia il generico stadio, n gli
stadi - Stati situazione del sistema in esame
allistante (o stadio) considerato. - Variabili di stato descrittori dello stato,
rappresentate da un vettore. Se le variabili di
stato (o stati) sono m, il Vettore di stato allo
stadio s è
spazio degli stati (insieme dei possibili stati)
2- Decisione
- Trasformazione
- Politica ? insieme ordinato di decisioni, tante
quanti sono gli stadi. - ?? ?, ? spazio delle politiche (o insieme
delle possibili politiche)
è una decisione (o variabile decisionale)
funzione di trasformazione
fine processo
prodotto cartesiano.
3- Profitto (o costo) guadagno (o costo ) associato
ad ogni decisione(cambiamento di stato) - obiettivo max (min) profitto (costo)
complessivo. - Funzioni di stato funzioni che, stadio per
stadio, assumono valore ottimo della f.o.
funzione profitto associata allo stato iniziale ?
e alla politica ?
4Principio di ottimalità di Bellman
Data una politica ottima
Qualunque sia lo stato iniziale
e la decisione iniziale
le rimanenti decisioni
forniscono una politica ottima per i
restanti n-1 stadi
5Esempio investimento capitali
D capitale totale, I1,...,I5 profitto delle
n5 forme di investimento (stadi)
Hp. Ii D/5 , i1,...,5,D/5 quantità fissa
impiegabile in ciascuna forma
dinvestimento
Stessa quota per ogni stadio
Se si investe in 4 stadi
Se si investe in 3 stadi
n5 ? 31 possibilità n20 ? 106 possibilità
Se si investe in 2 stadi
Se si investe in 1 stadio
6Investimento capitali con PD
Ii quota impiegata nellinvestimento i , Alla
fine tutta la somma deve essere investita
- Allultimo stadio sn5 si deve investire tutto
il denaro rimasto, se si è investito nelle prime
4 forme, nellultima si investe il rimanente (da
principio di Bellman) - Se abbiamo investito nelle prime 3 forme,si
decide quanto assegnare a I4 e lasciare per I5. - Ad ogni stadio k non si tiene conto degli
investimenti agli stadi precedenti, ma solo
quelli agli stadi successivi (la politica deve
essere ottima a prescindere dallo stato di
partenza del k-esimo stadio).
7Relazioni ricorrenti
- Hp. Per l applicazione della PD
- Separabilità della F.O.
- Separabilità degli stati Proprietà Markoviana
degli stati - a stadio s , nello stato ? s , con decisione xs
si passa a stato ? s1 - che dipende solo da xs e ? s ( indipendente da ?
0 , ? 1 ,.., ? s-1 )
Relazione ricorrente
operatore per separabilità
8Numerazione inversa
Relazioni ricorrenti
9Problema della diligenza
Scelta corsa di costo min
Costi
f113
f211
1
2
3
4
10s1
s2
s3
s4
s5
s5
s4
11s4
s3
12s3
s2
13s2
s1
14Processi monodimensionali
- Allocazione di una sola risorsa. Es.1
Hp.
Relazioni ricorrenti
15Analiticamente
16Profitto ottimo nel processo a 3 stadi è
quantità da allocare
Vale per
17(No Transcript)
18max intero contenuto in
19Esempi di problemi monodimensionali
- Problema dei trasporti
- Problema dello zaino
- Problema di sostituzione macchinario
20Sostituzione macchinario valutare periodo
migliore per la sostituzione
t età della macchina P(t)produttività
M(t)costo manutenzione S(t)costo
sostituzione
21Relazione ricorrente
22Esempioper una macchina che inizialmente ha 2
anni decidere anno per anno, per un periodo di 5
anni(stadi) se tenere(T) o cambiare(C) la macchina
23 245o anno
254o anno
263o anno
27Profitto max68
28Processi multidimensionali
Dimensione numero di variabili di stato per
ogni stadio Aumento calcoli ? tecniche di
riduzione Moltiplicatori di Lagrange,
Approssimazioni successive
Problemi bidimensionali
29Stadio s
Stadio 1
Stadio n
Processo a ritroso
30Esempio numericocaso bidimensionale
1o stadio
312o stadio
3o stadio
32Sostituzione macchinario caso bidimensionale
33(No Transcript)
34Affidabilità di circuiti
n
j
1
xj
xj numero di componenti in parallelo
p(xj ) prob di succeso allo stadio j cj costo
di un componente allo stadio j wj peso di un
componente allo stadio j
35var decisionale
var stato
1o stadio
Jo stadio
36(No Transcript)
37Problemi con più variabili decisionali
Es. Caso bidimensionale
38Metodi di riduzione moltiplicatori di Lagrange
P1
Problema non vincolato
P2
Teor.1 Sia x0 soluzione ottima per P2
soddisfacente gli m vincoli, allora x0 è
soluzione ottima per P1.
39monodimensionale
Fissato si risolve con la PD
40(No Transcript)
41Come si varia ? per trovare la soluzione ottima?
Teor.2 Quando aumenta da 0 a ?,
decresce
monotonamente.
- Procedimento iterativo
- i0
- Fissiamo un arbitrario valore
- Risolviamo con PD
42- Procedimento iterativo
- i0
- Fissiamo un arbitrario valore
- Risolviamo con PD
- Se
-
- Se
- Se
43Esempiocon moltiplicatori di Lagrange
Rilassando il vincolo di interezza i vincoli
sono soddisfatti con luguaglianza.
44Risoluzione con PD
Risolviamo il problema intero, rilassando il
primo vincolo
45o 3
46La soluzione trovata non soddisfa
allaumentare di decresce
47Approssimazioni Successive
48generico passo k
massimo globale?
49Esempio con approssimazioni successive
50primo passo (k0,iter 1), 1o stadio PD
512o stadio PD (k0,iter1)
523o stadio PD (k0,iter1)
53primo passo (k0,iter 2), 1o stadio PD
k1
54NOProblema dei trasporti con PD
Allo stadio k decidere quantità di merce da
trasportare da ogni deposito alla
k-esima destinazione. Variabili di stato
quantità di merce da allocare rimasta fino
a quel momento negli m depositi
dove