Presentacin de PowerPoint - PowerPoint PPT Presentation

1 / 58
About This Presentation
Title:

Presentacin de PowerPoint

Description:

Computadores y conexi n constituidos por hardware comercial. Aprovechamiento r pido de las mejoras en la tecnolog a del hardware (microprocesadores y redes) ... – PowerPoint PPT presentation

Number of Views:42
Avg rating:3.0/5.0
Slides: 59
Provided by: jul958
Category:

less

Transcript and Presenter's Notes

Title: Presentacin de PowerPoint


1
REDES DE ALTAS PRESTACIONES Y SUS APLICACIONES
Lección 4. Interfaz de Red de Altas Prestaciones
Departamento de Arquitectura y Tecnología de
Computadores
E.T.S. Ingeniería Informática
Julio Ortega Lopera. Curso 2004/2005
2
Índice
  • Procesamiento paralelo y clusters de computadores
  • Comunicación eficiente
  • El protocolo de paso de mensajes CLIC
  • Evaluación de prestaciones
  • Conclusiones y Tendencias

Curso de Doctorado RAPyA (2004/05)
3
Arquitecturas con varios procesadores
Tendencia hacia arquitecturas con varios
procesadores resultado de la interacción
Tecnología-Mercados-Aplicaciones
Curso de Doctorado RAPyA (2004/05)
4
Arquitecturas con varios procesadores
  • Tecnología
  • Procesadores y redes de altas prestaciones
    permiten configurar plataformas paralelas
    eficientes en tiempos reducidos.
  • Limitaciones previsibles en la tecnología efecto
    de los retardos relativos crecientes y de las
    limitaciones en el consumo de potencia (12 de
    crecimiento anual de la capacidad de los
    procesadores)
  • Aplicaciones y Mercados
  • Aplicaciones que demandan velocidades y capacidad
    de memoria fuera del alcance de las plataformas
    monoprocesador (Grand Challenge)
  • Demanda elevada de disponibilidad (Internet
    mantenimiento y amplicación sin tiempos muertos)

Curso de Doctorado RAPyA (2004/05)
5
Clusters de Computadores (I)
  • Conjunto de Computadores (completos) conectados y
    utilizados como un único recurso de cómputo
  • No es una plataforma con procesadores con acceso
    uniforme a memoria y a las E/S (SMP)
  • Computadores y conexión constituidos por hardware
    comercial

Curso de Doctorado RAPyA (2004/05)
6
Proyecto phiPC
APLICACIONES
APLICACIONES

Planificación en redes de distribución
hidráulicas y

Planificación en redes de distribución
hidráulicas y
regadíos
regadíos

Predicción de series en aplicaciones financieras
y

Predicción de series en aplicaciones financieras
y
consumo de recursos
consumo de recursos
ALGORITMOS

Redes Neuronales Transformaciones
ALGORITMOS

Redes Neuronales Transformaciones
Ortogonales ARIMA en Predicción y
Ortogonales ARIMA en Predicción y
PARALELOS
PARALELOS
Aproximación Funcional
Aproximación Funcional

Optimización
Multimodal
y
Neuro
-
programación

Optimización
Multimodal
y
Neuro
-
programación
dinámica con algoritmos evolutivos
dinámica con algoritmos evolutivos
PLATAFORMAS
PLATAFORMAS
CLUSTERS Y SIST.

Interfaz de Comunicación de altas
CLUSTERS Y SIST.

Interfaz de Comunicación de altas
prestaciones.
prestaciones.
HETEROGÉNEOS
HETEROGÉNEOS
ACCESO MEDIANTE
ACCESO MEDIANTE
TIC94-0506, TIC 97-1149 TIC2000-1348
INTERNET
INTERNET
Curso de Doctorado RAPyA (2004/05)
7
Índice
  • Procesamiento paralelo y clusters de computadores
  • Comunicación eficiente
  • El protocolo de paso de mensajes CLIC
  • Evaluación de prestaciones
  • Conclusiones y Tendencias

Curso de Doctorado RAPyA (2004/05)
8

Comunicación entre Computadores (I)
Emisor
Usuario
Memoria Principal
CPU
Receptor
MMU / Bridge
Cache L2
Núcleo
tiempo
Bus E/S
NIC
Emisor
Switch / Enrutador
Switch / Enrutador
Red
Receptor
Curso de Doctorado RAPyA (2004/05)
9
Comunicación entre Computadores (II)
  • n bits transmitidos
  • M transferencias con memoria principal
  • N transferencias con E/S
  • ?t tiempo no solapado (procesamiento de
    protocolos y control de transferencias)

Despreciando el valor de L
Curso de Doctorado RAPyA (2004/05)
10
Comunicación entre Computadores (III)
Diferencia (gap) entre el hardware de red y los
servicios que requieren las aplicaciones
  • Construcción de Paquetes
  • Control de la NIC
  • Copia y Almacenamiento temporal de datos
  • Entrega ordenada y fiable de paquetes
  • Protección

Aplicaciones
Interfaz de Red (Implementa las Funciones de la
Capa de Mensajes)
Red de Interconexión
Curso de Doctorado RAPyA (2004/05)
11
Comunicación TCP/IP en Linux (I)
  • Linux implementa los protocolos del conjunto
    TCP/IP
  • Para acceder a los servicios de red se utilizan
    sockets son una interfaz de programación
    abstracta que se implementa sobre la pila de
    protocolos TCP/IP
  • La comunicación mediante TCP/IP utiliza una serie
    de estructuras de datos generadas al crear el
    socket información de cabeceras, propiedades del
    socket, tipo de protocolos, etc.

Curso de Doctorado RAPyA (2004/05)
12

Comunicación TCP/IP en Linux (II)
1-2 write(), syswrite(), sock_write(),
sock_sendmsg() 3 inet_sendmsg() llama a la
función de envío (según proto) 4 tcp_sendmsg()
crea sk_buff, trocea, copia 5 tcp_transmit_skb()
cabecera TCP para cada sk_buff 6 ip_queue_xmit()
cabecera IP 7 dev_queue_xmit() envía los sk_buff
pendientes (llama al driver)
Memoria de Usuario
4
NIC
sk_buff
Memoria de Sistema
Curso de Doctorado RAPyA (2004/05)
13
Comunicación con TCP/IP en Linux (III)
Usuario
Usuario
Ubicación de las Funciones ejecutadas para enviar
un mensaje a través de Sockets en Linux
Sockets
Sockets
write()
send
()
send
()
Núcleo
Núcleo
inet
_
sendmsg
()
inet
_
sendmsg
()
socket
socket
TCP
TCP
sk
_
buff
sk
_
buff
tcp
_
sendmsg
()
tcp
_
sendmsg
()
tcp
_
transmit
_
skb
()
tcp
_
send
_
skb
()
tcp
_
transmit
_
skb
()
tcp
_
send
_
skb
()
IP
IP
sock
sock
ip
_
queue
_
xmit
()
ip
_
queue
_
xmit
()
proto
proto
driver
del
driver
del
ip
_
queue
_
xmit
()
dev
_
queue
_
xmit
()
NIC
NIC
Acceso a la Red
Acceso a la Red
Curso de Doctorado RAPyA (2004/05)
14
Comunicación con TCP/IP en Linux (IV)
  • Causas de la ineficiencia de TCP/IP
  • Cambios de contexto
  • Transferencias de datos entre el espacio de
    usuario y las estructuras utilizadas por el
    sistema operativo
  • Tiempo de ejecución de las rutinas que
    implementan los protocolos.

Objetivos
  • Reducir el coste de la intervención del S.O. en
    la comunicación
  • Evitar copias intermedias de datos (0-copia)
  • Acelerar las transferencias memoria/NIC evitando
    involucrar al procesador en las mismas
  • Evitar las interrupciones o reducir su efecto
    (recepción)

Curso de Doctorado RAPyA (2004/05)
15
Objetivo Mejorar la Transferencia de Datos (I)
Transferencia mediante DMA
  • No interviene el procesador (salvo en la
    inicialización y al finalizar la transferencia) y
    se puede solapar la transferencia con el trabajo
    de la CPU.
  • Mejora Sin intervención del S.O., desde el
    espacio de memoria de usuario (2)
  • Evita copias
  • Evita el coste asociado a la intervención del
    S.O. (llamada, cambios de contexto, etc.)
  • Problema Interacción con el sistema de memoria
    virtual
  • La página no puede ser sustituida por el S.O.

Curso de Doctorado RAPyA (2004/05)
16
Objetivo Mejorar la Transferencia de Datos (II)
E/S Programada
  • Requiere numerosas transferencias a través del
    sistema (a ritmo de una o dos palabras) y con la
    intervención de la CPU
  • Mejora
  • No interviene el S.O.
  • Evita coste de inicialización
  • En la transferencia Interfaz-Host (recepción) no
    se utiliza dado que las lecturas a través del bus
    de E/S son mucho más lentas que el DMA

Curso de Doctorado RAPyA (2004/05)
17
Objetivo Mejorar el control de la Transferencia
de Datos Recibidos
Interrupción
Requiere un tiempo considerable en los
procesadores actuales
Curso de Doctorado RAPyA (2004/05)
18
Espacio de Diseño de las Interfaces
Curso de Doctorado RAPyA (2004/05)
19
Alternativas para la Mejora
  • Optimización de las capas de TCP/IP
  • Sustituir TCP/IP con nuevos protocolos

Curso de Doctorado RAPyA (2004/05)
20
GAMMA (Genoa Active Messages System)
  • Llamadas ligeras al SO.
  • Implementa 0-copia (1-copia MPI).
  • Modifica el controlador de la tarjeta de red
    (NIC)
  • Minimiza uso de interrupciones mediante sondeo al
    NIC latencias muy bajas medidas en condiciones
    poco realistas
  • Funciones de comunicación colectivas aprovechando
    el hardware de red
  • No implementa esquemas de control de flujo o
    protección

VIA (Virtual Interface Architecture)
  • Propuesta por Intel, Microsoft, Compaq. Interfaz
    base para Infiniband
  • Implementa 0-copia
  • Interfaz a nivel de usuario. Cola de envío y otra
    de recepción (un proceso puede usar varias colas)
  • Permite send, receive, y RDMA (acceso directo a
    memoria remota)
  • Interfaz software (estándar) y hardware
    (dependiente del medio) separadas.

Curso de Doctorado RAPyA (2004/05)
21
Índice
  • Procesamiento paralelo y clusters de computadores
  • Comunicación eficiente
  • El protocolo de paso de mensajes CLIC
  • Evaluación de prestaciones
  • Conclusiones y Tendencias

Curso de Doctorado RAPyA (2004/05)
22
Características Generales de CLIC (I)
  • Transporte fiable de mensajes optimizado para
    Clusters de Computadores.
    (Minimiza el consumo de
    recursos del S.O.)
  • Implementado sobre Linux en C.
    (Módulo en el núcleo bibliotecas de
    usuario)
  • Código reentrante. Facilita la programación
    multihebra y el funcionamiento estable
  • Utiliza los recursos del SO.
    (Planificador,
    controlador del NIC, funciones de núcleo)
  • Comunicaciones síncronas y asíncronas.

Curso de Doctorado RAPyA (2004/05)
23
Características Generales de CLIC (II)
  • Portabilidad entre sistemas Linux. Compatibilidad
    con los controladores de las tarjetas de red
    (independencia de una tarjeta que quede obsoleta)
  • Acceso compartido a la Red. Los procesos que
    necesiten comunicarse pueden acceder (a través
    del S.O.) de forma compartida y transparente a
    los recursos de red
  • Escalabilidad. Permite el uso de varios
    dispositivos de red por host para aumentar el
    ancho de banda disponible (channel bonding)
  • Soporte eficiente para sistemas de paso de
    mensajes de alto nivel MPI, PVM.
  • Control de Flujo. Funciones de control de flujo
    con retransmisión de tramas

Curso de Doctorado RAPyA (2004/05)
24
Características Generales de CLIC (III)
  • Optimización de las prestaciones de comunicación.
    Reduce
    sobrecarga SW y simplifica la pila TCP/IP

Curso de Doctorado RAPyA (2004/05)
25
Características Generales de CLIC (IV)
No utiliza 0-copia en Fast Ethernet (sí en
Gigabit Ethernet)
  • En Fast Ethernet, el cuello de botella está en la
    red, no en la memoria.

Curso de Doctorado RAPyA (2004/05)
26
Características Generales de CLIC (V)
Uso de llamadas al núcleo del SO.
  • Son llamadas eficientes que permiten aprovechar
    los recursos del S.O.
  • Alternativas Llamadas ligeras al sistema
    (Lightweight System Call)
  • Tiempos de latencia mínimos 50 ?s (tiempo E/S al
    SO es lt2)

Curso de Doctorado RAPyA (2004/05)
27
Características Generales de CLIC (VI)
Curso de Doctorado RAPyA (2004/05)
28
Mensajes y Paquetes en CLIC (I)
Paquetes Físicos en CLIC
CabeceraCLIC
Datos
EthII
MTU
  • Mejor aprovechamiento del MTU (cabeceras TCP/IP
    mayores) y menos tiempo para construir las
    cabeceras

Curso de Doctorado RAPyA (2004/05)
29
Mensajes y Paquetes en CLIC (II)
Descripción de las Cabeceras
Cab. CLIC Fija

Cab. CLIC VAR

Datos...

10 bytes (Primer paquete de un mensaje)
struct clichdr0 int tamaño / Tamaño en bytes
del envío 0..231 (2 GB) / int ident /
Información tipo trasporte / int tag
/ ident. mensaje (tid) / int tid_org / tid
origen / int tid_dst / tid destino /

12 bytes
struct clichdr short suprotocolo /
Subprotocolo enviado (CLIC, LAM/MPI, ...)
/ short orden / Tipo mensaje enviado (lectura,
escrit., ...)/ int xid / Número de
identificación del mensaje / int size
/ Tamaño en bytes del paquete / short
origen / Nodo origen, facilita proceso de
recepción / int npaquete / Número de paquete
lógico /

Curso de Doctorado RAPyA (2004/05)
30
Mensajes y Paquetes en CLIC (III)
  • Mensajes CLIC y paquetes lógicos CLIC

Mensaje CLIC
Un paquete físico en CLIC puede estar constituido
por uno o varios paquetes lógicos TCP/IP no
presenta esta posibilidad
Curso de Doctorado RAPyA (2004/05)
31
Funcionamiento de CLIC (I)
  • CLIC utiliza una Tabla de Hosts con información
    de los computadores que pueden comunicarse entre
    sí.
  • La Tabla de Host está administrada por un nodo
    principal (el primer nodo en la red actúa como
    nodo principal)
  • La Tabla se configura automáticamente, y se
    completa a medida que se van incluyendo nodos se
    les asigna un host_id invariante
  • El nodo principal mantiene la coherencia de la
    tabla y actualiza la información de que disponen
    el resto de los nodos
  • Existen protocolos para tolerar caídas del nodo
    principal
  • Los nodos son independientes y toman decisiones
    autónomamente.

Curso de Doctorado RAPyA (2004/05)
32
Funcionamiento de CLIC (II)
Estructura host estructura central en CLIC con
punteros a la lista de mensajes a enviar y
recibir en el nodo, estado del nodo, mensajes y
paquetes transmitidos, información de control de
flujo,.
struct host struct clic_d dispoMAX_DEV /
Dispositivos de un nodo / struct msgtx /
Puntero al primer mensaje lista de transmisión
/ struct msgrx / Puntero al primer mensaje
lista de recepción / int status / Estado del
nodo. (Vacio,Activo, Bloqueado,...)/ int xid
/ Número de mensajes transmitidos (los 16
bits menos significativos se utilizan como
identificación del
mensaje / int npaquete / Número de paquetes
lógicos transmitidos / struct flowc flowtx /
Información control de flujo, transmisión
/ struct flowc flowrx / Información control de
flujo, recepción / int t_tult_tx / Utilizado
por los mecanismos de seguridad / int
t_ult_rx / Utilizado por los mecanismos de
seguridad / int npackt_warn / Número de
paquetes susceptibles DoS /
Curso de Doctorado RAPyA (2004/05)
33
Funcionamiento de CLIC (III)
Estructura host
struct host struct clic_d dispoMAX_DEV /
Dispositivos de un nodo / struct msgtx /
Puntero al primer mensaje lista de transmisión
/ struct msgrx / Puntero al primer mensaje
lista de recepción / int status / Estado del
nodo. (Vacio,Activo, Bloqueado,...)/ int xid
/ Número de mensajes transmitidos (los 16
bits menos significativos identifican el
mensaje / int npaquete / Número de paquetes
lógicos transmitidos / struct flowc flowtx /
Información control de flujo, transmisión
/ struct flowc flowrx / Información control de
flujo, recepción / int t_tult_tx / Utilizado
por los mecanismos de seguridad / int
t_ult_rx / Utilizado por los mecanismos de
seguridad / int npackt_warn / Número de
paquetes susceptibles DoS /
Curso de Doctorado RAPyA (2004/05)
34
Funcionamiento de CLIC (IV)
Estructura host
clic_d
Función de envío
Lista de mensajes a transmitir msgtx
sk_buff
Lista de mensajes recibidos msgrx
Reutilización de los buffers reservados
Curso de Doctorado RAPyA (2004/05)
35
Funcionamiento de CLIC (V)
  • Emisor
  • Llamada al sistema que activa el módulo CLIC
  • Copia a sk_buff y se añade la cabecera Ethernet
  • Llamada al driver
  • Transferencia al NIC
  • Receptor
  • Se genera interrupción al llegar un paquete para
    que se ejecute el driver
  • El driver pasa los datos a la memoria de sistema
  • El driver llama a CLIC
  • Transferencia a la memoria de usuario

Curso de Doctorado RAPyA (2004/05)
36
Control de Flujo en CLIC (I)
  • Orientado a conexión entre nodos. No
    sesiones entre aplicaciones (TCP/IP).
  • Doble ventana.
    El mecanismo de confirmación controla la
    velocidad de envío.
  • Mapa de bits paquetes recibidos. Permite
    la corrección de paquetes perdidos.
  • Tamaño dinámico de ventanas.

...
...
...
Curso de Doctorado RAPyA (2004/05)
37
Control de Flujo en CLIC (II)
  • Bloqueos en el caso de control de flujo entre
    nodos

Host 1
Host 0
Aplicación A
Aplicación A
Aplicación B
Aplicación B
Aplicación C
Aplicación C
Solución Si el emisor ha enviado tres paquetes
(1500x34.5 KB) y no recibe confirmación, no
envía más. El receptor no envía confirmación
hasta que no haya recepción pendiente
Curso de Doctorado RAPyA (2004/05)
38
Control de Flujo en CLIC (III)
Estructura Host
struct host struct clic_d dispoMAX_DEV /
Dispositivos de un nodo / struct msgtx /
Puntero al primer mensaje lista de transmisión
/ struct msgrx / Puntero al primer mensaje
lista de recepción / int status / Estado del
nodo. (Vacio,Activo, Bloqueado,...)/ int xid
/ Número de mensajes transmitidos (los 16
bits menos significativos identifican el
mensaje / int npaquete / Número de paquetes
lógicos transmitidos / struct flowc flowtx /
Información control de flujo, transmisión
/ struct flowc flowrx / Información control de
flujo, recepción / int t_tult_tx / Utilizado
por los mecanismos de seguridad / int
t_ult_rx / Utilizado por los mecanismos de
seguridad / int npackt_warn / Número de
paquetes susceptibles DoS /
Contiene dos estructuras de tipo flowc utilizadas
en el algoritmo de control de flujo en el emisor
y el receptor
Curso de Doctorado RAPyA (2004/05)
39
Índice
  • Procesamiento paralelo y clusters de computadores
  • Comunicación eficiente
  • El protocolo de paso de mensajes CLIC
  • Evaluación de prestaciones
  • Conclusiones y Tendencias

Curso de Doctorado RAPyA (2004/05)
40
Comparación de CLIC con VIA y GAMMA
Anchos de banda
Plataforma Cluster 8 PII (333 MHz) 1 PII (400
MHz) Fast Ethernet Tiempos de Latencia CLIC
59 ?s (48 ?s, Pentium III 600 MHz)
Curso de Doctorado RAPyA (2004/05)
41
Channel Bonding en CLIC
  • Permite aumentar el ancho de banda en condiciones
    de gran cantidad de comunicación.

Curso de Doctorado RAPyA (2004/05)
42
PVM sobre CLIC
  • PVM-CLIC desarrollado sin utilizar fuentes PVM.
  • Todos los mensajes de PVM se convierten en
    mensajes CLIC con cabeceras de información PVM
    (comm,tid, org, dst).

Transferencias de datos (tiempos en ?s) Red Fast
Ethernet Conmutador Bay
Hasta 200 veces más rápido en el mismo host !
Curso de Doctorado RAPyA (2004/05)
43
LAM-MPI sobre CLIC
  • Implementa las funciones RPI (Request Progression
    Interface)
  • La petición (request) MPI se convierte en mensaje
    de CLIC con las características propias de MPI
    (Buffer, Síncronas, Ready) (comm,tid, org, dst)

Curso de Doctorado RAPyA (2004/05)
44
Resultados Experimentales (I)
Trasferencias de datos (tiempo en ?s) Red
Fast Ethernet Conmutador
TCP/IP se solapa con el ancho de banda de la red
CLIC ofrece bajo overhead Software
Curso de Doctorado RAPyA (2004/05)
45
Resultados Experimentales (II)
Producto matricial
Mejora de MPI-CLIC frente a MPI-TCP
A mayor número de nodos, CLIC ofrece mejores
prestaciones
Curso de Doctorado RAPyA (2004/05)
46
Resultados Experimentales (III)
Linpack
Linpack tiene mayor parte computacional que de
comunicaciones.
Mejora de MPI-CLIC frente a MPI-TCP
Curso de Doctorado RAPyA (2004/05)
47
CLIC en Gigabit Ethernet (I)
  • Opciones de optimización desestimadas para Fast
    Ethernet deben tenerse en cuenta al aumentar el
    ancho de banda de la red
  • La utilización del procesador es inaceptablemente
    elevada para MTU de 1500 bytes

Interrupciones cada 12 ?s
(1500
bytes x 8 bits/byte x 0.001 ?s/bit 12
?s) Dificultad para atender interrupciones
(latencias de 10-20 ?s en PCI 33MHz
Curso de Doctorado RAPyA (2004/05)
48
CLIC en Gigabit Ethernet (II)
  • Las tarjetas de red han mejorado sus
    prestaciones, con más almacenamiento, y
    facilitando la 0-copia, el DMA, etc.
  • Técnicas incorporadas en CLIC para Gigabit
    Ethernet
  • Habilitar 0-copia en la emisión
  • Tramas Jumbo (9000 bytes)
  • Fusión de Interrupciones (Coalesced interrupt)

Curso de Doctorado RAPyA (2004/05)
49
CLIC en Gigabit Ethernet (III)
TCP/IP
Curso de Doctorado RAPyA (2004/05)
50
CLIC en Gigabit Ethernet (IV)
Efecto del uso de tramas Jumbo (MTU9000) y
0-copia
Tarjetas Ethernet/PCI SMC9462TX
3C985B-SX PCI 33MHz 32 bits
  • Anchos de banda máximos de unos 600 Mbit/s
  • Latencia (0 bytes) 28 microsegundos

Curso de Doctorado RAPyA (2004/05)
51
CLIC en Gigabit Ethernet (V)
Comparación de anchos de banda de CLIC y TCP/IP
(con 0-copia)
  • 50 del ancho de banda máximo a 4096 bytes (16 KB
    en TCP/IP)
  • Crecimiento más rápido del ancho de banda con el
    tamaño

Curso de Doctorado RAPyA (2004/05)
52
CLIC en Gigabit Ethernet (VI)
Comparación de anchos de banda de CLIC, MPI-CLIC,
MPI y PVM
  • MPI-CLIC proporciona más de 1.5 veces el ancho de
    banda de MPI sobre TCP

Curso de Doctorado RAPyA (2004/05)
53
Índice
  • Procesamiento paralelo y clusters de computadores
  • Comunicación eficiente
  • El protocolo de paso de mensajes CLIC
  • Evaluación de prestaciones
  • Conclusiones y Tendencias

Curso de Doctorado RAPyA (2004/05)
54
Perspectivas de mejora (I)
Reducir el coste de procesamiento de
interrupciones
Reducción considerable del tiempo de latencia
para mensajes cortos
Curso de Doctorado RAPyA (2004/05)
55
Perspectivas de mejora (II)
  • Interfaces de Red Inteligentes (INIC)
    Procesadores en la NIC
  • La CPU no tiene que procesar los protocolos
    aumenta su disponibilidad y el solapamiento
    comunicación/computación.
  • La tarjeta de red puede interaccionar con la red
    sin intervención de la CPU (1) menos latencia en
    el protocolo de comunicación y (2) la CPU no
    tiene que procesar interrupciones.
  • Se mejora la eficiencia de las transferencias de
    DMA NIC/memoria la NIC ensambla paquetes cortos
    y hace una única transferencia.
  • Evita el uso del bus de E/S.
  • Gestión dinámica de protocolos utilizar el
    protocolo más adecuado según los datos a
    comunicar y el destino.

Curso de Doctorado RAPyA (2004/05)
56
Perspectivas de mejora (III)
Existen en el mercado INICs, incluso con varios
procesadores QsNet, AceNIC, I2O,
Myrinet Posibilidad de utilizar hardware
reconfigurable para desarrollo
FPGAs de la familia Virtex-II Pro de Xilinx
pueden incluir hasta 4 procesadores PowerPC 405
empotrados
Proyecto Explotación Eficiente de Arquitecturas
Paralelas. Aplicaciones, Herramientas, y
Comunicación
Curso de Doctorado RAPyA (2004/05)
57
Perspectivas de mejora (IV)
Hay que mejorar el ancho de banda que
proporcionan los buses de E/S
Comparación de mejoras respecto a PCI 33MHz/32
bits para PCI 66MHz/64 bits y NIC conecatada al
bus del sistema
Curso de Doctorado RAPyA (2004/05)
58
Perspectivas de mejora (V)
  • Infiniband
  • Arquitectura de interconexión para la E/S y para
    la comunicación entre procesos
  • No existe ningún bus de E/S la conexión del
    adaptador de canal (CA) se realiza directamente
    al controlador del sistema para el DMA.

Infiniband Linux Sourceforge
Sockets sobre CLIC
Curso de Doctorado RAPyA (2004/05)
59
Publicaciones y Proyectos Relacionados (I)
  • Implementación de Mensajes Activos en un Cluster
    de PCs . SEID99. 1999
  • CLIC Comunicación Eficiente en Clusters con
    Linux. Jornadas de Paralelismo. 2000.
  • Implementación de MPI sobre el protocolo CLIC.
    Jornadas de Paralelismo. Septiembre 2001.
  • El Protocolo CLIC en Gigabit Ethernet. XIII
    Jornadas de Paralelismo. Lleida, 2002
  • Proyecto TIC97-1149 Algoritmos y Arquitecturas
    Masivamente Paralelas para problemas de
    Optimización en Multicomputadores y Redes de
    Computadores
  • Proyecto TIC2000-1348Procedimientos Híbridos
    para la Optimización Paralela en Clusters.
    Aplicaciones en Planificación y Predicción
  • Tesis Doctoral Comunicación eficiente en redes
    de área local para procesamiento paralelo en
    clusters

Curso de Doctorado RAPyA (2004/05)
60
Publicaciones y Proyectos Relacionados (II)
  • CLIC Fast Communication on Linux Clusters.
    IEEE International Conference on
    Cluster Computing (CLUSTER2000). Noviembre 2000.
  • The Light Weight Protocol CLIC Performance of an
    MPI implementation on CLIC.
    IEEE International
    Conference on Cluster Computing (CLUSTER2001).
    Octubre 2001.
  • An efficient OS support for Communication on
    Linux Clusters. Workshop on Scheduling and
    Resource Management for Cluster Computing,
    ICPP'2001, Septiembre, 2001
  • The Lightweight Protocol CLIC on Gigabit
    Ethernet. Workshop on Communication Architecture
    for Clusters, 17th Int. Parallel Distributed
    Processing Symp.(IPDPS03), pp.143-. Abril, 2003.

Curso de Doctorado RAPyA (2004/05)
Write a Comment
User Comments (0)
About PowerShow.com