Title: Presentacin de PowerPoint
1REDES DE ALTAS PRESTACIONES Y SUS APLICACIONES
Lección 4. Interfaz de Red de Altas Prestaciones
Departamento de Arquitectura y Tecnología de
Computadores
E.T.S. Ingeniería Informática
Julio Ortega Lopera. Curso 2004/2005
2Índice
- Procesamiento paralelo y clusters de computadores
- Comunicación eficiente
- El protocolo de paso de mensajes CLIC
- Evaluación de prestaciones
- Conclusiones y Tendencias
Curso de Doctorado RAPyA (2004/05)
3Arquitecturas con varios procesadores
Tendencia hacia arquitecturas con varios
procesadores resultado de la interacción
Tecnología-Mercados-Aplicaciones
Curso de Doctorado RAPyA (2004/05)
4Arquitecturas con varios procesadores
- Tecnología
- Procesadores y redes de altas prestaciones
permiten configurar plataformas paralelas
eficientes en tiempos reducidos. - Limitaciones previsibles en la tecnología efecto
de los retardos relativos crecientes y de las
limitaciones en el consumo de potencia (12 de
crecimiento anual de la capacidad de los
procesadores) - Aplicaciones y Mercados
- Aplicaciones que demandan velocidades y capacidad
de memoria fuera del alcance de las plataformas
monoprocesador (Grand Challenge) - Demanda elevada de disponibilidad (Internet
mantenimiento y amplicación sin tiempos muertos)
Curso de Doctorado RAPyA (2004/05)
5Clusters de Computadores (I)
- Conjunto de Computadores (completos) conectados y
utilizados como un único recurso de cómputo - No es una plataforma con procesadores con acceso
uniforme a memoria y a las E/S (SMP) - Computadores y conexión constituidos por hardware
comercial
Curso de Doctorado RAPyA (2004/05)
6Proyecto phiPC
APLICACIONES
APLICACIONES
Planificación en redes de distribución
hidráulicas y
Planificación en redes de distribución
hidráulicas y
regadíos
regadíos
Predicción de series en aplicaciones financieras
y
Predicción de series en aplicaciones financieras
y
consumo de recursos
consumo de recursos
ALGORITMOS
Redes Neuronales Transformaciones
ALGORITMOS
Redes Neuronales Transformaciones
Ortogonales ARIMA en Predicción y
Ortogonales ARIMA en Predicción y
PARALELOS
PARALELOS
Aproximación Funcional
Aproximación Funcional
Optimización
Multimodal
y
Neuro
-
programación
Optimización
Multimodal
y
Neuro
-
programación
dinámica con algoritmos evolutivos
dinámica con algoritmos evolutivos
PLATAFORMAS
PLATAFORMAS
CLUSTERS Y SIST.
Interfaz de Comunicación de altas
CLUSTERS Y SIST.
Interfaz de Comunicación de altas
prestaciones.
prestaciones.
HETEROGÉNEOS
HETEROGÉNEOS
ACCESO MEDIANTE
ACCESO MEDIANTE
TIC94-0506, TIC 97-1149 TIC2000-1348
INTERNET
INTERNET
Curso de Doctorado RAPyA (2004/05)
7Índice
- Procesamiento paralelo y clusters de computadores
- Comunicación eficiente
- El protocolo de paso de mensajes CLIC
- Evaluación de prestaciones
- Conclusiones y Tendencias
Curso de Doctorado RAPyA (2004/05)
8 Comunicación entre Computadores (I)
Emisor
Usuario
Memoria Principal
CPU
Receptor
MMU / Bridge
Cache L2
Núcleo
tiempo
Bus E/S
NIC
Emisor
Switch / Enrutador
Switch / Enrutador
Red
Receptor
Curso de Doctorado RAPyA (2004/05)
9Comunicación entre Computadores (II)
- n bits transmitidos
- M transferencias con memoria principal
- N transferencias con E/S
- ?t tiempo no solapado (procesamiento de
protocolos y control de transferencias)
Despreciando el valor de L
Curso de Doctorado RAPyA (2004/05)
10Comunicación entre Computadores (III)
Diferencia (gap) entre el hardware de red y los
servicios que requieren las aplicaciones
- Construcción de Paquetes
- Control de la NIC
- Copia y Almacenamiento temporal de datos
- Entrega ordenada y fiable de paquetes
- Protección
Aplicaciones
Interfaz de Red (Implementa las Funciones de la
Capa de Mensajes)
Red de Interconexión
Curso de Doctorado RAPyA (2004/05)
11Comunicación TCP/IP en Linux (I)
- Linux implementa los protocolos del conjunto
TCP/IP - Para acceder a los servicios de red se utilizan
sockets son una interfaz de programación
abstracta que se implementa sobre la pila de
protocolos TCP/IP - La comunicación mediante TCP/IP utiliza una serie
de estructuras de datos generadas al crear el
socket información de cabeceras, propiedades del
socket, tipo de protocolos, etc.
Curso de Doctorado RAPyA (2004/05)
12 Comunicación TCP/IP en Linux (II)
1-2 write(), syswrite(), sock_write(),
sock_sendmsg() 3 inet_sendmsg() llama a la
función de envío (según proto) 4 tcp_sendmsg()
crea sk_buff, trocea, copia 5 tcp_transmit_skb()
cabecera TCP para cada sk_buff 6 ip_queue_xmit()
cabecera IP 7 dev_queue_xmit() envía los sk_buff
pendientes (llama al driver)
Memoria de Usuario
4
NIC
sk_buff
Memoria de Sistema
Curso de Doctorado RAPyA (2004/05)
13Comunicación con TCP/IP en Linux (III)
Usuario
Usuario
Ubicación de las Funciones ejecutadas para enviar
un mensaje a través de Sockets en Linux
Sockets
Sockets
write()
send
()
send
()
Núcleo
Núcleo
inet
_
sendmsg
()
inet
_
sendmsg
()
socket
socket
TCP
TCP
sk
_
buff
sk
_
buff
tcp
_
sendmsg
()
tcp
_
sendmsg
()
tcp
_
transmit
_
skb
()
tcp
_
send
_
skb
()
tcp
_
transmit
_
skb
()
tcp
_
send
_
skb
()
IP
IP
sock
sock
ip
_
queue
_
xmit
()
ip
_
queue
_
xmit
()
proto
proto
driver
del
driver
del
ip
_
queue
_
xmit
()
dev
_
queue
_
xmit
()
NIC
NIC
Acceso a la Red
Acceso a la Red
Curso de Doctorado RAPyA (2004/05)
14Comunicación con TCP/IP en Linux (IV)
- Causas de la ineficiencia de TCP/IP
- Cambios de contexto
- Transferencias de datos entre el espacio de
usuario y las estructuras utilizadas por el
sistema operativo - Tiempo de ejecución de las rutinas que
implementan los protocolos.
Objetivos
- Reducir el coste de la intervención del S.O. en
la comunicación - Evitar copias intermedias de datos (0-copia)
- Acelerar las transferencias memoria/NIC evitando
involucrar al procesador en las mismas - Evitar las interrupciones o reducir su efecto
(recepción)
Curso de Doctorado RAPyA (2004/05)
15Objetivo Mejorar la Transferencia de Datos (I)
Transferencia mediante DMA
- No interviene el procesador (salvo en la
inicialización y al finalizar la transferencia) y
se puede solapar la transferencia con el trabajo
de la CPU. - Mejora Sin intervención del S.O., desde el
espacio de memoria de usuario (2) - Evita copias
- Evita el coste asociado a la intervención del
S.O. (llamada, cambios de contexto, etc.) - Problema Interacción con el sistema de memoria
virtual - La página no puede ser sustituida por el S.O.
Curso de Doctorado RAPyA (2004/05)
16Objetivo Mejorar la Transferencia de Datos (II)
E/S Programada
- Requiere numerosas transferencias a través del
sistema (a ritmo de una o dos palabras) y con la
intervención de la CPU - Mejora
- No interviene el S.O.
- Evita coste de inicialización
- En la transferencia Interfaz-Host (recepción) no
se utiliza dado que las lecturas a través del bus
de E/S son mucho más lentas que el DMA
Curso de Doctorado RAPyA (2004/05)
17Objetivo Mejorar el control de la Transferencia
de Datos Recibidos
Interrupción
Requiere un tiempo considerable en los
procesadores actuales
Curso de Doctorado RAPyA (2004/05)
18Espacio de Diseño de las Interfaces
Curso de Doctorado RAPyA (2004/05)
19Alternativas para la Mejora
- Optimización de las capas de TCP/IP
- Sustituir TCP/IP con nuevos protocolos
Curso de Doctorado RAPyA (2004/05)
20GAMMA (Genoa Active Messages System)
- Llamadas ligeras al SO.
- Implementa 0-copia (1-copia MPI).
- Modifica el controlador de la tarjeta de red
(NIC) - Minimiza uso de interrupciones mediante sondeo al
NIC latencias muy bajas medidas en condiciones
poco realistas - Funciones de comunicación colectivas aprovechando
el hardware de red - No implementa esquemas de control de flujo o
protección
VIA (Virtual Interface Architecture)
- Propuesta por Intel, Microsoft, Compaq. Interfaz
base para Infiniband - Implementa 0-copia
- Interfaz a nivel de usuario. Cola de envío y otra
de recepción (un proceso puede usar varias colas) - Permite send, receive, y RDMA (acceso directo a
memoria remota) - Interfaz software (estándar) y hardware
(dependiente del medio) separadas.
Curso de Doctorado RAPyA (2004/05)
21Índice
- Procesamiento paralelo y clusters de computadores
- Comunicación eficiente
- El protocolo de paso de mensajes CLIC
- Evaluación de prestaciones
- Conclusiones y Tendencias
Curso de Doctorado RAPyA (2004/05)
22Características Generales de CLIC (I)
- Transporte fiable de mensajes optimizado para
Clusters de Computadores.
(Minimiza el consumo de
recursos del S.O.) - Implementado sobre Linux en C.
(Módulo en el núcleo bibliotecas de
usuario) - Código reentrante. Facilita la programación
multihebra y el funcionamiento estable - Utiliza los recursos del SO.
(Planificador,
controlador del NIC, funciones de núcleo) - Comunicaciones síncronas y asíncronas.
Curso de Doctorado RAPyA (2004/05)
23Características Generales de CLIC (II)
- Portabilidad entre sistemas Linux. Compatibilidad
con los controladores de las tarjetas de red
(independencia de una tarjeta que quede obsoleta)
- Acceso compartido a la Red. Los procesos que
necesiten comunicarse pueden acceder (a través
del S.O.) de forma compartida y transparente a
los recursos de red - Escalabilidad. Permite el uso de varios
dispositivos de red por host para aumentar el
ancho de banda disponible (channel bonding) - Soporte eficiente para sistemas de paso de
mensajes de alto nivel MPI, PVM.
- Control de Flujo. Funciones de control de flujo
con retransmisión de tramas
Curso de Doctorado RAPyA (2004/05)
24Características Generales de CLIC (III)
- Optimización de las prestaciones de comunicación.
Reduce
sobrecarga SW y simplifica la pila TCP/IP
Curso de Doctorado RAPyA (2004/05)
25Características Generales de CLIC (IV)
No utiliza 0-copia en Fast Ethernet (sí en
Gigabit Ethernet)
- En Fast Ethernet, el cuello de botella está en la
red, no en la memoria.
Curso de Doctorado RAPyA (2004/05)
26Características Generales de CLIC (V)
Uso de llamadas al núcleo del SO.
- Son llamadas eficientes que permiten aprovechar
los recursos del S.O. - Alternativas Llamadas ligeras al sistema
(Lightweight System Call) - Tiempos de latencia mínimos 50 ?s (tiempo E/S al
SO es lt2)
Curso de Doctorado RAPyA (2004/05)
27Características Generales de CLIC (VI)
Curso de Doctorado RAPyA (2004/05)
28Mensajes y Paquetes en CLIC (I)
Paquetes Físicos en CLIC
CabeceraCLIC
Datos
EthII
MTU
- Mejor aprovechamiento del MTU (cabeceras TCP/IP
mayores) y menos tiempo para construir las
cabeceras
Curso de Doctorado RAPyA (2004/05)
29Mensajes y Paquetes en CLIC (II)
Descripción de las Cabeceras
Cab. CLIC Fija
Cab. CLIC VAR
Datos...
10 bytes (Primer paquete de un mensaje)
struct clichdr0 int tamaño / Tamaño en bytes
del envío 0..231 (2 GB) / int ident /
Información tipo trasporte / int tag
/ ident. mensaje (tid) / int tid_org / tid
origen / int tid_dst / tid destino /
12 bytes
struct clichdr short suprotocolo /
Subprotocolo enviado (CLIC, LAM/MPI, ...)
/ short orden / Tipo mensaje enviado (lectura,
escrit., ...)/ int xid / Número de
identificación del mensaje / int size
/ Tamaño en bytes del paquete / short
origen / Nodo origen, facilita proceso de
recepción / int npaquete / Número de paquete
lógico /
Curso de Doctorado RAPyA (2004/05)
30Mensajes y Paquetes en CLIC (III)
- Mensajes CLIC y paquetes lógicos CLIC
Mensaje CLIC
Un paquete físico en CLIC puede estar constituido
por uno o varios paquetes lógicos TCP/IP no
presenta esta posibilidad
Curso de Doctorado RAPyA (2004/05)
31Funcionamiento de CLIC (I)
- CLIC utiliza una Tabla de Hosts con información
de los computadores que pueden comunicarse entre
sí. - La Tabla de Host está administrada por un nodo
principal (el primer nodo en la red actúa como
nodo principal) - La Tabla se configura automáticamente, y se
completa a medida que se van incluyendo nodos se
les asigna un host_id invariante - El nodo principal mantiene la coherencia de la
tabla y actualiza la información de que disponen
el resto de los nodos - Existen protocolos para tolerar caídas del nodo
principal - Los nodos son independientes y toman decisiones
autónomamente.
Curso de Doctorado RAPyA (2004/05)
32Funcionamiento de CLIC (II)
Estructura host estructura central en CLIC con
punteros a la lista de mensajes a enviar y
recibir en el nodo, estado del nodo, mensajes y
paquetes transmitidos, información de control de
flujo,.
struct host struct clic_d dispoMAX_DEV /
Dispositivos de un nodo / struct msgtx /
Puntero al primer mensaje lista de transmisión
/ struct msgrx / Puntero al primer mensaje
lista de recepción / int status / Estado del
nodo. (Vacio,Activo, Bloqueado,...)/ int xid
/ Número de mensajes transmitidos (los 16
bits menos significativos se utilizan como
identificación del
mensaje / int npaquete / Número de paquetes
lógicos transmitidos / struct flowc flowtx /
Información control de flujo, transmisión
/ struct flowc flowrx / Información control de
flujo, recepción / int t_tult_tx / Utilizado
por los mecanismos de seguridad / int
t_ult_rx / Utilizado por los mecanismos de
seguridad / int npackt_warn / Número de
paquetes susceptibles DoS /
Curso de Doctorado RAPyA (2004/05)
33Funcionamiento de CLIC (III)
Estructura host
struct host struct clic_d dispoMAX_DEV /
Dispositivos de un nodo / struct msgtx /
Puntero al primer mensaje lista de transmisión
/ struct msgrx / Puntero al primer mensaje
lista de recepción / int status / Estado del
nodo. (Vacio,Activo, Bloqueado,...)/ int xid
/ Número de mensajes transmitidos (los 16
bits menos significativos identifican el
mensaje / int npaquete / Número de paquetes
lógicos transmitidos / struct flowc flowtx /
Información control de flujo, transmisión
/ struct flowc flowrx / Información control de
flujo, recepción / int t_tult_tx / Utilizado
por los mecanismos de seguridad / int
t_ult_rx / Utilizado por los mecanismos de
seguridad / int npackt_warn / Número de
paquetes susceptibles DoS /
Curso de Doctorado RAPyA (2004/05)
34Funcionamiento de CLIC (IV)
Estructura host
clic_d
Función de envío
Lista de mensajes a transmitir msgtx
sk_buff
Lista de mensajes recibidos msgrx
Reutilización de los buffers reservados
Curso de Doctorado RAPyA (2004/05)
35Funcionamiento de CLIC (V)
- Emisor
- Llamada al sistema que activa el módulo CLIC
- Copia a sk_buff y se añade la cabecera Ethernet
- Llamada al driver
- Transferencia al NIC
- Receptor
- Se genera interrupción al llegar un paquete para
que se ejecute el driver - El driver pasa los datos a la memoria de sistema
- El driver llama a CLIC
- Transferencia a la memoria de usuario
Curso de Doctorado RAPyA (2004/05)
36Control de Flujo en CLIC (I)
- Orientado a conexión entre nodos. No
sesiones entre aplicaciones (TCP/IP). - Doble ventana.
El mecanismo de confirmación controla la
velocidad de envío. - Mapa de bits paquetes recibidos. Permite
la corrección de paquetes perdidos. - Tamaño dinámico de ventanas.
...
...
...
Curso de Doctorado RAPyA (2004/05)
37Control de Flujo en CLIC (II)
- Bloqueos en el caso de control de flujo entre
nodos
Host 1
Host 0
Aplicación A
Aplicación A
Aplicación B
Aplicación B
Aplicación C
Aplicación C
Solución Si el emisor ha enviado tres paquetes
(1500x34.5 KB) y no recibe confirmación, no
envía más. El receptor no envía confirmación
hasta que no haya recepción pendiente
Curso de Doctorado RAPyA (2004/05)
38Control de Flujo en CLIC (III)
Estructura Host
struct host struct clic_d dispoMAX_DEV /
Dispositivos de un nodo / struct msgtx /
Puntero al primer mensaje lista de transmisión
/ struct msgrx / Puntero al primer mensaje
lista de recepción / int status / Estado del
nodo. (Vacio,Activo, Bloqueado,...)/ int xid
/ Número de mensajes transmitidos (los 16
bits menos significativos identifican el
mensaje / int npaquete / Número de paquetes
lógicos transmitidos / struct flowc flowtx /
Información control de flujo, transmisión
/ struct flowc flowrx / Información control de
flujo, recepción / int t_tult_tx / Utilizado
por los mecanismos de seguridad / int
t_ult_rx / Utilizado por los mecanismos de
seguridad / int npackt_warn / Número de
paquetes susceptibles DoS /
Contiene dos estructuras de tipo flowc utilizadas
en el algoritmo de control de flujo en el emisor
y el receptor
Curso de Doctorado RAPyA (2004/05)
39Índice
- Procesamiento paralelo y clusters de computadores
- Comunicación eficiente
- El protocolo de paso de mensajes CLIC
- Evaluación de prestaciones
- Conclusiones y Tendencias
Curso de Doctorado RAPyA (2004/05)
40Comparación de CLIC con VIA y GAMMA
Anchos de banda
Plataforma Cluster 8 PII (333 MHz) 1 PII (400
MHz) Fast Ethernet Tiempos de Latencia CLIC
59 ?s (48 ?s, Pentium III 600 MHz)
Curso de Doctorado RAPyA (2004/05)
41Channel Bonding en CLIC
- Permite aumentar el ancho de banda en condiciones
de gran cantidad de comunicación.
Curso de Doctorado RAPyA (2004/05)
42PVM sobre CLIC
- PVM-CLIC desarrollado sin utilizar fuentes PVM.
- Todos los mensajes de PVM se convierten en
mensajes CLIC con cabeceras de información PVM
(comm,tid, org, dst).
Transferencias de datos (tiempos en ?s) Red Fast
Ethernet Conmutador Bay
Hasta 200 veces más rápido en el mismo host !
Curso de Doctorado RAPyA (2004/05)
43LAM-MPI sobre CLIC
- Implementa las funciones RPI (Request Progression
Interface) - La petición (request) MPI se convierte en mensaje
de CLIC con las características propias de MPI
(Buffer, Síncronas, Ready) (comm,tid, org, dst)
Curso de Doctorado RAPyA (2004/05)
44Resultados Experimentales (I)
Trasferencias de datos (tiempo en ?s) Red
Fast Ethernet Conmutador
TCP/IP se solapa con el ancho de banda de la red
CLIC ofrece bajo overhead Software
Curso de Doctorado RAPyA (2004/05)
45Resultados Experimentales (II)
Producto matricial
Mejora de MPI-CLIC frente a MPI-TCP
A mayor número de nodos, CLIC ofrece mejores
prestaciones
Curso de Doctorado RAPyA (2004/05)
46Resultados Experimentales (III)
Linpack
Linpack tiene mayor parte computacional que de
comunicaciones.
Mejora de MPI-CLIC frente a MPI-TCP
Curso de Doctorado RAPyA (2004/05)
47CLIC en Gigabit Ethernet (I)
- Opciones de optimización desestimadas para Fast
Ethernet deben tenerse en cuenta al aumentar el
ancho de banda de la red - La utilización del procesador es inaceptablemente
elevada para MTU de 1500 bytes
Interrupciones cada 12 ?s
(1500
bytes x 8 bits/byte x 0.001 ?s/bit 12
?s) Dificultad para atender interrupciones
(latencias de 10-20 ?s en PCI 33MHz
Curso de Doctorado RAPyA (2004/05)
48CLIC en Gigabit Ethernet (II)
- Las tarjetas de red han mejorado sus
prestaciones, con más almacenamiento, y
facilitando la 0-copia, el DMA, etc. - Técnicas incorporadas en CLIC para Gigabit
Ethernet - Habilitar 0-copia en la emisión
- Tramas Jumbo (9000 bytes)
- Fusión de Interrupciones (Coalesced interrupt)
Curso de Doctorado RAPyA (2004/05)
49CLIC en Gigabit Ethernet (III)
TCP/IP
Curso de Doctorado RAPyA (2004/05)
50CLIC en Gigabit Ethernet (IV)
Efecto del uso de tramas Jumbo (MTU9000) y
0-copia
Tarjetas Ethernet/PCI SMC9462TX
3C985B-SX PCI 33MHz 32 bits
- Anchos de banda máximos de unos 600 Mbit/s
- Latencia (0 bytes) 28 microsegundos
Curso de Doctorado RAPyA (2004/05)
51CLIC en Gigabit Ethernet (V)
Comparación de anchos de banda de CLIC y TCP/IP
(con 0-copia)
- 50 del ancho de banda máximo a 4096 bytes (16 KB
en TCP/IP) - Crecimiento más rápido del ancho de banda con el
tamaño
Curso de Doctorado RAPyA (2004/05)
52CLIC en Gigabit Ethernet (VI)
Comparación de anchos de banda de CLIC, MPI-CLIC,
MPI y PVM
- MPI-CLIC proporciona más de 1.5 veces el ancho de
banda de MPI sobre TCP
Curso de Doctorado RAPyA (2004/05)
53Índice
- Procesamiento paralelo y clusters de computadores
- Comunicación eficiente
- El protocolo de paso de mensajes CLIC
- Evaluación de prestaciones
- Conclusiones y Tendencias
Curso de Doctorado RAPyA (2004/05)
54Perspectivas de mejora (I)
Reducir el coste de procesamiento de
interrupciones
Reducción considerable del tiempo de latencia
para mensajes cortos
Curso de Doctorado RAPyA (2004/05)
55Perspectivas de mejora (II)
- Interfaces de Red Inteligentes (INIC)
Procesadores en la NIC - La CPU no tiene que procesar los protocolos
aumenta su disponibilidad y el solapamiento
comunicación/computación. - La tarjeta de red puede interaccionar con la red
sin intervención de la CPU (1) menos latencia en
el protocolo de comunicación y (2) la CPU no
tiene que procesar interrupciones. - Se mejora la eficiencia de las transferencias de
DMA NIC/memoria la NIC ensambla paquetes cortos
y hace una única transferencia. - Evita el uso del bus de E/S.
- Gestión dinámica de protocolos utilizar el
protocolo más adecuado según los datos a
comunicar y el destino.
Curso de Doctorado RAPyA (2004/05)
56Perspectivas de mejora (III)
Existen en el mercado INICs, incluso con varios
procesadores QsNet, AceNIC, I2O,
Myrinet Posibilidad de utilizar hardware
reconfigurable para desarrollo
FPGAs de la familia Virtex-II Pro de Xilinx
pueden incluir hasta 4 procesadores PowerPC 405
empotrados
Proyecto Explotación Eficiente de Arquitecturas
Paralelas. Aplicaciones, Herramientas, y
Comunicación
Curso de Doctorado RAPyA (2004/05)
57Perspectivas de mejora (IV)
Hay que mejorar el ancho de banda que
proporcionan los buses de E/S
Comparación de mejoras respecto a PCI 33MHz/32
bits para PCI 66MHz/64 bits y NIC conecatada al
bus del sistema
Curso de Doctorado RAPyA (2004/05)
58Perspectivas de mejora (V)
- Infiniband
- Arquitectura de interconexión para la E/S y para
la comunicación entre procesos - No existe ningún bus de E/S la conexión del
adaptador de canal (CA) se realiza directamente
al controlador del sistema para el DMA.
Infiniband Linux Sourceforge
Sockets sobre CLIC
Curso de Doctorado RAPyA (2004/05)
59Publicaciones y Proyectos Relacionados (I)
- Implementación de Mensajes Activos en un Cluster
de PCs . SEID99. 1999 - CLIC Comunicación Eficiente en Clusters con
Linux. Jornadas de Paralelismo. 2000. - Implementación de MPI sobre el protocolo CLIC.
Jornadas de Paralelismo. Septiembre 2001. - El Protocolo CLIC en Gigabit Ethernet. XIII
Jornadas de Paralelismo. Lleida, 2002 - Proyecto TIC97-1149 Algoritmos y Arquitecturas
Masivamente Paralelas para problemas de
Optimización en Multicomputadores y Redes de
Computadores - Proyecto TIC2000-1348Procedimientos Híbridos
para la Optimización Paralela en Clusters.
Aplicaciones en Planificación y Predicción - Tesis Doctoral Comunicación eficiente en redes
de área local para procesamiento paralelo en
clusters
Curso de Doctorado RAPyA (2004/05)
60Publicaciones y Proyectos Relacionados (II)
- CLIC Fast Communication on Linux Clusters.
IEEE International Conference on
Cluster Computing (CLUSTER2000). Noviembre 2000. - The Light Weight Protocol CLIC Performance of an
MPI implementation on CLIC.
IEEE International
Conference on Cluster Computing (CLUSTER2001).
Octubre 2001. - An efficient OS support for Communication on
Linux Clusters. Workshop on Scheduling and
Resource Management for Cluster Computing,
ICPP'2001, Septiembre, 2001 - The Lightweight Protocol CLIC on Gigabit
Ethernet. Workshop on Communication Architecture
for Clusters, 17th Int. Parallel Distributed
Processing Symp.(IPDPS03), pp.143-. Abril, 2003.
Curso de Doctorado RAPyA (2004/05)