Title: perfSONAR%20en%20LHC
1perfSONAR en LHC
- alberto.escolano_at_rediris.es
2Indice
- Qué es perfSONAR
- Objetivos de diseño
- Principales servicios de perfSONAR
- Ejemplo de interacción de un cliente
- Herramientas de diagnóstico
- Arquitectura global perfSONAR-LHC
- Despliegue perfSONAR en Tier1
- Despliegue perfSONAR en Tier2
- Arquitectura LHC en España
- Dónde medimos?
- Cómo medimos?
- Cómo es perfSONAR?
3Qué es perfSONAR
- Es una infraestructura dedicada a la
monitorización del rendimiento de la red - Permite solucionar problemas extremo a extremo en
conexiones que atraviesan varios dominios de red - Contiene un conjunto de servicios dedicados a
realizar medidas de rendimiento en entornos
federados - Tiene 3 contextos diferenciados
- Es un consorcio de organizaciones que buscan
construir una infraestructura de medida de
rendimiento de red interoperable entre múltiples
dominios de red - Es un protocolo basado en SOAP XML
- Es un conjunto de paquetes de software
4Objetivos de diseño
- perfSONAR debe ser un despliegue abierto,
flexible, extensible y descentralizado - La arquitectura resultante debe ser
- Sistema modular que permita la división en
múltiples componentes - Sistema dinámico que permita eliminar y añadir
componentes durante en operación - Sistema que permita a sus componentes y los
Puntos de Medición anunciar a los demás sus
funcionalidades - Sistema descentralizado, que permita a cada
dominio administrativo limitar las
funcionalidades del sistema en función de las
necesidades
5Objetivos de diseño II
- Sistema escalable, que permita incorporar
múltiples redes, servicios, fuentes de
información y herramientas de monitorización - Sistema seguro que no pueda ser utilizado para
otros fines que para la monitorización del
rendimiento de la red - Sistema seguro, que no pueda provocar congestión
en las redes que monitoriza - Sistema con tolerancia a fallos, que no sea
inestable ante los posibles fallos de alguno de
sus componentes - Sistema que proporcione mensajes regulares y
claros en el caso de que se produzcan fallos
6Principales servicios de perfSONAR
- Measurement Point Service
- Crea y/o publica la información de monitorización
relativa a las medidas activas o pasivas - Measuremente Archive Service
- Guarda y publica la información recibida por los
Measurement Point Services - Transformation Service
- Proporciona la posibilidad de manipular (agregar,
concatenar, correlar, traducir) los datos
archivados de las medidas realizadas - Estos servicios están específicamente dedicados a
tareas de medidas de rendimiento y análisis de la
red
7Principales servicios de perfSONAR II
- Lookup Service
- Permite al cliente descubrir los servicios
existentes y otros LS - Topology Service
- Permite que la información de la topología de la
red está disponible para los demás servicios - Se encarga de encontrar al MP más cercano
- Proporciona información de la topología de red a
las herramientas de visualización - Autentication Service
- Controla el acceso a los servicios
8Ejemplo de interacción de un cliente
Dónde consigo información Red A y Red B?
gLS
Gráfico
Cliente
LS A, LS B
Utilización enlace IPs a,b,c?
a,b,c Red A, MA A
Obtener utilización enlace a,b,c
Respuesta
LS A
LS B
MA B
MA A
a
b
f
e
c
d
Red A
Red B
9Herramientas de diagnóstico
- pingER (latencia)
- Herramienta que realiza pings regularmente y
almacena los resultados - Proporciona
- Información de Disponibilidad
- Referencia temporal sobre problemas
- Visión preliminar sobre las razones de una
degradación del rendimiento - OWAMP (One Way Active Measurement Protocol)
- Demonio que solicita y ejecuta pruebas de
latencia en un solo sentido - Proporciona
- Visión más exacta sobre la degradación de
rendimiento (dirección de la degradación, más
sensible al jitter) - Visión acerca del routing (saltos, latencia en
una dirección) - Información de Disponibilidad
- Referencia temporal sobre problemas
10Herramientas de diagnóstico II
- BWCTL (BandWidth test ConTroLler)
- Demonio que solicita y ejecuta pruebas de iperf y
que soporta múltiples instancias - Proporciona
- Detección de problemas ya que la herramienta hace
un uso de la red del mismo modo que lo haría un
usuario - Archivado de pruebas realizadas con límite de
tráfico alcanzado - Informa de cuándo los problemas de rendimiento
comenzaron - NDT (Network Diagnostic Tool)
- Herramienta que desde un navegador web invoca un
test de diagnóstica avanzado - Proporciona
- Informa por qué pueden existir problemas de
rendimiento - Información de diagnóstico detallada que puede
ser utilizada por los ingenieros de red - Orientada a usuarios finales
11Herramientas de diagnóstico III
- Estado de enlace o circuito
- Utilizando la herramienta más adecuada a cada
caso (ej SNMP) - Se realiza un archivado de los diferentes estados
(up/down) de los enlaces más importantes - Genera alarmas que avisan al NOC sobre las
incidencias de circuitos multidominio - SNMP MA (SNMP Measurement Archive)
- Almacena la información de errores y utilización
de enlaces - Simplifica los diagnósticos de problemas
- Proporciona una visión sobre los patrones de
utilización de la red - CACTI
- Herramienta para generar gráficas de red basada
en RRDTool - Requiere
- SNMP
- MySQL
- PHP
- Gestión de usuarios y perfiles
12Herramientas de diagnóstico IV
- NPAD (Network Path and Application Diagnosis)
- Herramienta diseñada para realizar diagnósticos
precisos sobre problemas en la red de usuario y
sistemas finales - Pruebas realizadas desde un navegador web
- Genera un informe que enumera todos los problemas
que afectan la descarga de archivos de un sitio
remoto - El diagnóstico incluye una guía para los usuarios
finales y administradores de red para localizar
la fuente de los problemas encontrados - Thrulay
- Se utiliza para medir capacidad, retardo y otras
medidas del rendimiento de una red enviando
tráfico TCP o UDP sobre la misma - Mediante TCP permite medir RTT Delay con
Throughput - Mediante UDP permite medir
- One-Way Delay
- Paquetes perdidos
- Paquetes duplicados
- NTP (Network Time Protocol)
- Protocolo diseñado para sincronizar los relojes
de los elementos de una red - Se utiliza para realizar medidas de rendimiento
con la mayor precisión
13Arquitectura Global perfSONAR-LHC
14Despliegue perfSONAR para LHC
Análisis Interface de Usuario
Pruebas programadas Almacenamiento de resultados
Demonios para diagnóstico
ICMP
15Despliegue perfSONAR en Tier1
- Despliegue en Tiers1 coordinado por DANTE
- En España PIC-RedIRIS-DANTE
- Prerequisitos para instalación
- Máquina HADES (OWAMP - IPPM)
- Interfaz de gestión (100Mbps)
- Interfaz de medida (100/1000Mbps)
- Direccionamiento IPv4 para interfaces de gestión
y medida - Acceso HTTP y HTTPS a interfaz de gestión
- Soporte IPv6
- Acceso ssh
- Para las medidas deben abrirse los puertos
superiores al 50000 (UDP)
16Despliegue perfSONAR en Tier1 II
- Máquina BWCTL - Puede ser la misma que HADES
- Interfaz de gestión (100Mbps)
- Interfaz de medida (100/1000Mbps)
- Direccionamiento IPv4 para interfaces de gestión
y medida - Acceso HTTP y HTTPS a interfaz de gestión
- Soporte IPv6
- Acceso ssh
- Puerto de control (4823) accesible
- Para las medidas iperf deben abrirse los puertos
superiores al 5000 - Se recomienda que el servicio BWCTL tenga salida
independiente del servicio HADES - NO se contempla como válido un servicio en el que
los servicios BWCTL y HADES utilicen la misma
interfaz
17Despliegue perfSONAR en Tier1 III
- Conexiones de las máquinas (PC)
- Interfaz de gestión RJ45
- Interfaz de servicio HADES (100Mbps)
- Interfaz de servicio BWCTL opcional
(100/1000Mbps) - Puerto BNC - conector de la tarjeta GPS
- Puerto RS232
- Fuente de alimentación 1
- Fuente de alimentación 2 opcional
18Despliegue perfSONAR en Tier1 IV
- Descripción de las máquinas (PC)
- Tamaño 3U
- CPU 1x3.0GHz
- Disco Duro 2xSATA 80GB
- 512 MB RAM
- Tarjetas de red 2x1Gbps en placa
- BUS 2x32, 2xPCI-X 64 Bit
- Fuente de alimentación 460W
- Tarjeta de Gestión remota eRIC express
19Despliegue perfSONAR en Tier2
- Funcionalidad
- Hosts con conectividad ICMP
- Necesidad de hacer ping y traceroute
- Demonios para diagnóstico de problemas
- NDT
- OWAMPD
- BWCTLD
- Registro de disponibilidad
- Almacenamiento de datos
- Pruebas realizadas regularmente (pingER, OWAMP,
BWCTL) - Estado de enlace/circuito
- Utilización de enlaces/circuitos
20Despliegue perfSONAR en Tier2 II
- Recursos necesarios
- Host accesible (firewall)
- 2 Sistemas linux no muy sofisticados
- Puede optarse por utilizar la misma configuración
HW de los Tier1 - Se debe correr un demonio que registre la
disponibilidad de las herramientas al LS global
(gLS) - Espacio en disco para almacenamiento de datos
- Configuración para interactuar con la
infraestructura existente
21Despliegue perfSONAR en Tier2 III
- Requerimientos Hardware
- 2 Sistemas linux no muy sofisticados (500 cada
uno) - Diferenciar y aislar pruebas de rendimiento de
red de las pruebas de las aplicaciones LHC
propiamente dichas - 1 máquina para pruebas de latencia a poder ser
con ahorro de energía deshabilitado y en
condiciones ambientales controladas - 2Ghz/1GB RAM/50GB HDD
- Tarjeta de red 10/100/100
- 1 máquina similar para pruebas de ancho de banda
22Arquitectura de LHC en España
TIER 2
TIER 2
EB-Santander0
EB-Bilbao0
TIER 1
EB-Santiago0
TIER 2
PIC
UB
Red Regional
EB-Iris4
GW-Barcelona0
Anella
GW-Nacional2
GW-Madrid0
EB-Barcelona0
CAM
UAB
GW-Nacional1
GW-Valencia0
TIER 2
UAM
EB-Madrid0
TIER 2
TIER 2
EB-Iris2
TIER 2
TIER 2
GW-Sevilla0
TIER 2
SW-Tenerife2
EB-Tenerife0
23Dónde medimos?
- La medida debe contemplar todo el camino, debe
ser extremo a extremo. Esto es de usuario final a
usuario final - Medida entre Tier1 y RedIRIS
- Sondas o máquinas de medida en PIC
- Sondas o máquinas de medida en RedIRIS
- Medida entre Tier2 y RedIRIS
- Sondas en cada Tier2
- Sonda en RedIRIS - Resuelto en 1
- Medida entre Tier2 y Tier1
- Medida entre Tier2 y Tier2
- Redes Regionales. Si no despliegan perfSONAR hay
que saber cuándo un problema de rendimiento está
en ellas
24Cómo medimos?
- Utilizando las herramientas propocionadas en el
paquete perfSONAR. - Estableciendo un conjunto de parámetros de red
necesarios para que una aplicación determinada
funcione adecuadamente - Homogeneizando servicios perfSONAR en Tier2
- Realizando un despliegue conjunto
- Caracterizando la red (NREN, Tier1, Tier2, Red
Regional??) - Utilizando la información recogida para su
posterior análisis y detección de problemas - Cuidado con los firewalls, deben permitir que las
medidas se realicen con propiedad
25Cómo es perfSONAR?
26Cómo es perfSONAR? II
27Cómo es perfSONAR? III
28Cómo es perfSONAR? IV
29Cómo es perfSONAR? V
30Preguntas?