Sistemas de Almacenamiento Masivo - PowerPoint PPT Presentation

1 / 48
About This Presentation
Title:

Sistemas de Almacenamiento Masivo

Description:

Los datos en discos de lectura-escritura pueden ser modificados una y otra vez. Discos WORM ( Write Once, Read Many Times ) pueden ser escritos solamente una vez. – PowerPoint PPT presentation

Number of Views:317
Avg rating:3.0/5.0
Slides: 49
Provided by: Luce85
Category:

less

Transcript and Presenter's Notes

Title: Sistemas de Almacenamiento Masivo


1
Sistemas de Almacenamiento Masivo
2
Sistemas de Almacenamiento Masivo
  • Descripción de la estructura de almacenamiento
    masivo
  • Estructura de disco
  • Ligando (integrando) el disco
  • Planificación de disco
  • Manejo de disco
  • Manejo de espacio de swap
  • Estructura de RAID
  • Implementación de almacenamiento estable
  • Dispositivos de almacenamiento terciario
  • Detalles con el Sistema Operativo
  • Detalles de rendimiento

3
Objetivos
  • Describir la estructura física del almacenamiento
    secundario y terciario y los efectos resultantes
    en el uso de los dispositivos
  • Explicar las características de rendimiento de
    los dispositivos de almacenamiento masivo
  • Discutir los servicios provistos para
    almacenamiento masivo, incluyendo RAID y HSM

4
Descripción de Estructura de Almacenamiento Masivo
  • Discos magnéticos ofrecen el grueso del
    almacenamiento masivo en computadoras modernas
  • Un drive típico rota de 60 a 200 veces por
    segundo
  • Tasa de transferencia es el ritmo al cuál fluyen
    datos entre el dispositivo y la comptuadora
  • Tiempo de posicionamiento (tiempo de
    acceso-aleatorio) es el tiempo que toma mover el
    brazo del disco al cilindro deseado (tiempo de
    búsqueda) y el tiempo para que el sector deseado
    rote y quede debajo de cabeza (latencia
    rotacional)
  • Choque de cabeza el resultado cuando la cabeza
    del dicso hace contacto con la superficie del
    disco
  • Esto es muy malo
  • Los discos pueden ser externos
  • Dispositivo conectado a la computadora via bus de
    E/S
  • Los busses varían, incluyendo EIDE, ATA, SATA,
    USB, Fibre Channel, SCSI
  • Controlador de host en la computadora utiliza el
    bus para hablar con el controlador de disco o el
    arreglo de discos

5
Mecanismo de disco de cabeza-móvil
6
Descripción de Estructura de Almacenamiento Masivo
  • Cinta magnética
  • Medio original de almacenamiento-secundario
  • Relativamente permanente y mantiene grandes
    cantidades de datos
  • Tiempo de acceso lento
  • Acceso aleatorio 1000 veces más lento que el
    disco
  • Principalmente utilizado para respaldo,
    almacenamiento de datos utilizados con poca
    frecuencia, medio de transferencia entre sistemas
  • Se mantiene en carrete y se avanzan o retrasan
    sobre la cabeza de lectura-escritura
  • Una vez bajo la cabeza, ritmo de transferencia
    comparable al de disco
  • Almacenamiento típico 20-200GB
  • Tecnologías comunes 4mm, 8mm, 19mm, LTO-2 y SDLT

7
Estructura de disco
  • Los discos son referidos como grandes arreglos
    1-dimensionales de bloques lógicos, donde el
    bloque lógico es la unidad mínima de
    transferencia.
  • El arreglo 1-dimensional de bloques lógicos se
    mapea secuencialmente en los sectores del disco.
  • El sector 0 es el primer sector del primer trac
    en el cilindro más externo.
  • El mapeo procede en orden a lo largo del trac,
    luego los demás tracks en el cilindro y
    finalmente en el resto de los cilindros del más
    externo, al más interno.

8
Conexión de disco
  • Almacenamiento conectado al host se accede a
    través de puertos de E/S que hablan con busses de
    E/S
  • SCSI es un bus en sí mismo, hasta 16 dispositivos
    en un sólo cable, iniciador de SCSI solicita la
    operación y los objetivos SCSI la realizan
  • Cada objetivo puede tener hasta 8 unidades
    lógicas (discos conectados al controlador)
  • FC es arquitectura serial de alta velocidad
  • Puede fabricarse con un espacio de direcciones de
    24-bits la base de storage area networks
    (SANs) muchos hosts se conectan con varias
    unidades de almacenamiento
  • Puede ser un ciclo arbitrado (arbitrated loop,
    FC-AL) de 126 dispositivos

9
Almacenamiento conectado-en-red
  • Almacenamiento conectado-en-red (Network-attached
    storage, NAS) es almacenamiento disponible a
    través de una red en lugar de una conexión local
    (como un bus)
  • NFS y CIFS son protocolos comunes
  • Se implementan a través de llamadas a
    procedimientos remotos (RPCs) entre el host y el
    almacenamiento
  • El nuevo protocolo iSCSI utiliza red IP para
    soportar el protocolo SCSI

10
Storage Area Network (SAN)
  • Común en ambientes con gran almacenamiento (y
    cada vez más utilizado)
  • Muchos hosts conectados a muchos arreglos de
    almacenamiento -- flexible

11
Planificador de disco
  • El sistema operativo es responsable de utilizar
    el hardware eficientemente en el caso de los
    discos, esto significa un tiempo de acceso rápido
    y ancho de banda.
  • Tiempo de acceso tiene dos componentes mayores
  • Tiempo de búsqueda es el tiempo que toma al disco
    mover las cabezas al cilindro que contiene el
    sector deseado.
  • Latencia rotacional es el tiempo adicional
    esperando a que el disco rote y posicione el
    sector deseado a la cabeza del disco.
  • Minimizar tiempo de búsqueda
  • Tiempo de búsqueda distancia de búsqueda
  • El ancho de banda del disco es el número total de
    bytes transferidos, divididos por el tiempo total
    entre la primera solicitud de servicio y el
    termino de la última transferencia.

12
Planificador de disco
  • Existen distintos algoritmos para organizar el
    servicio de solicitudes de E/S de disco.
  • Vamos a ilustrarlos con una cola de
    solicitudes(0-199). 98, 183, 37, 122, 14,
    124, 65, 67Apuntador de cabeza 53

13
FCFS
La ilustración muestra el movimiento total de la
cabeza de 640 cilindros.
14
SSTF
  • Selecciona la solicitud con el menor tiempo de
    búsqueda desde la posición actual de la cabeza.
  • SSTF es una forma de planificador SJF puede
    provocar hambruna para algunas solicitudes.
  • La siguiente ilustración muestra el movimiento
    total de cabeza para 236 cilindros.

15
SSTF (Cont.)
16
SCAN
  • El brazo empieza en un extremo del disco y se
    mueve hacia el otro extremo, sirviendo
    solicitudes hasta que llega al otro extremo,
    donde se voltea el movimiento de la cabeza y
    sigue sirviendo.
  • Algunas veces llamado algoritmo de elevador.
  • La ilustración muestra el movimiento total de
    cabeza para 208 cilindros.

17
SCAN (Cont.)
18
C-SCAN
  • Provee un tiempo de espera más uniforme que SCAN.
  • La cabeza se mueve de un extremo del disco al
    otro, sirviendo solicitudes conforme avanza.
    Cuando llega al otro extremo, sin embargo,
    regresa al inicio del disco, sin atender ninguna
    solicitud en el camino de regreso.
  • Trata los cilindros como una lista circular que
    da la vuelta del último cilindro al primero.

19
C-SCAN (Cont.)
20
C-LOOK
  • Versión de C-SCAN
  • El brazo sólo va tan lejos como la última
    solicitud en cada dirección, da reversa
    inmediatamente, sin antes ir hasta el final del
    disco.

21
Seleccionado un planificador de disco
  • SSTF es común y tiene un atractivo natural
  • SCAN y C-SCAN ofrecen mejor rendimiento para
    sistemas que imponen una carga pesada en el
    disco.
  • El rendimiento depende en el número y tipo de
    solicitudes.
  • Solicitudes para servicio de disco pueden ser
    influenciadas por el método de asignación de
    archivos.
  • El algoritmo de planificación del disco debe
    estar escrito como un módulo del sistema
    operativo, permitiendo cambiarlo si es necesario.
  • Tanto SSTF o LOOK son un algoritmo razonable para
    utilizar por omisión.

22
Manejo de disco
  • Formato de bajo-nivel, o formato físico Dividir
    un disco en sectores que el controlador del disco
    puede leer y escribir.
  • Para utilizar un disco para mantener archivos, el
    sistema operativo necesita almacenar sus
    estructuras de datos en el disco.
  • Particionar el disco en uno o más grupos de
    cilindros.
  • Formato lógico o creando un sistema de
    archivos.
  • El bloque de booteo inicializa el sistema.
  • El bootstrap está almacenado en ROM.
  • Programa cargador en el bootstrap.
  • Métodos como sectores de repuesto utilizados para
    manejar bloques malos.

23
Booting desde un disco en Windows 2000
24
Manejo de espacio swap
  • Espacio swap Memoria virtual utiliza espacio en
    disco como una extensión de la memoria principal.
  • El espacio de swap puede sacarse del sistema de
    archivos normal o, más común, puede vivir en una
    partición de disco separada.
  • Manejo de espacio de swap
  • 4.3BSD asigna espacio de swap cuando un proceso
    inicia mantiene un segmento de texto (el
    programa) y un segmento de datos.
  • El kernel utiliza mapas de swap para seguir la
    utilización del espacio de swap.
  • Solaris 2 asigna espacio de swap solo cuando una
    página es forzada fuera de la memoria principal.

25
Estructuras de datos para swap en Linux
26
Estructura de RAID
  • RAID múltiples discos proveen confiabilidad y
    redundancia.
  • RAID está dividido en seis niveles.

27
RAID (cont)
  • Muchos avances en las técnicas de uso de disco
    involucran el uso de varios discos trabajando
    cooperativamente.
  • Disk striping utiliza un grupo de discos como una
    unidad de almacenamiento.
  • Los esquemas RAID mejoran el rendimiento y
    confiabilidad del sistema de almacenamiento,
    guardando datos redundantes.
  • Mirroring o shadowing mantiene duplicados de cada
    disco.
  • Block interleaved parity utiliza menos
    redundancia.

28
Niveles RAID
29
RAID (0 1) y (1 0)
30
Implementación almacenamiento-estable
  • El esquema de bitácora write-ahead requiere
    almacenamiento estable.
  • Para implementar almacenamiento estable
  • Replicar información en más de un medio de
    almacenamiento no-volátil con modos de fallo
    independientes.
  • Actualizar información de manera controlada para
    asegurar que podemos recuperar los datos después
    de cualquier falla durante la transferencia de
    datos o recuperación.

31
Dispositivos de almacenamiento terciario
  • Bajo costo es la característica definitoria del
    almacenamiento terciario.
  • Generalmente, almacenamiento terciario se crea
    utilizando medios movibles.
  • Ejemplos comunes de medios movibles son los
    floppys, CD-ROMs, etc.

32
Discos movibles
  • Disco floppy disco flexible y delgado con capa
    de material magnético, dentro de un estuche
    protector de plástico.
  • La mayoría de lo floppys mantienen 1 MB
    tecnología similar se utiliza para otros medios
    que mantienen más de 1GB.
  • Los discos magnéticos movibles pueden ser tan
    rápidos como los discos duros, pero están más
    expuestos a daño por exposición.

33
Discos movibles
  • Un disco magnético-óptico almacena datos en un
    disco rígido revestido con material magnético.
  • Calor de láser es utilizado para amplificar un
    gran, pero débil campo magnético para almacenar
    un bit.
  • La luz del láser se utiliza para leer datos
    (efecto Kerr).
  • La cabeza magnético-óptica vuela más lejos de la
    superficie del disco que las de discos
    magnéticos. Además la cubierta magnética tiene
    una capa protectora de plástico o cristal que
    resiste los choques de cabeza.
  • Los discos ópticos no utilizan magnetismo
    emplean materiales especiales que son alterados
    por la luz del láser.

34
Discos WORM
  • Los datos en discos de lectura-escritura pueden
    ser modificados una y otra vez.
  • Discos WORM (Write Once, Read Many Times)
    pueden ser escritos solamente una vez.
  • Una película de aluminio se hace sandwich en dos
    placas de cristal o plástico.
  • Para escribir un bit, el drive utiliza una luz
    láser para quemar un pequeño hoyo en el aluminio
    se puede destruir la información, pero no
    alterarla.
  • Muy durable y confiable.
  • Discos de Sólo Lectura, tales como CD-ROM y
    DVD,vienen de fabrica con los datos pre-grabados.

35
Cintas
  • Comparada con un disco, la cinta es menos costosa
    y almacena más datos, pero el acceso aleatorio es
    más lento.
  • La cinta es un medio económico para propósitos
    que no requieren un acceso aleatorio rápido,
    v.gr. copias de respaldo de datos o para mantener
    enormes volúmenes de datos.
  • Instalaciones grandes de cinta típicamente
    utilizan cambiadores de cinta roboticos, que
    mueven cintas entre los drives y las ranuras en
    la biblioteca de cintas.
  • stacker biblioteca que almacena algunas cintas
  • silo biblioteca que almacena miles de cintas
  • Un archivo que reside en disco, puede ser
    archivado en cinta para almacenamiento de bajo
    costo la computadora puede regresarlo a disco
    para uso activo.

36
Detalles del sistema operativo
  • Entre las tareas principales del SO está la de
    manejar dispositivos físicos y presentar una
    abstracción de máquina virtual a las
    aplicaciones
  • Para discos duros, el SO provee dos
    abstracciones
  • Dispositivo crudo (raw) arreglo de bloques de
    datos.
  • Sistema de archivos el SO encola y planifica
    las solicitudes intercaladas de varias
    aplicaciones.

37
Interfaz de aplicación
  • La mayoría de los SOs manejan discos movibles
    exactamente igual que los discos fijos un nuevo
    cartucho es formateado y se genera un sistema de
    archivos vacío en el disco.
  • Las cintas son presentadas como un medio crudo de
    almacenamiento, i.e. una aplicación no abre un
    archivo en la cinta, abre toda la cinta como
    dispositivo crudo.
  • Usualmente el dispositivo de cinta se reserva
    para uso exclusivo de esa aplicación.
  • Dado que el SO no provee un sistema de archivos,
    la aplicción debe decidir como utilizar el
    arreglo de bloques.
  • Dado que cada aplicación hace sus propias reglas
    sobre como utilizar una cinta, si una tiene
    datos, puede ser utilizada solo por el programa
    que la creo.

38
Drives de cinta
  • Las operaciones básicas para un drive de cinta
    difieren de aquellas de un drive de disco.
  • localizar posiciona la cinta en un bloque lógico
    específico, no un track entero (corresponde a
    seek).
  • La operación read position regresa el número de
    bloque lógico donde está la cabeza de la cinta.
  • La operación space habilita movimiento relativo.
  • Drives de cinta son dispositivos de sólo
    añadir actualizar un bloque en el medio de una
    cinta también borra efectivamente todo lo que
    sigue a ese bloque.
  • Una marca EOT se pone después de escribir un
    bloque.

39
Nombrado de archivos
  • El asunto de nombrar archivos en media movible es
    particularmente difícil cuando queremos escribir
    datos en un cartucho movible en una computadora,
    y luego utilizar el cartucho en otra computadora.
  • Los SO contemporáneos dejan el asunto de nombrado
    sin resolver para medios movibles y dependen en
    las aplicaciones y usuarios para entender e
    interpretar esos datos.
  • Algunos medios movibles (v.gr. CDs) están tan
    bien difundidos que todas las computadoras los
    utilizan de la misma manera.

40
Manejo de Almacenamiento Jerárquico (HSM)
  • Un sistema de almacenamiento jerárquico extiende
    la jerarquía de almacenamiento más allá de
    memoria principal y almacenamiento secundario
    para incorporar almacenamiento terciario
    usualmente implementado a través de un conjunto
    de cintas y discos movibles.
  • Usualmente se incorpora el almacenamiento
    terciario extendiendo el sistema de archivos.
  • Archivos pequeños o utilizados frecuentemente se
    mantienen en el disco.
  • Arcivos grandes viejos o inactivos se mueven al
    terciario.
  • HSM es usualmente encontrado en centros de
    súper-cómputo y otras instalaciones grandes y con
    volúmenes enormes de datos.

41
Velocidad
  • Dos aspectos de velocidad en el almacenamiento
    terciario son el ancho de banda y latencia.
  • El ancho de banda se mide en bytes por segundo.
  • Ancho de banda sostenido tasa promedio de
    transferencia de datos durante una transferencia
    larga de bytes/tiempo de transferencia.Tasa
    de transferencia cuando el stream de datos está
    fluyendo.
  • Ancho de banda efectivo promedio durante el
    tiempo de E/S completo, incluyendo seek o locate,
    y cambio de cartuchos.

42
Velocidad
  • Latencia de acceso cantidad de tiempo requerida
    para localizar datos.
  • Tiempo de acceso para un disco mover el brazo
    al cilindro seleccionado y esperar la latencia
    rotacional lt 35 milisegundos.
  • Acceso en cinta requiere rebobinar el carrete
    hasta que el bloque seleccionado alcanza la
    cabeza decenas de cientos de segundos.
  • En general podemos decir que el tiempo de acceso
    aleatorio en un carrete de cinta es mil veces más
    lento que en un disco.
  • El bajo costo del almacenamiento terciario es el
    resultado de tener muchos cartuchos baratos que
    comparten unos cuantos drives costosos.
  • Una biblioteca movible es mejor si se destina al
    almacenamiento de datos utilizados con poca
    frecuencia, dado que solo puede atender un
    pequeño número de solicitudes de E/S por hora.

43
Confiabilidad
  • Un drive de disco fijo es con seguridad más
    confiable que uno disco o cinta movible.
  • Un cartucho óptico es probablemente más confiable
    que un disco o cinta magnética.
  • Un choque de cabeza es un disco fijo generalmente
    destruye los datos, mientras que la falla de un
    drive de cinta o un disco óptico generalmente no
    daña los datos.

44
Costo
  • Memoria principal es mucho más cara que el
    almacenamiento en disco
  • El costo por megabyte del almacenamiento en disco
    duro compite con el de cintas magnéticas, si se
    utiliza una cinta por drive.
  • Los drives de cinta y disco más baratos han
    tenido a lo largo de los años la misma capacidad.
  • Almacenamiento terciario ofrece ahorros solo
    cuando el número de cartuchos es
    considerablemente más grande que el número de
    drives.

45
Precio p/Megabyte de DRAM, de 1981 a 2004
46
Precio p/Megabyte de DD Magnético, de 1981 a 2004
47
Precio p/Megabyte de Drive Cinta, de 1984 a 2000
48
Fin
Write a Comment
User Comments (0)
About PowerShow.com