Toler - PowerPoint PPT Presentation

1 / 40
About This Presentation
Title:

Toler

Description:

... CC-NUMA (cache-coherent non-uniform memory access) NCC-NUMA ... SGI Power Challenge, SUN Ultra Enterprise 10000, HP/Convex Exemplar X-Class, ... – PowerPoint PPT presentation

Number of Views:93
Avg rating:3.0/5.0
Slides: 41
Provided by: Carlos513
Category:
Tags: memory | numa | power | toler

less

Transcript and Presenter's Notes

Title: Toler


1
Tolerância a Falhas
  • Carlos Oberdan Rolim
  • Ciência da Computação

2
  • Arquiteturas paralelas

3
Arquiteturas computacionais
  • Taxonomia de Flynn 1972 - se baseia nas
    possíveis unicidade e multiplicidade dos fluxos
    de instruções e de dados para definir quatro
    tipos de arquiteturas
  • SISD (Single Instruction Streams Single Data
    Streams ) Fluxo único de instruções sobre um
    único conjunto de dados . Computadores
    sequenciais
  • SIMD (Single Instruction Streams Multiple Data
    Streams ) Fluxo único de instruções em múltiplos
    conjuntos de dados .Computadores vetoriais e
    matriciais
  • MISD (Multiple Instruction Streams Single Data
    Streams ) Fluxo múltiplo de instruções em um
    único conjunto de dados .Não existem
    computadores
  • MIMD (Multiple Instruction Streams Multiple Data
    Streams ) Fluxo múltiplo de instruções sobre
    múltiplos conjuntos de dados. .Arquiteturas com
    múltiplos processadores independentes

4
Classificação de Flynn
  • SISD (Single Instruction Single Data)

Máquinas von Neumann tradicionais microcomputador
es pessoais e estações de trabalho
5
Classificação de Flynn
  • SIMD (Single Instruction Multiple Data)

Máquinas array CM-2, MasPar
6
Classificação de Flynn
  • MISD (Multiple Instruction Single Data)

Não existe!
7
Classificação de Flynn
  • MIMD (Multiple Instruction Multiple Data)

Multiprocessadores e multicomputadores nCube,
Intel Paragon, Cray T3D
8
Multiprocessadores e multicomputadores
MIMD
Computadores Paralelos e Distribuídos
Fortemente Acoplado
Fracamente Acoplado
Multiprocessadores (memória compartilhada)
Multicomputadores (memória privada)
Barramento
Switched
Barramento
Switched
Sequent, Encore
Ultracomputer, RP3
Estações de Trabalho
Transputer, Hypercube
9
Multiprocessadores
  • Baseado em barramento

10
Multiprocessadores
  • Baseado em switch

M
M
M
M
C
M
C
C
M
C
C
M
C
C
M
C
omega switching network
crossbar switch
11
Multicomputadores
  • Baseado em barramento

Rede
12
Multicomputadores
  • Baseado em switch

hypercube
grid
13
Compartilhamento de memória
  • Multiprocessadores (espaço de endereçamento
    único)
  • UMA (uniform memory access) - memória central
  • NUMA (non-uniform memory access) - memória
    distribuída
  • COMA (cache-only memory architecture)
  • CC-NUMA (cache-coherent non-uniform memory
    access)
  • NCC-NUMA (non-cache-coherent non-uniform memory
    access)
  • Multicomputadores (múltiplos espaços de
    endereçamento)
  • NORMA (non-remote memory access)
  • SC-NUMA (software-coherent non-uniform memory
    access)
  • DSM (Distributed shared memory)

14
Compartilhamento de memória
  • UMA

Rede de Interconexão
M
Coerência de cache resolvida em HW.
15
Acesso Não-Uniforme à Memória (NUMA)
  • NUMA
  • Dois ou mais processadores compartilham a memória
    global ( um único espaço de endereçamento). Em
    um sistema NUMA os processadores são organizados
    em nós. Cada nó possui 1 ou mais processadores,
    com sua(s) própria(s) memória(s) cache (um, dois,
    ou mais níveis) e alguma memória principal
    conectados por um barramento ou outro sistema de
    interconexão.
  • Principal característica de uma arquitetura NUMA
    é o acesso não uniforme à memória, ou seja,
    embora todos os processadores possam acessar
    todas as posições de memória, os tempos de acesso
    variam de acordo com o endereço acessado
  • Acesso local mais rápido que acesso remoto
  • Dois tipos ncNUMA (NUMA sem cache) e ccNUMA
    (NUMA com cache)

16
Compartilhamento de memória
  • NUMA

espaço de endereçamento
M
M
M
M
M
M
M
M
Rede de Interconexão
17
Compartilhamento de memória
  • NORMA

18
Arquiteturas paralelas
  • Serie N módulos conectados um após o outro.
    Falha de um módulo ocasiona falha o sistema todo
  • Paralelo N módulos conectados entre si. O
    sistema falha somente se todos os módulos falharem

19
Arquiteturas paralelas
  • Confiabilidade pode ser calculada através das
    fórmulas
  • Regra Todos os módulos podem ser percorridas da
    esquerda para a direita
  • Quando não pode percorrer todos os caminhos usar
    a fórmula

Série
Paralelo
ADF funciona
BCDF não funciona
20
Arquiteturas paralelas e distribuídas
Cray T90
Cray SX6
21
Arquiteturas paralelas e distribuídas
  • Multiprocessadores simétricos (SMP)
  • Múltiplos processadores similares conectados
    entre si e à memória por um barramento ou alguma
    outra forma de circuito de conexão interno
  • Compartilhamento total
  • Sistema operacional controla tudo

P/C
P/C
P/C
P/C
Barramento / Matriz de chaveamento
MC
MC
MC
Baixa escalabilidade gargalo no
barramento. Exemplos IBM R50, SGI Power
Challenge, SUN Ultra Enterprise 10000,
HP/Convex Exemplar X-Class, DEC Alpha Server
8400
22
Arquiteturas paralelas e distribuídas
HP Integrity rx8620-32 Server
Intel Quad Xeon 7400 Server
23
Arquiteturas paralelas e distribuídas
  • Máquinas maciçamente paralelas (MPP)

P/C
P/C
P/C
M
M
M
Rede de interconexão de baixa latência
Rede de interconexão proprietária. Comunicação
através de troca de mensagens. Exemplos Intel
Paragon, Connection Machine CM-5, IBM SP-2
24
Arquiteturas paralelas e distribuídas
Intel Paragon
IBM SP2
Connection Machine CM-5
25
Arquiteturas paralelas e distribuídas
Blue Gene da IBM
26
Arquiteturas paralelas e distribuídas
  • Máquinas com memória compartilhada distribuída
    (DSM)

P/C
P/C
P/C
M
M
M
Rede de interconexão de baixa latência
NUMA / NORMA Os processadores podem acessar todas
as memórias. (único espaço de endereçamento) DSM
implementado em SW, HW ou misto. Exemplos
Stanford DASH, Cray T3D, estações de trabalho
rodando TreadMarks
27
Arquiteturas paralelas e distribuídas
Cray T3D
28
Clusters - Motivação
  • Processamento de alto desempenho milhares de
    aplicações ao mesmo tempo tarefas paralelas
  • Ao longo dos anos uso de arquiteturas
    massivamente paralelas (MPP) e de memória
    compartilhada (SMP)
  • Custo elevado desses tipos de máquinas
  • Computadores pessoais custo menor

29
O que é cluster ?
  • Cluster é um sistema distribuído que consiste na
    coleção de computadores interconectados, usados
    como um sistema único (Gregory F. Pfister In
    search of cluster)
  • Sistema de processamento de dados paralelo ou
    distribuído
  • Agregar computadores pessoais
  • Computadores conectados de forma cooperativa
  • Visão de sistema único para usuários e aplicações
  • Execução de aplicações específicas de uma
    organização

30
Arquitetura de cluster
Parallel Applications
Parallel Applications
Parallel Applications
Sequential Applications
Sequential Applications
Sequential Applications
Parallel Programming Environment
Cluster Middleware (Single System Image and
Availability Infrastructure)
Cluster Interconnection Network/Switch
31
Classificação dos clusters
  • -Pequena (sala, laboratório)
  • Média (departamento)
  • Grande (organização)
  • Dedicados
  • Não dedicados
  • NOW (Network of Workstations)
  • COW (Cluster of Workstations)
  • Clumps (Cluster de SMPs)
  • Alto desempenho
  • Alta disponibilidade
  • Homogêneo
  • Heterogêneo

Limite geográfico Utilização dos nodos Tipo
de topologia Aplicações alvo Tipos de nós
Métricas para classificação dos clusters
32
Classificação dos clusters
  • Limite geográfico área de atuação do cluster
  • Pequena (sala, laboratório)
  • Média (departamento)
  • Grande (organização)

33
Classificação dos clusters
  • Utilização dos nós define quais políticas de
    gerenciamento, segurança, alta disponibilidade,
    qual tipo de middleware usar
  • Dedicados
  • Não dedicados

34
Classificação dos clusters
  • Tipo de topologia qual hardware usar
  • NOW (Network of Workstations) estações de
    trabalho normais
  • COW (Cluster of Workstations) heterogêneas,
    usadas em aplicações específicas
  • Clumps (Cluster de SMPs) composto por máquinas
    SMP

35
NOW
  • Redes de estações de trabalho (NOW)

P/C
P/C
P/C
M
M
M
Rede padrão (Ethernet,ATM)
Compartilhamento de recursos. Utiliza rede
convencional. Exemplos estações de trabalho
interligadas por Ethernet
36
NOW
37
(No Transcript)
38
COW
  • Máquinas agregadas (COW)

P/C
P/C
P/C
M
M
M
Rede padrão ou de alto desempenho
Aplicações paralelas, alta disponibilidade,
balanceamento de carga. Pode utilizar rede
convencional ou de alto desempenho. Otimizações
em software. Exemplos iCluster HP Labs
(Grenoble), Primergy Server do PC2 (Paderborn),
cluster Amazônia (CPAD-PUCRS/HP)
39
Clusters
Clusters Amazônia e Ombrófila CPAD-PUCRS/HP
40
Clusters
HP i-cluster Grenoble
Write a Comment
User Comments (0)
About PowerShow.com