Prof. Gilberto Díaz gilberto@ula.ve Departamento de...

Universisdad de Los AndesFacultad de IngenieríaEscuela de Sistemas

Introducción a los sistemas deMultiprocesamiento

Prof. Gilberto Díazgilberto@ula.ve

Departamento de Computación, Escuela de Sistemas, Facultad de IngenieríaUniversidad de Los Andes, Mérida 5101 Venezuela

Arquitectura de Von Neumann

El procesador ejecuta un programa que especifica una secuencia de lecturas y escrituras sobre la memoria

Depto Computación – Escuela de Sistemas – Universidad de Los Andes – Mérida – Venezuela - Gilberto DiazDepto Computación – Escuela de Sistemas – Universidad de Los Andes – Mérida – Venezuela - Gilberto Diaz

Sistemas multiprocesamiento

CPUCPU

fetchfetch

executeexecute

MemoriaRAM

La memoria es utilizada para almacenar tanto el programa como los datosEl programa son datos codificados que indican al procesador qué hacer

fetchfetch

executeexecute

MemoriaRAM

MemoriaRAM CPUCPU

Los datos es la información utilizada por el programaEl procesador obtiene las instrucciones y los datos de la memoria, decodifica las instrucciones y las ejecuta secuencialmente

CPUCPU

fetchfetch

executeexecute

MemoriaRAM

Taxonomia de Flynn

Distingue las arquitecturas multiprocesamiento de cuerdo a las instrucciones y datos. Cada uno de estos criterios puede tomar dos estados:

SencilloMúltiple

SISD: Single Instruction Single Data

Instrucción

Datos Resultado

Taxonomia de Flynn

SISD: Single Instruction Single Data

Taxonomia de Flynn

Load ALoad BC = A + BStore CA = B * 2Store A

Tiempo

SIMD: Single Instruction Multiple Data

Taxonomia de Flynn

Instrucciones

CPUCPU

Resultados

CPUCPUCPU

SIMD: Single Instruction Multiple Data

Taxonomia de Flynn

Load A(1)Load B(1)C(1)=A(1)+B(1)Store C(1)

Tiempo

Load A(n)Load B(n)C(n)=A(n)+B(n)Store C(n)

P1P1 P2P2 PnPn

MISD: Multiple Instruction Single Data

Instrucciones

CPUCPU

Resultados

Taxonomia de Flynn

CPUCPUCPU

SIMD: Multiple Instruction Single Data

Taxonomia de Flynn

Load A(1)C(1)=A(1)*1Store C(1)

Tiempo

Load A(1)C(2)=A(1)*2Store C(2)

Load A(1)C(n)=A(1)*nStore C(n)

P1P1 P2P2 P3P3

MIMD: Multiple Instruction Multiple Data

Instrucciones

CPUCPU

Resultados

Taxonomia de Flynn

CPUCPUCPU

SIMD: Multiple Instruction Multiple Data

Taxonomia de Flynn

Tiempo

Call funcAX = W*ZStore X

Do 10 i=1,Nvar=i+10Var2 = C(i)

P1P1 P2P2 P3P3

Los sistemas paralelos se distinguen en 3 categorias de acuerdo a la forma como los procesadores utilizan la memoria para gestionar los datos

Memoria CompartidaMemoria DistribuidaMemoria Compartida Distribuida

Modelos de Memoria

Memoria Compartida

Los procesos tienen acceso a la misma memoria física. Los procesos pueden correr en un sólo procesador (tiempo compartido)

Modelos de Memoria

Proceso1

Proceso2

Memoria

Procesador1

Memoria Compartida

Los procesos pueden correr en procesadores distintos dentro del mismo computador

Modelos de Memoria

Proceso1 Proceso2

MemoriaProcesador1 Procesador2

Memoria Compartida

Se debe tener cuidado en esta categoría con la consistencia de los datos.

Se debe utilizar mecanismos como: semáforos, barreras, etc. para tal fin.

Modelos de Memoria

Memoria Distribuida

En esta categoría cada procesador tiene su propia memoria.

Modelos de Memoria

Procesador1 Procesador2

Memoria Distribuida

Si un procesador require un dato que se encuentra en una localidad de memoria remota, debe solicitarlo.

Modelos de Memoria

Procesador1 Procesador2

Memoria Compartida Distribuida

Se utiliza una capa implantada en software para crear un espacio de memoria compartida virtual. Cada procesador aporta un espacio de memoria

Modelos de Memoria

Memoria Compartida Distribuida

Las implantaciones son generalmente bibliotecas: LINDA, munin, etc.

Modelos de Memoria

Dentro del modelo de memoria compartida existen varias categorías.

Uniform Memory Access (UMA)

Non Uniform Memory Access (NUMA)

Cache Only Memory Access (COMA)

Cache Coherent Non-Uniform Memory Access (ccNUMA)

Modelos de Memoria Compartida

Todos los procesadores tienen acceso directo a un sólo bloque de memoria compartida.

MemoriaMemoria

Procesadores

Todas las localidades de memoria son equidistantes en términos de tiempo de acceso

MemoriaMemoria

Procesadores

En esta arquitectura cada procesador tiene su propio espacio de memoria

MemoriaMemoriaMemoriaMemoriaMemoriaMemoriaMemoriaMemoria

Procesadores

Algunas regiones de memoria se encuentran físicamente en buses distintos a otras regiones

Procesadores

Shared Memory Paradigm

In the Shared Memory paradigm there are different categories:

Cache Coherent Non-Uniform Memory Access (ccNUMA)

Cache Only Memory Access (COMA)

Super Computing and Distributed Systems Camp - Universidad de Costa Rica Turrialba – Costa Rica

Memory

All processors have direct access to a common block of memory.

Processors

All locations in memory are equidistant in terms of access time.

Memory

Processors

There are some caveats:

Bus could be a bottle neck.

More than one processor could need the data placed in the same memory location.

Memoria Shared Memory Paradigm

One of the mechanisms added by developers to keep busy the processors was faster memory placed near of them (cache memory)

Non Uniform Memory Access (NUMA)Each processor has its own local memory

Memory

Processors

CacheCacheCacheCache

Some memory regions are located in different buses, therefore, terms like local memory and remote memory are used.

Una vez más, más de un proceso puede necesitar el mismo dato y para gestionar esto una máquina NUMA incluye hardware especializado que mueve la información desde una memoria cache a otra.

Procesadores

CacheCacheCacheCache

Modelos de Memoria

Sin embargo, esta operación puede afectar seriamente el rendimiento de una aplicación.

Por esto, el incremento en la acelearción de la ejecución de un proceso, debido al uso de NUMA, depende en gran medida de la naturaleza de la aplicación.

Modelos de Memoria

Controlar la ubicación de los procesos o hebras a priori puede mejorar el rendimiento de la ejecución. Para esto el usuario debe aprovechar su

conocimiento de la arquitectura de la máquina para hacer una asignación adecuada.

Modelos de Memoria

Cache Coherence NUMA (ccNUMA)En los casos en que más de un proceso utilice un mismo dato, se debe mantener la consistencia entre las múltibples copias.

Procesadores

CacheCacheCacheCache3 3 3 3

Lectura

Modelos de Memoria

Cache Coherence NUMA (ccNUMA)Cuando uno de los procesadores cambia una copia, se debe invalidar el resto.

Procesadores

CacheCacheCacheCache3 3 3 4

Escritura

Invalidar

Por esto se utilizan los términos memoria local y memoria remota

Procesadores

Prof. Gilberto Díaz gilberto@ula.ve Departamento de...

Documents

Transcript of Prof. Gilberto Díaz gilberto@ula.ve Departamento de...

Centro Gilberto Bosques

Hormonas - webdelprofesor.ula.ve

Ferreunion armenia (gilberto)

EP5 Teoria de Control - webdelprofesor.ula.ve

Silva Romo Gilberto

“Foros gilberto campbell calderón”

OBJETO DE APRENDIZAJE Propuesta Javier Contreas javierj@ula.ve ULA PAD 2013.

Quimica gilberto moreno

GILBERTO NARVÁEZ CARDONA

Adriana Gilberto Carmen [Mamá de Adriana] Sofía [ amiga de Adriana] Erika [maestra de Adriana y Gilberto] Karen [amiga de Gilberto] Francisca[

Concepcion simbolicacultura gilberto gimenez

Programación Digital 10 Estructuras de Repetición Prof. Lisbeth Pérez Rivas lisbethpe@ula.ve.

presentación Gilberto

Gilberto Marrufo

1 MANEJO DE COLECCIONES DE DATOS CIENTIFICOS EN LA WEB Geóg. Zulay Méndez (zulay@ula.ve) Ing. Rodrigo Torréns (torrens@ula.ve) Santa Bárbara del Zulia,

Sistemas Silvopastoriles - webdelprofesor.ula.ve

Tdg gilberto instructivo_evaluar_psi_2011

MBA GILBERTO LEÓN SANTAMARÍA

Metodología II - webdelprofesor.ula.ve

Gilberto Owen 205