Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Desarrollo de ejercicios Integrantes: Raquel Solano Verónica Ramírez
2.2 Consider a memory system with a level 1 cache of 32 KB and DRAM of 512 MB with the processor operating at 1 GHz. The l...
2.7 What are the major differences between message-passing and shared-address-space computers? Also outline the advantages...
message-passing <ul><li>Ventajas  </li></ul><ul><ul><li>Message Passing requiere poco soporte de hardware, otros de una re...
Shared address space <ul><li>Ventajas </li></ul><ul><ul><li>Proporciona un espacio de direcciones global posee un entorno ...
2.8 Why is it difficult to construct a true shared-memory computer? What is the minimum number of switches for connecting ...
2.9 Of the four PRAM models (EREW, CREW, ERCW, and CRCW), which model is the most powerful?  Why? <ul><li>El mas poderoso ...
2.12 A cycle in a graph is defined as a path originating and terminating at the same node. The length of a cycle is the nu...
2.17 [Lei92] A mesh of trees is a network that imposes a tree interconnection on a grid of processing nodes. A mesh of tre...
<ul><li>Para 2D de malla:  El diámetro es de 2 (   p-1)  Bisección anchura es   p  El número total de conmutadores es p....
Upcoming SlideShare
Loading in …5
×

of

Parallel Programming Plataforms Slide 1 Parallel Programming Plataforms Slide 2 Parallel Programming Plataforms Slide 3 Parallel Programming Plataforms Slide 4 Parallel Programming Plataforms Slide 5 Parallel Programming Plataforms Slide 6 Parallel Programming Plataforms Slide 7 Parallel Programming Plataforms Slide 8 Parallel Programming Plataforms Slide 9 Parallel Programming Plataforms Slide 10
Upcoming SlideShare
Parallel Programming Plataforms
Next
Download to read offline and view in fullscreen.

1 Like

Share

Download to read offline

Parallel Programming Plataforms

Download to read offline

Related Books

Free with a 30 day trial from Scribd

See all

Related Audiobooks

Free with a 30 day trial from Scribd

See all

Parallel Programming Plataforms

  1. 1. Desarrollo de ejercicios Integrantes: Raquel Solano Verónica Ramírez
  2. 2. 2.2 Consider a memory system with a level 1 cache of 32 KB and DRAM of 512 MB with the processor operating at 1 GHz. The latency to L1 cache is one cycle and the latency to DRAM is 100 cycles. In each memory cycle, the processor fetches four words (cache line size is four words). What is the peak achievable performance of a dot product of two vectors? Note: Where necessary, assume an optimal cache placement policy. 1 /* dot product loop */ 2 for (i = 0; i < dim; i++) 3 dot_prod += a[i] * b[i]; <ul><li>Cada 100 ciclos de 4 palabras cada 100 ciclos se obtiene 8 flops ya que hacemos uso de 2 vectores es decir en 200 ciclos si en cien son 4 palabras en 200 hacemos 8 flops es decir en un flop tendremos 25us en total a 40MFlops . </li></ul>
  3. 3. 2.7 What are the major differences between message-passing and shared-address-space computers? Also outline the advantages and disadvantages of the two. <ul><li>Shared address space soporta un espacio de datos común que es accesible a todos los procesadores, en cambio message-passing consiste de p nodos, cada cual tiene su propio espacio de direccionamiento exclusivo. </li></ul><ul><li>  En shared address los procesadores interactúan mediante la modificación de objetos de datos almacenados en este espacio de direcciones compartida, message-passing se utiliza para transferir datos, trabajo y para sincronizar las acciones entre los procesos. </li></ul>
  4. 4. message-passing <ul><li>Ventajas </li></ul><ul><ul><li>Message Passing requiere poco soporte de hardware, otros de una red. </li></ul></ul><ul><ul><li>El programador tiene un control explícito de los datos localidad </li></ul></ul><ul><ul><li>La memoria es escalable con el número de procesadores </li></ul></ul><ul><ul><li>Cada procesador puede rápidamente acceder a su propia memoria, sin interferencias y sin los gastos generales efectuados tratando de mantener la coherencia de caché </li></ul></ul><ul><li>Desventajas </li></ul><ul><ul><li>Difícil de programa: programador tiene que manejar la comunicación de datos entre los procesadores </li></ul></ul><ul><ul><li>Puede ser difícil para asignar estructuras de datos existentes, sobre la base de la memoria global, a la organización de memoria distribuida </li></ul></ul>
  5. 5. Shared address space <ul><li>Ventajas </li></ul><ul><ul><li>Proporciona un espacio de direcciones global posee un entorno de programación fácil de usar para acceder a memoria </li></ul></ul><ul><ul><li>datos comunes entre las tareas es a la vez rápido y uniforme, debido a la proximidad de la memoria para CPUs </li></ul></ul><ul><li>Desventajas </li></ul><ul><ul><li>Falta de escalabilidad entre memoria y CPU: Agregando procesadores pueden incrementar geométricamente el tráfico de la ruta a la memoria compartida de la CPU y la administracion de la coherencia de caché </li></ul></ul><ul><ul><li>La responsabilidad del programador para la construcción de sincronización (correcto acceso a la memoria) </li></ul></ul><ul><ul><li>costoso diseño de memoria compartida con los equipos un número cada vez mayor de los procesadores </li></ul></ul>
  6. 6. 2.8 Why is it difficult to construct a true shared-memory computer? What is the minimum number of switches for connecting p processors to a shared memory with b words (where each word can be accessed independently)? <ul><li>La dificultad de construir computadores de memoria compartida es que tienen dificultad cuando un gran número de procesadores quieren acceder a la memoria al mismo tiempo ya que las computadoras acceden a la memoria a través del bus. El numero total de switch es Q(bp). Por el tamaño razonable de la memoria, la construcción de una red de conmutación de esta complejidad es muy cara. Por lo tanto, un verdadero equipo de memoria compartida es imposible de realizar en la práctica </li></ul>
  7. 7. 2.9 Of the four PRAM models (EREW, CREW, ERCW, and CRCW), which model is the most powerful? Why? <ul><li>El mas poderoso de los modelos de PRAM es el Concurrent-read,concurrent-write(CRCW ) ya que permite accesos de lectura y escritura a una locación de memoria común </li></ul>
  8. 8. 2.12 A cycle in a graph is defined as a path originating and terminating at the same node. The length of a cycle is the number of edges in the cycle. Show that there are no odd-length cycles in a d-dimensional hypercube. <ul><li>No existen ciclos de duración impar ya que cada nodo dispone de la salida de dos arista esto es por cada nodo es decir si tengo dos nodos siempre va a tener 4 aristas si se tiene 3 nodos se tendrá 6 aristas y así sucesivamente a demás aplicando la siguiente formula para ver el numero de nodos que poseemos en un hipercubo nos dice claramente que existen dos aristas para cada nodo su formula es </li></ul><ul><ul><ul><li>donde n es la dimensión del hipercubo </li></ul></ul></ul>
  9. 9. 2.17 [Lei92] A mesh of trees is a network that imposes a tree interconnection on a grid of processing nodes. A mesh of trees is constructed as follows. Starting with a grid, a complete binary tree is imposed on each row of the grid. Then a complete binary tree is imposed on each column of the grid. Figure 2.36 illustrates the construction of a 4 x 4 mesh of trees. Assume that the nodes at intermediate levels are switching nodes. Determine the bisection width, diameter, and total number of switching nodes in a mesh.
  10. 10. <ul><li>Para 2D de malla: El diámetro es de 2 (  p-1) Bisección anchura es  p El número total de conmutadores es p. Para 2D de malla de árbol: N2-una hoja 2D-MOT (N =  p) se compone de nodos N^2 ordenado como en un 2D-matriz N × N (pero sin los enlaces). El N filas y N columnas de la 2d-MOT formulario N fila TCC (Complete Árbol binario) y la columna N TCC, respectivamente. Para esa red, el total de número de nodos es |V | = N 2 +2 N ( N − 1), , el número total de los bordes es |E| = O ( N 2 ), el grado de gráfico es d = 3, el diámetro de la gráfico es D = 4lg N=2lgp , el ancho de bisección de la gráfica es de peso corporal bw= N =  p. El número total de nodos de conmutación es 2 N ( N − 1)=2  p(  p-1). </li></ul>
  • AbalfazlFazlkhoda

    Dec. 8, 2020

Views

Total views

906

On Slideshare

0

From embeds

0

Number of embeds

5

Actions

Downloads

14

Shares

0

Comments

0

Likes

1

×