Tabla de Contenidos

GPU
Tensor Core
Arquitecturas de GPU
Nombres
Memoria
Salida de video:Conectores
Temperatura
Ejercicios

10. Tarjetas Gráficas

En este tema vamos a hablar de las tarjetas gráficas centrándonos en las de la marca NVIDIA, aunque también existen otros fabricantes como AMD o Intel.

Una tarjeta gráfica está compuesta de lo siguiente:

Placa o PCB: Donde se ensambla todo.
Unidad de procesamiento gráfico o GPU (Graphics Processing Unit)
Memoria
Salida de video (Conectores)
Ventiladores

Mas información:

GPU

Al igual que una CPU esta compuesta por núcleos, una GPU está compuesta por Streaming Multiprocessor o SM

La diferencia entre un Núcleo de una CPU y un Streaming Multiprocessor de una GPU es que una GPU es prácticamente muchisimas ALUs o FPUs.

La siguiente arquitectura es de una Tarjeta gŕafica "NVIDIA Quadro RTX 6000" con arquitectura Turing y GPU TU102

6 GPU Processing Clusters o GPC. Cache L2
- 6 Texture Processing Clusters TPC
  - 2 Streaming Multiprocessor o SM. Cache L1
    - 64 CUDA Cores: Cada CUDA Core es una FPU. Tambien llamado FP32. Ya que ejecutan operaciones con números en coma flotante de 32 bits.
    - 64 ALUs: A las ALU se les llama INT32 ya que ejecutan operaciones con números enteros de 32 bits
    - 8 Tensor Cores: Multiplicación y suma de matrices (ALUS o FPUs). Se usan en inteligencia artificial (Redes neuronales)
    - 1 RTX core: Trazado de rayos en video juegos.

Normalmente en las especificaciones no se suele indicar el número de ALUs o INT32 ya que como ya dijimos en las CPUs "ocupan" poco espacio en comparación con una FP32 o FP64 (o CUDA Core)

Los SM internamente se dividen en 4 Processing Blocks o Subcores. Por ello cada subcore consta de:

16 CUDA Cores
16 ALUs
2 Tensor Cores
Registros
Cache L0 para instrucciones

Cada SM tiene su propia cache L1

La tarjeta gráfica incluye una cache L2

Los GPC actuan de manera independiente entre si, pidiendo cada uno dedicarse a una tarea distinta, mientras que los TPC agrupan los SM para que sea más sencillo que los SM se coordinen entre si. Es una arquitectura similar a los CCX y CCD de AMD (veáse amd)

Architecture	Pascal		Turing		Ampere		Ada Lovelace		Blackwell
Graphics Card	GeForce GTX 1080	GeForce GTX 1080Ti	GeForce RTX 2080	GeForce RTX 2080Ti	GeForce RTX 3060	GeForce RTX 3090 Ti	GeForce RTX 4060	GeForce RTX 4090	GeForce RTX 5090
GPU	GP104	GP102	TU104	TU102	GA106	GA102	AD107	AD102	GB202
GPCs	4	6	6	6	3	7	3	11
TPCs	20	28	23	34	14	42	12	64
SMs	20	28	46	68	28	84	24	128	170
CUDA Cores/SM	128	128	64	64	128	128	128	128	128
CUDA Cores/GPU	2.560	3.584	2.944	4.352	3.584	10.752	3.072	16.384	21.760
FP32 TFLOPS	8.9	11.3	10.6	14.2	12.74	40	15.11	82.6	104.8
Tensor Cores/SM	N/A	N/A	8	8	4	4	4	4	4
Tensor Cores/GPU	N/A	N/A	368	544	112	336	96	512	680
RT Cores	N/A	N/A	46	68	28	84	24	128	170

Las GPU tienen varias versiones (variantes), ocurre porque en el proceso de fabricación fallan algunas SMs entonces los venden con menos capacidad o simplemente bajan el rendimiento para ajustar el consumo.

Veamos algunos ejemplos aunque a veces no hay cambios como de una Quadro P5000 a una GeForce GTX 1080 que no hay diferencia pero si de una Quadro P6000 a una GeForce GTX 1080Ti

	GP104
	Quadro P5000	GeForce GTX 1080
TPCs	20	20
SMs	20	20
CUDA Cores/GPU	2560	2560

	GP102
	Quadro P6000	GeForce GTX 1080Ti
TPCs	30	28
SMs	30	28
CUDA Cores/GPU	3840	3584

	TU104
	Quadro RTX 5000	GeForce RTX 2080	GeForce RTX 2080 Super	NVIDIA T4
TPCs	24	23	24	20
SMs	48	46	48	40
CUDA Cores/GPU	3072	2944	3072	2650

	TU102
	Quadro RTX 6000	GeForce RTX 2080Ti
TPCs	36	34
SMs	72	68
CUDA Cores/GPU	4608	4352

	GA102
	GeForce RTX 3090 Ti	GeForce RTX 3080 Ti	NVIDIA A40
TPCs	42	40	42
SMs	84	80	84
CUDA Cores/GPU	10752	10240	10752

	AD102
	GeForce RTX 4090	NVIDIA L40	GeForce RTX 4090 Ti
TPCs	64	71	72
SMs	128	142	144
CUDA Cores/GPU	16384	18176	18432

Mas información:

Tensor Core

Lo que hace un Tensor Core: Multiplicación mas Suma de Matrices.Se usan en inteligencia artificial (Redes neuronales).La aplicación mas utilizada para redes neuronales se llama TensorFlow. Un Tensor es como una matriz pero que puede tener mas de 2 dimensiones.

Mas información:

Arquitecturas de GPU

Al igual que los procesadores, las gráficas también tienen distintas generaciones de microarquitecturas, aunque en este caso se les suele llamar directamente arquitecturas.

Año	Microarquitecturas	Serie	Ejemplo de modelo	GPU
2010	Fermi	GeForce 400	GTX 480	GF100,GF104,GF106,etc.
2012	Kepler	GeForce 600	GTX 680	GK104,GK106,GK107,etc.
2014	Maxwell	GeForce 900	GTX 980 Ti	GM107,GM108
2016	Pascal	GeForce 10	GTX 1080 Ti	GP100,GP102,GP104,etc.
2017	Volta	No es una gráfica	Tesla V100	GV100
2018	Turing	GeForce 20	RTX 2080 Ti	TU102,TU104,TU106,etc.
2020	Ampere	GeForce 30	RTX 3060	GA100,GA102,GA104,etc.
2020	Ampere	No es una gráfica	A100	GA100
2022	Hopper	No es una gráfica	H100 y H200	GH100 y GH200
2022	Lovelace	GeForce 40	RTX 4060	AD102, AD103, AD104, AD106 y AD107
2025	Blackwell	GeForce 50	RTX 5090	GB102,GB103,etc.

NVIDIA ha sacaco junto con la arquitectura Hopper , una gama de CPU llamada Grace. Y podemos comprar ambos productos juntos o separados:

NVIDIA Grace CPU Superchip: Procesador ARM con 144 núcleos
NVIDIA Grace Hopper: Procesador ARM Grace junto con gráfica Hopper.

NOTA: Grace Hopper es el nombre de una mujer que ayudó a crear el lenguaje COBOL (Aun usado en bancos de todo el mundo). Acuñó el termino bug además de muchos otro méritos.

Similar al caso de antes, NVIDIA ha sacado chips con 2 GPU Blackwell junto con un procesador ARM y los ha llamado B100 y B200, según la GPU que lleve

NVIDIA H100 Hopper

NVIDIA Grace CPU Superchip

NVIDIA Grace Hopper

NVIDIA DGX H100: Sistema completo de NVIDIA. Mas información:nvidia-dgx-h100-datasheet.pdf

Nombres

Los nombres de las tarjetas gráficas son las siguientes:

GeForce: Para tarjetas gráficas que se usan en videojuegos
Prefijo:
- GT: Gama Baja
- GTX: Gama alta
- RTX: Gama alta pero con trazado de rayos
Generación: 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50
Modelo:
- Gama Baja: 1, 2, 3
- Gama media baja: 5
- Gama media: 6
- Gama Alta: 7, 8 y 9
Sufijo: Se añade el Ti si son aun mas potentes.

Ejemplos:

RTX 2080 Ti
- Prefijo: RTX
- Generación: 20
- Modelo: 80
- Sufijo: Ti
GT 630
- Prefijo: GT
- Generación: 6
- Modelo: 30
GTX 960
- Prefijo: GTX
- Generación: 9
- Modelo: 60

Mas información:

Tarjetas gráficas de NVIDIA: como diferenciar e identificar cada gama y modelo

Memoria

Las tarjetas gráficas usan memoria RAM pero no es DDR sino otros dos tipos de memoria.

Graphics Double Data Rate (GDDR):
- Hay 6 versiones (GDDR1, GDDR2, … y GDDR6).
- Estandarizada por el JEDEC que es el mismo organismo que el de las DDR.
- Mas barata que la HBM por lo que a mismo precio tiene mas capacidad
- Mas lenta que una HBM
- Mayor consumo energético que una HBM
- Se calientan mas
High Bandwidth Memory (HBM)
- Hay 3 versiones (HBM1, HBM2,… HBM4)
- Mas rápida que la GDDR.
- Menor consumo que la GDDR.
- Mas cara que la GDDR.
- Más difícil de fabricar que la GDDR.

AMD usa HBM2 ya que necesita bajar el consumo aunque sea mas cara.
HBM2 se usan en gráficas profesionales para servidores. La arquitectura Tesla de NVIDIA usa HBM2.
Para algunas tarjetas gráficas, no es necesario tanto ancho de banda como ofrecen las memorias HBM

GDDR6X: Es una variación del GDDR6 que no sigue el estandar del JEDEC. Creada por Micron y NVIDIA. La arquitectura Ampere usa GDDR6X

En el artículo Sin solución en el horizonte: NVIDIA, la GDDR6X y su temperatura en RTX, vemos los problemas de temperatura de las RTX 3080 y RTX 3090. Estos problemas son inicialmente debidos a la mala calidad del Thermal pad pero también a que la memoria GDDR6X genera mas calor que la HBM2.

Mas información:

Salida de video:Conectores

La salida de video es por donde la tarjeta gráfica saca la señal para el monitor.

Existen 5 conectores distintos en las tarjetas gráficas.

Antiguos

VGA: El conector mas antiguo. La señal es analógica.

DVI: Es la evolución del VGA. La señal es digital pero tiene pines para sacar también la señal analógica del VGA.

Modernos

HDMI: La señal es digital pero ademas de la señal de video soporta tambien Audio , Ethernet y hasta la pulsación de teclas de un mando a distancia. Tiene un coste por licencia.
DisplayPort: Es similar al HDMI pero está libre del coste por licencia (Excepto la parte del DRM). Soporta mas velocidad y además permite varios monitores en el mismo cable.
USB-C: Es solo la forma del conector pero internamente se envía la información en DisplayPort.

De cara a ver las velocidades de cada estándar hay que tener en cuenta la codificación:

HDMI 2.1: Codificación 16b/18b
DisplayPort 2.0: Codificación 128b/132b

¿Recuerdas algo similar en los discos SATA?

Mas información:

Temperatura

Al igual que los procesadores, las gráficas también desprenden calor.Dicho calor hay que disiparlo y para ello las tarjetas gráficas incluyen disipadores y/o ventiladores.

Los parámetros que se especifican para saber el calor que generan son los siguientes:

Thermal Design Parameter (TDP): GPU
Total Graphic Power (TGP): GPU+RAM+PCB
Total Board Power (TBP): GPU+RAM+PCB+Ventiladores+leds

Realmente el que nos interesa es el TBP pero como eso depende del ensamblador de la tarjeta , el fabricante de la GPU solo puede dar el TGP. Sin embargo da diferencia entre el TGP y TBP es muy poca ya que el ventilador o los leds generan muy poco calor.

Un TPD o similar mas alto no debe implicar obligatoriamente un mayor consumo eléctrico. Sin embargo al igual que pasaba con las fuentes de alimentación, un TPD mas alto si que implica una peor eficiencia energética. Eso significa que un TPD alto hace que "tiremos" dinero en electricidad al usarse dicha electricidad para generar calor.

Mas información:

Ejercicios

Ejercicio 1

Lee los siguientes artículos para comprobar que entiendes los conceptos que especifican las tarjetas gráficas:

Ejercicio 2

Rellena la siguiente tabla:

	RTX 2080 Ti	RTX 3060
Nº de Streaming Multiprocessor (SM)
Nº total de CUDA Cores
Nº de CUDA Cores en cada SM
Nº total de Tensor Cores
Nº de Tensor Cores en cada SM
Nº total de RTX Cores
Nº de RTX Cores en cada SM
Tamaño de la memoria
Tipo de la memoria
TGP
Precio

Ejercicio 3

Lee el siguiente artículo. ¿Cuánto rendimiento puede ganar una GPU dependiendo del bus de su memoria?

Mira si coinciden los cálculos hechos en el artículo de la AMD Radeon RX 5700 con los datos de de la siguiente página:

AMD Radeon RX 5700 Specs - TechPowerUp GPU Database

Ahora comprueba si coinciden los cálculos hechos en el artículo de la NVIDIA GeForce GTX 1060 con los datos de de la siguiente páginas:

Ejercicio 4

Busca 10 tarjetas gráficas de diversos precios y que estén en la siguiente página PassMark Software - Video Card (GPU) Benchmark Charts - Video Card Model List. Anota para cada una de ellas, el valor de la columna "Passmark G3D Mark".

Haz una gráfica de puntos con lo siguiente.

El eje X mostrará el valor de "Passmark G3D Mark"
El eje Y mostrará el precio de la tarjeta gráfica.
Demás en cada punto de la gráfica debe indicarse el nombre de la tarjeta gráfica a la que corresponde.

Únicamente viendo la gráfica y basándote en la relación calidad/precio (Passmark G3D Mark y precio), explica:

Que tarjeta/s comprarías teniendo un alto presupuesto
Que tarjeta/s comprarías teniendo un bajo presupuesto
Que tarjeta/s NUNCA comprarías teniendo un alto presupuesto
Que tarjeta/s NUNCA comprarías teniendo un bajo presupuesto

Ejemplo de gráfica:

Intentar que haya tarjetas con un precio elevado pero con poco rendimiento y/o viceversa. Lo digo porque así se verá cual merece la pena y cual no.Los precios no los debéis sacar de la propia página de PassMark sino en tiendas "normales" como amazon españa, pccomponentes, app ,etc. Es decir en sitios donde realmente podéis comprar la tarjeta.No hace falta que tengan venta online si son tiendas de aquí de Valencia. La idea no es tener los mejores precios sino aprender a comparar precios. Así que si veis en alguna tiene un precio excesivamente caro para su rendimiento es mejor que la pongáis

Para todas las gráficas recordar que siempre hay que incluir lo siguiente:

Títulos de los ejes
Unidades de los ejes
Título de la gráfica
A ser posible que el eje Y empiece en 0
No usar colores estrambóticos

Ejercicio 5

Haz una gráfica de puntos de tarjetas NVIDIA con lo siguiente.

El eje X mostrará el número total de CUDA Cores
El eje Y mostrará el valor de "Passmark G3D Mark"
Demás en cada punto de la gráfica debe indicarse el nombre de la tarjeta gráfica a la que corresponde.

Indica si hay relación entre los CUDA Cores y el "Passmark G3D Mark"

Ejercicio 6

Rellena para la siguiente tabla, el Nº de CUDA cores que tiene cada modelo de tarjeta gŕaficas

Modelo	Nº CUDA Cores
GeForce GTX 1060
GeForce GTX 1070
GeForce GTX 1080
GeForce RTX 2060
GeForce RTX 2070
GeForce RTX 2080
GeForce RTX 3060
GeForce RTX 3070
GeForce RTX 3080

Muestra ahora esa misma información en la siguiente tabla:

	Generación
	GeForce 10 (Pascal)	GeForce 20 (Turing)	GeForce 30 (Ampere)
Modelo 60
Modelo 70
Modelo 80

¿Se cumple esa frase que se dice que una tarjeta gráfica de una generación es como la siguiente del modelo anterior? Es decir que una GeForce GTX 1070 es como GeForce RTX 2060.

Ejercicios 7

Rellena la siguiente tabla:

Estándar	Velocidad (Gb/s)	Codificación	Ratio	Velocidad útil (Gb/s)
HDMI 2.1
DisplayPort 2.0