Maxwell (microarquitectura)

De Wikipedia, la enciclopedia libre
Ir a la navegación Ir a la búsqueda

Maxwell, es el nombre clave de una microarquitectura de GPU desarrollada por Nvidia como el sucesor de Kepler. La arquitectura Maxwell fue introducida en los modelos posteriores de la serie Geforce 700 al igual que en las series Geforce 800M, Geforce 900 y Quadro Mxxx , todas son fabricadas en 28 nm.[1]

Los primeros productos que contaban con Maxwell en salir al mercado , fueron la Geforce GTX 750 y GTX 750 Ti. Ambos fueron lanzados el 18 de febrero de 2014 y utilizaban el chip GM107. Las primeras series de Geforce 700 aún continuaban utilizando Kepler, con chips GK1XX. Las GPU GM10X también fueron utilizadas en la serie Geforce 800M y Quadro Kxxx.

Una segunda generación de productos Maxwell fue introducida el 18 de septiembre de 2014, con la Geforce GTX 970 y la Geforce GTX 980, seguido por la Geforce GTX 960 el 22 de enero de 2015, durante ese mismo año se lanzaron la Geforce GTX Titan X en marzo 17 y la Geforce GTX 980 Ti el primero de Junio. Estas GPU contaban con la serie de chip GM20x.

Maxwell introdujo un diseño completamente nuevo para el Streaming Multiprocesador (SM) que dramáticamente mejora la eficiencia de energía,[2]​ además la sexta y séptima generación de PureVideo (NVIDIA) y la versión 5.2 de CUDA.

Primera generación Maxwell (GM10x)[editar]

La primera generación de GPU´s Maxwell (GM107, GM108) fue lanzada como Geforce GTX 745, 750/750 Ti, 850M/860M (GM107) y la GTX 830M/840M (GM108). Estos GPU´s ofrecían pocas nuevas características para atraer al consumidor, ya que principalmente se enfocaba en la eficiencia de energía de la GPU. El Caché L2 fue incrementado de 256 KiB en Kepler, a 2 MiB en Maxwell, reduciendo la necesidad del ancho de banda de la memoria , el bus de la memoria fue reducido de 192 bits en Kepler a 128 bits , para ayudar reducir el gasto de energía.[3]

El Streaming Multiprocesador diseñado para Kepler fue reestructurado y particionado, renombrándolo como SMM por Maxwell. La estructura del warp scheduler fue heredada de Kepler, junto con la unidad de texturas y núcleos FP64 CUDA que siguen siendo compartidos, pero el diseño de la mayoría de las unidades de ejecuciones fue particionado para que cada warp scheduler en un SMM controle un paquete de 32 núcleos FP32 CUDA , dividiéndose así en dos paquetes, uno de 8 cargar/guardar unidades y otro de 8 unidades especiales. Esto permitió un mejor manejo de recursos que en Kepler, ahorrando más energía cuando la carga de trabajo no es óptima para compartir recursos. Nvidia dice que 128 CUDA cores SMM tienen el %90 de rendimiento de 192 CUDA cores de SMX, incrementando la eficiencia por un factor de 2,[3]​ además de que cada GPC (Graphics Processing Cluster) contiene 4 unidades SMX en Kepler, mientras que en la primera generación Maxwell contiene 5 unidades SMM.[3]


El chip GM107 también soporta CUDA 5.0 a comparación del 3.5 en GK110/GK208 y 3.0 en GPU´s GK10X. Paralelismo dinámico y HyperQ también son soportados por todos los productos Maxwell.

Maxwell proporciona operaciones atómicas compartidas para enteros de 32-bits y memoria compartida de 32-bits y 64-bits de comparar y cambiar (CAS), que puede ser utilizada para implementar otras funciones atómicas.


NVENC[editar]

Las GPU´s basadas en Maxwell contienen el codificador de vídeo NVENC, que fue introducido en Kepler, este nuevo codificador es de 1.5 a 2 veces más rápido que su antecesor, esto significa que puede decodificar vídeos de 6 a 8 veces la velocidad de su reproducción.[3]

PureVideo[editar]

Nvidia dice que hay un incremento de 8 a 10 veces en el rendimiento de Nvidia PureVideo, que es un decodificador de vídeo, cuando se decodifica un vídeo se entra al estado de baja energía llamado “GC5” para ahorrar energía.[3]

Chips[editar]

  • GM107
  • GM108

Segunda generación Maxwell (GM20x)[editar]

La segunda generación de Maxwell fue introducida con varias nuevas tecnologías: Resolución Super Dinámica,[4]​ Tercera Generación de Compresión de Color Delta,[5]​ Multi-Pixel Programming Sampling,[6]​ Nvidia VXGI (Real-Time-Voxel-Global Illumination),[7]​ VR Direct,[8][9][10]​ Multi-Projection Acceleration,[5]​y Multi-Frame Sampled Anti-Aliasing(MFAA)[11]​ (aunque , el soporte para el Coverage-Sampling Anti-Aliasing(CSAA) fue removido).[12]​ soporte para HDMI 2.0 también fue añadido.[13][14]

La proporción de los controladores de memoria ROP fue cambiada de 8:1 a 16:1.[15]​ Sin embargo, algunos de los ROP´s generalmente se mantienen inmóviles en la GTX 970, causando que no haya suficientes SMM´s para darles trabajo, reduciendo su máxima tasa de relleno.[16]

El chip GM204 soporta CUDA 5.2 a comparación de los chips de primera generación con la versión 5.0.[5][15][17]

Las GPUs GM20X tienen una actualización de NVENC, que añade soporte para la codificación de resoluciones a 1440p/60FPS y 4k/60FPS.[10]

Después de varias quejas por parte de los usuarios,[18]​ Nvidia reveló que es posible deshabilitar unidades individuales, cada una conteniendo 256KB de caché L2 y 8 ROP´s, sin tener que deshabilitar todos los controladores de memoria.[19]​ Esto al precio de dividir la memoria bus en segmentos de alta velocidad y baja velocidad, que no pueden ser accedidos al mismo tiempo para leer, ya que el caché L2 y los ROP´s manejan los controladores GDDR5, compartiendo el canal de leer y de escribir información, esto hace que sea imposible que los dos controladores accedan al mismo a tiempo a leer o a escribir.[19]​ Esto es utilizado en la Geforce GTX 970 y por eso puede ser descrita como que tiene 3.5GB en el segmento de alta velocidad y 512MB en la de baja velocidad.[19]​La velocidad máxima de la GPU todavía puede ser alcanzada, pero solamente si un segmento se encuentra realizando una operación de escribir y el otro de leer.[19]

Chips[editar]

  • GM200
  • GM204
  • GM206

Sucesor[editar]

Después de Maxwell la siguiente arquitectura será llamada Pascal.[20]​ Nvidia anuncio que Pascal contendrá DRAM, Unified Memory, y NVLink.[20]

Véase también[editar]

Referencias[editar]

  1. http://videocardz.com/50902/nvidia-geforce-gtx-880-gtx-870-coming-fall
  2. «5 Things You Should Know About the New Maxwell GPU Architecture». 21 de febrero de 2014. 
  3. a b c d e Smith, Ryan; T S, Ganesh (18 de febrero de 2014). «The NVIDIA GeForce GTX 750 Ti and GTX 750 Review: Maxwell Makes Its Move». AnandTech. Archivado desde el original el 18 de febrero de 2014. Consultado el 18 de febrero de 2014. 
  4. http://www.geforce.com/whats-new/articles/dynamic-super-resolution-instantly-improves-your-games-with-4k-quality-graphics
  5. a b c «Copia archivada». Archivado desde el original el 21 de julio de 2017. Consultado el 2 de septiembre de 2015. 
  6. http://www.geforce.com/hardware/technology/mfaa/technology
  7. http://www.geforce.com/whats-new/articles/maxwells-voxel-global-illumination-technology-introduces-gamers-to-the-next-generation-of-graphics
  8. http://www.geforce.com/whats-new/articles/maxwell-architecture-gpus-the-only-choice-for-virtual-reality-gaming
  9. http://blogs.nvidia.com/blog/2014/09/18/maxwell-virtual-reality/
  10. a b http://www.anandtech.com/show/8526/nvidia-geforce-gtx-980-review/5
  11. http://www.geforce.com/whats-new/articles/multi-frame-sampled-anti-aliasing-delivers-better-performance-and-superior-image-quality
  12. «Copia archivada». Archivado desde el original el 2 de octubre de 2015. Consultado el 2 de septiembre de 2015. 
  13. http://www.geforce.com/whats-new/articles/maxwell-architecture-gtx-980-970
  14. http://www.anandtech.com/show/8526/nvidia-geforce-gtx-980-review
  15. a b http://www.anandtech.com/show/8526/nvidia-geforce-gtx-980-review/3
  16. http://techreport.com/blog/27143/here-another-reason-the-geforce-gtx-970-is-slower-than-the-gtx-980
  17. http://devblogs.nvidia.com/parallelforall/maxwell-most-advanced-cuda-gpu-ever-made/
  18. http://www.lazygamer.net/general-news/nvidias-gtx970-has-a-rather-serious-memory-allocation-bug/
  19. a b c d http://www.anandtech.com/show/8935/geforce-gtx-970-correcting-the-specs-exploring-memory-allocation/2
  20. a b http://blogs.nvidia.com/blog/2014/03/25/gpu-roadmap-pascal/