LLVM

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
LLVM
Desarrollador
LLVM Developer Group
llvm.org
Información general
Lanzamiento inicial 2003
Última versión estable 3.5 (info)
4 de septiembre de 2014; hace 46 días (2014-09-04)
Género Compilador
Programado en C++
Plataforma Multiplataforma
Licencia University of Illinois/NCSA Open Source License
Estado actual En desarrollo
En español No No

LLVM (anteriormente conocido como Low Level Virtual Machine, o Máquina Virtual de Nivel Bajo) es una infraestructura para desarrollar compiladores, escrita a su vez en el lenguaje de programación C++, que está diseñada para optimizar el tiempo de compilación, el tiempo de enlazado, el tiempo de ejecución y el "tiempo ocioso" en cualquier lenguaje de programación que el usuario quiera definir. Implementado originalmente para compilar C y C++, el diseño agnóstico de LLVM con respecto al lenguaje, y el éxito del proyecto han engendrado una amplia variedad de lenguajes, incluyendo Objective-C, Fortran, Ada, Haskell, bytecode de Java, Python, Ruby, ActionScript, GLSL, Clang, Rust, Gambas y otros.

El proyecto LLVM comenzó en 2000 en la Universidad de Illinois en Urbana-Champaign, bajo la dirección de Vikram Adve y Chris Lattner. LLVM fue desarrollado inicialmente bajo la Licencia de código abierto de la Universidad de Illinois, una licencia de tipo BSD. En 2005, Apple Inc. contrató a Lattner y formó un equipo para trabajar en el sistema de LLVM para varios usos dentro de los sistemas de desarrollo de Apple.[1] LLVM es parte integrante de las últimas herramientas de desarrollo de Apple para Mac OS X e iOS.[2]

El nombre "LLVM" era en principio las iniciales de "Low Level Virtual Machine", pero esta denominación causó una confusión ampliamente difundida, puesto que las máquinas virtuales son solo una de las muchas cosas que se pueden construir con LLVM. Cuando la extensión del proyecto se amplió incluso más, LLVM se convirtió en un proyecto paraguas que incluye una multiplicidad de otros compiladores y tecnologías de bajo nivel, haciendo el nombre aún menos adecuado. Por tanto, el proyecto abandonó[3] las iniciales. Actualmente, LLVM es una "marca" que se aplica al proyecto paraguas, la representación intermedia LLVM, el depurador LLVM, la biblioteca estándar de C++ definida por LLVM, etc...

Descripción[editar]

LLVM suministra las capas intermedias de un sistema de compilado completo, tomando el código en formato intermedio (IF, en sus siglas en inglés) de un compilador y emitiendo un IF optimizado. Este nuevo IF puede ser convertido y enlazado en un código ensamblador dependiente de la máquina concreta para una plataforma objetivo. LLVM puede aceptar el IF generado por la cadena de herramientas GCC, permitiendo así que sea utilizado con todos los lenguages que a su vez son aceptados por GCC.

LLVM también puede generar código máquina relocalizable en el momento de compilación o de enlazado, o incluso código máquina binario en el momento de ejecución.

LLVM permite un conjunto de instrucciones y sistema de tipos independientes del lenguaje. Cada instrucción está en una forma estática de asignación única (SSA, en inglés, static single assignment), es decir, que cada variable (llamado un registro tipado) es asignada una sola vez y congelado. Esto ayuda a simplificar el análisis de las dependencias entre variables. LLVM permite que el código sea compilado estáticamente, al igual que lo es bajo el sistema GCC tradicional, o por el contrario que se deje para una complación tardía desde la IF a código máquina en una compilación en tiempo de ejecución de manera similar a como lo hace Java. El sistema de tipos consiste de tipos básicos como entero, números de coma flotante y cinco tipos de datos compuestos (en inglés): punteros, vectores, matrices, tuplas y funciones. Un constructo tipado en un lenguaje concreto puede ser representado combinando estos tipos básicos en LLVM. Por ejemplo, una clase en C++ puede ser representada por una combinación de estructuras, funciones y matrices de punteros a funciones.

El compilador de tiempo de ejecución puede optimizar ramales estáticos no utilizados de un programa durante la ejecución, y por tanto es útil para la evaluación parcial en los casos en los que un programa tiene muchas opciones, muchas de las cuales pueden ser determinadas como innecesarias en un entorno específico. Esta característica es usada en la pipeline de OpenGL en el Mac OS X Leopard (v10.5) para proporcionar soporte a características ausentes del hardware.[4] El código de gráficos dentro de la pila de OpenGL se dejó en forma intermedia, y después compilado cuando se ejecuta en la máquina de destino. En sistemas con GPUs de gama alta, el código resultante era bastante escaso y redirigía las instrucciones a la GPU con cambios mínimos. En sistemas con GPUs de gama baja, LLVM compilaba procedimientos opcionales para que se ejecutaran en la unidad central de procesamiento (CPU) local que emularan las instrucciones que la GPU no podía ejecutar internamente. LLVM mejoró el rendimiento de las máquinas de gama baja que usaban conjuntos de chips Intel GMA. Un sistema similar fue desarrollado bajo la Gallium3D LLVMpipe e incorporado en la shell de GNOME para permitir que se ejecute sin una GPU.[5]

Por contraste, en los casos en que el rendimiento puro es medido como referencia, LLVM 2.9 va por detrás de GCC 4.6.1 en calidad del código, entendida como velocidad de los programas compilados, en torno al 10% de media, a la vez que compila de 20 a 30% más rápido.[6] [7]

Frontales[editar]

LLVM fue escrito originalmente como un sustituto de un generador de código ya existente dentro de la pila GCC,[8] y muchos de los frontales para GCC han sido modificados para trabajar con él. Algunos de los frontales actualmente incluidos en LLVM fueron derivados de las versiones 4.0.1 y 4.2 de la GNU Compiler Collection.

El amplio interés que ha recibido LLVM ha llevado a una serie de tentativas para desarrollar frontales totalmente nuevos para una variedad de lenguajes. El que ha recibido la mayor atención es Clang, un nuevo compilador que soporta C, Objective-C y C++. Apoyado principalmente por Apple, Clang aspira a reemplazar al compilador de C y Objective-C en el sistema GCC con un sistema más moderno que sea más fácil de integrar con entornos de desarrollo integrado (IDEs), y que tenga un soporte más amplio para multihilo. El desarrollo de Objective-C bajo GCC estaba estancado y los cambios de Apple en el lenguaje eran soportados en una rama mantenida por separado. Crear su propio compilador les permitió abordar muchos de los mismos problemas que LLVM abordó para la integración con IDEs y otras características modernas, a la vez que hacer la rama principal de desarrollo la rama de implementación de Objective-C.

El compilador de Haskell de Utrecht puede generar código para LLVM que, a pesar de que el generador está en las primeras etapas de desarrollo, ha demostrado en varias ocasiones ser más eficiente que el generador de código C.[9] El Glasgow Haskell Compiler (GHC) tiene un sistema de back-end de LLVM en funcionamiento que consigue una aceleración del 30% en el código compilado comparado con código nativo compilado mediante GHC o generación de código C seguida de compilación, faltando solo una de las muchas técnicas de optimización realizadas por GHC.[10]

Existen muchos otros componentes en varios estadios de desarrollo; incluyendo, sin ser exhaustivos, un frontal para bytecode de Java, un frontal para CPython[11] la implementación de Ruby 1,9 para Mac (MacRuby), varios frontales para Standard ML, y un nuevo asignador de registros de coloración de grafos.

Veáse también[editar]

Referencias[editar]

  1. Adam Treat (19-02-2005). «mkspecs and patches for LLVM compile of Qt4». Consultado el 27-01-2012.
  2. Apple (ed.): «Apple LLVM Compiler». Consultado el 27-01-2012.
  3. «Chris Lattner discusses the name LLVM». Consultado el 22-12-2011.
  4. Chris Lattner (15 Agosto 2006). «A cool use of LLVM at Apple: the OpenGL stack». Consultado el 26 Octubre 2009.
  5. Michael Larabel, "GNOME Shell Works Without GPU Driver Support", phoenix, 6 Noviembre 2011
  6. V. Makarov. «SPEC2000: Comparison of LLVM-2.9 and GCC4.6.1 on x86». Consultado el 3 Octubre 2011.
  7. V. Makarov. «SPEC2000: Comparison of LLVM-2.9 and GCC4.6.1 on x86_64». Consultado el 3 Octubre 2011.
  8. Lattner, Chris; Vikram Adve (Mayo 2003). «Architecture For a Next-Generation GCC» en First Annual GCC Developers' Summit. . Consultado el 6 Septiembre 2009.
  9. «Compiling Haskell to LLVM». Consultado el 22 Febrero 2009.
  10. «LLVM Project Blog: The Glasgow Haskell Compiler and LLVM». Consultado el 13 Agosto 2010.
  11. «unladen-swallow - A faster implementation of Python». Consultado el 7 Mayo 2009.

Enlaces externos[editar]