GNU Compiler Collection

De Wikipedia, la enciclopedia libre

(Redirigido desde GCC)
GNU Compiler Collection

GCC invocado desde la línea de comandos en Debian
Desarrollador Proyecto GNU
Última versión estable 4.3.3[1]
(24 de enero de 2009)
S.O. Multiplataforma
Género Compilador
Licencia GPL
Sitio web gcc.gnu.org

GNU Compiler Collection -Colección de Compiladores GNU- es un conjunto de compiladores creados por el proyecto GNU. GCC es software libre y lo distribuye la FSF bajo la licencia GPL. Estos compiladores se consideran estándar para los sistemas operativos derivados de UNIX, de código abierto o también de propietarios, como Mac OS X. GCC requiere el conjunto de aplicaciones conocido como binutils para realizar tareas como identificar archivos objeto u obtener su tamaño para copiarlos, traducirlos o crear listas, enlazarlos, o quitarles símbolos innecesarios.

Originalmente GCC significaba GNU C Compiler (compilador GNU para C), porque sólo compilaba el lenguaje C. Posteriormente se extendió para compilar C++, Fortran, Ada y otros.

Contenido

[editar] Objetivo

GCC es parte del proyecto GNU, el cual tiene como objetivo mejorar el compilador usado en los sistemas GNU incluyendo la variante GNU/Linux. El desarrollo de GCC usa un entorno de desarrollo abierto y soporta muchas otras plataformas con el fin de fomentar el uso de un compilador-optimizador de clase global, para atraer muchos equipos de desarrollo, para asegurar que GCC y los sistemas GNU funcionen en diferentes arquitecturas y diferentes entornos, y más aún, para extender y mejorar las características de GCC.

[editar] Lenguajes

En la versión 4.2.3 (liberada el 1 de febrero de 2008), se incluyen front ends para:

Anteriormente se incluía un front end para CHILL, pero fue desechado debido a la falta de mantenimiento. El front end G77 fue abandonado en favor del nuevo GFortran que soporta Fortran 95. También existen front ends para Pascal, Cobol, Modula-2, Modula-3, Mercury, VHDL, Unified Parallel C (UPC), D y PL/1, pero no se incluyen en la distribución principal.

[editar] Arquitecturas

En la versión 4.2.3 se incluye soporte para: ARC, ARM, Blackfin, CRIS, CRX, Darwin, DEC Alpha, DEC Alpha/VMS, FRV, GNU/Linux, H8/300, H8/500, HPPA, IA-64 "Itanium", M32C, M32R/D, MIPS, MMIX, MN10300, Morpho MT, Motorola M680x0, Motorola M68hc1x, Motorola 88000, PA-RISC, PDP-11, PowerPC, RS/6000, Score, SPARC, SuperH, System/370, System 390, System V, TMS320C3x/C4x, V850, VAX, x86, x86-64, Xstormy16, Xtensa, zSeries

También hay soporte para arquitecturas menos conocidas: A29K, Atmel AVR, C4x, D30V, DSP16xx, FR-30, FR-V, Intel i960, IP2000, MN10200, NS32K y ROMP.

Se ha dado soporte para procesadores adicionales, como D10V, PDP-10, y Z8000 en versiones mantenidas separadas de la versión de la FSF.

[editar] Estructura

La interfaz exterior de GCC es generalmente estándar para un sistema UNIX. Los usuarios llaman un programa controlador llamado gcc, que interpreta los argumentos dados, decide que compilador usar para cada archivo y ejecuta el ensamblador con el código resultante, después posiblemente ejecuta el enlazador para producir un programa completo.

Cada uno de los compiladores es un programa independiente que toma como entrada código fuente y produce código en ensamblador. Todos ellos tienen una estructura interna común: un front end por lenguaje que procesa el lenguaje y produce un árbol de sintaxis y un back end, que convierte esos árboles al lenguaje RTL (lenguaje de transferencia de registros) de GCC, luego realiza varias optimizaciones y produce el ensamblador utilizando un reconocimiento de patrones específico para la arquitectura, originalmente basado en un algoritmo de Jack Davidson y Chris Fraser.

Casi todo GCC está escrito en C, aunque gran parte del front end de Ada está escrito en Ada.

[editar] Front ends

Los front ends varían internamente, teniendo que producir árboles que puedan ser manejados por el back end. Todos los analizadores son analizadores recursivos descendentes y fueron escritos manualmente, no generados automáticamente.

Hasta hace poco, el árbol de representación de programa no era totalmente independiente del procesador para el que se quería generar el código.

Recientemente se han incluido dos nuevas formas de árbol independientes del lenguaje. Estos nuevos formatos son llamados GENERIC y GIMPLE. El análisis ahora es realizado creando árboles temporales dependientes del lenguaje y convirtiéndolos a GENERIC. El gimplifier convierte esto a GIMPLE, que es el lenguaje común para un gran número de optimizaciones independientes de la arquitectura y del lenguaje.

La optimización en árboles no entra en lo que la mayoría de los desarrolladores de compiladores consideran trabajo del front end, ya que no es dependiente del lenguaje y no involucra el análisis. Los desarrolladores de GCC han dado a esta parte del compilador el nombre de middle end. Las optimizaciones incluyen eliminación de código que nunca se ejecuta, eliminación parcial de redundancia, redundancia a la hora de evaluar expresiones... Actualmente se está trabajando en optimizaciones basadas en dependencia de arreglos.

[editar] Back end

El comportamiento del backend está parcialmente especificado por el preprocesador de macros específicas a la arquitectura objetivo, por ejemplo para definir la posición de los bits más significativos, tamaño de palabra, convención para llamadas, etc. El backend utiliza éstas para la generación de RTL, aunque en GCC éste es independiente del procesador, la secuencia inicial de instrucciones abstractas es adaptada a la arquitectura objetivo.

[editar] Referencias

  1. Free Software Foundation, Inc. GCC 4.3 Release Series {{subst:en}}.

[editar] Véase también

[editar] Enlaces externos (inglés)

Herramientas personales
Crear un libro