Analizadores del Compilador

Download Report

Transcript Analizadores del Compilador

Preposición: suma= var1 + var2 + 10;
Análisis Léxico
El analizador léxico lee los caracteres del programa fuente, y verifica que
correspondan a una secuencia lógica (identificador, palabra reservada etc.). Esta
secuencia de caracteres recibe el nombre componente léxico o lexema. En este caso el
analizador léxico verifica si el identificador id1 (nombre interno para "suma")
encontrado se halla en la tabla de símbolos, si no esta produce un error porque
todavía no fue declarado, si la preposición hubiese sido la declaración del
identificador "suma" en lenguajes C, C++ (int suma;) el analizador léxico agregaria
un identificador en la tabla de símbolos, y así sucesivamente con todos los
componentes léxicos que aparezcan.
id1= id2+ id3 * 10
Errores l¶exicos t¶³picos son:
1. nombre ilegales de identi¯cadores: un nombre contiene caracteres inv¶alidos.
2. n¶umeros incorrectos: un n¶umero contiene caracteres inv¶alidos
o no est¶a formado correctamente, por ejemplo 3,14 en vez
de 3.14 ¶o 0.3.14.
3. errores de ortograf¶³a en palabras reservadas: caracteres omitidos, adicionales o cambiados de sitio, por ejemplo la palabra
hwile en vez de while.
4. ¯n de archivo: se detecta un ¯n de archivo a la mitad de un
componente l¶exico.
Análisis Sintáctico
El analizador sintáctico impone una estructura jerárquica a la cadena de componentes
léxicos, generada por el analizador léxico, que es representada en forma de un árbol
sintáctico.
=
/ \
id1 +
/ \
id2 +
/ \
id3 10
Análisis Semántico
El analizador semántico verificara en este caso que cada operador tenga los operandos
permitidos.
=
/ \
id1 +
/ \
id2 +
/ \
id3 tipo_ent
|
10
Generador de código intermedio
En esta etapa se lleva la preposición a una representación intermedia como un
programa para una maquina abstracta.
temp1= tipo_ent(10)
temp2= id3 * temp1
temp3= id2 + tem2
id1= temp3
Optimización de código
El código intermedio obtenido es representado de una forma mas optima y eficiente.
temp1= id3 * 10.0
id1= id2 + temp1
Generador de código
Finalmente lleva el código intermedio a un código objeto que en este caso es un código
relocalizable o código ensamblador (también llamado código no enlazado).
MOVF id3, R2
MULT #10.0, R2
MOVF id2, R1
ADDF R2, R1
MOVF R1, id1