Un analizador léxico o analizador lexicográfico (en inglés scanner) es un programa
que recibe como entrada el código fuente de otro programa (secuencia de caracteres) y produce una salida compuesta de tokens (componentes léxicos) o símbolos. Estos tokens sirven para una posterior etapa del proceso de traducción, siendo la entrada para el analizador sintáctico (en inglés parser).
COMPONENTES DE UN ANALIZADOR LÉXICO
Patrón: Es una regla que genera la secuencia de caracteres que puede representar a un determinado componente léxico (Expresión regular). Regla que permite determinar qué lexemas pertenecen a un token.
Tokens: Secuencia de caracteres que tienen un significado colectivo.
Palabras reservadas: if, while, repeat.
Identificadores: Posición, velocidad, tiempo.
Operadores: = * + - / == > < & ¡=
Símbolos especiales: ; ( ) [ ] { } …
Constantes Numéricas: 982, 0xF678, -83.2E+2
Constantes de caracteres: “Hola mundo”
Lexema: Cadena de caracteres que concuerda con un patrón que describe un componente léxico,
BILIOGRAFÍA: