Análisis de Currículos

El Análisis de Currículos – Resume Parsing en inglés – es una conversión a partir de un documento construido de forma libre, sin estructura o formato, a un conjunto estructurado de información adecuado para el almacenamiento, el análisis, los informes y la manipulación por software. El Análisis de Currículos ayuda a los reclutadores a gestionar eficientemente los currículos recibidos y enviados digitalmente.

El tipo de archivo más común para currículos es el MS Word. A pesar de ser tan fácil de leer y comprender para los humanos, es bastante difícil de interpretar para una computadora. A diferencia del cerebro humano que entiende el contexto a través de la comprensión de la situación junto con la consideración e interpretación de las palabras que la describen, para una computadora, un currículo es simplemente una serie de letras, números y signos de puntuación. Un Analizador de Currículos – CV parser en inglés – es un programa que permite realizar lectura de documentos y extraer información, sin perder el sentido de la idea que el escritor quería transmitir. En el caso de los currículos, se realiza extracción de información como habilidades, experiencia laboral, formación académica, logros y detalles de contacto.

Procesamiento del Lenguaje Natural

El Procesamiento del Lenguaje Natural – Natural Language Processing (NLP) en inglés – es una rama de la inteligencia artificial que ayuda a las computadoras a comprender, interpretar y manipular el lenguaje humano. El NLP se basa en muchas disciplinas, entre ellas las ciencias de la computación y la lingüística computacional, en su búsqueda por llenar el vacío entre la comunicación humana y la comprensión de la computadora.

Aunque el Procesamiento del Lenguaje Natural no es una ciencia nueva, la tecnología está avanzando rápidamente gracias a un mayor interés en la comunicación Hombre-Máquina, además del crecimiento del Big Data, poderosas y modernas máquinas que existen en la actualidad y la optimización de algoritmos.

Como humano, usted puede hablar y escribir otros idiomas como el Inglés, el Portugués o el Mandarín. Pero el lenguaje nativo de las computadoras – machine language – es en gran medida incomprensible para la mayoría de las personas. En los niveles más bajos de su dispositivo, la comunicación ocurre no con palabras, sino a través de millones de ceros y unos que producen acciones lógicas.

OCR

Suponga que desea digitalizar un artículo de una revista o un contrato impreso. Podría pasar horas reescribiendo y luego corrigiendo ortografía. O en cuestión de segundos, podría convertir todo el material en un documento digital utilizando un software de Reconocimiento Óptico de Caracteres.

El Reconocimiento Óptico de Caracteres – Optical Character Recognition (OCR) en inglés – es la conversión electrónica o mecánica de imágenes de texto mecanografiado, escrito a mano o impreso en texto codificado por máquina, ya sea de un documento escaneado, una foto de un documento, una foto de escena (por ejemplo el texto en carteles y vallas publicitarias en una foto de paisaje) o del texto superpuesto en una imagen (por ejemplo, de una transmisión de televisión).