Parsing de Currículos

O Parsing é a conversão de um documento de currículo de forma livre em um conjunto estruturado de informações (experiências, formação acadêmica, cursos, dados de contato, etc) adequadas para armazenamento, triagem e geração de relatórios. A análise de currículo ajuda os recrutadores a gerenciar com eficiência documentos enviados eletronicamente.

O formato mais comum de currículo / currículo é o MS Word. mas a JobConvo permite tanto arquivos em formato word quanto PDF ou imagens. Apesar de ser fácil para os humanos lerem e entenderem, é bastante difícil para um computador interpretar. Ao contrário de nossos cérebros, que ganham ou disseminam o contexto através da compreensão da situação e levando em consideração as palavras ao seu redor, para um computador um currículo é apenas uma longa sequência de letras, números e pontuação. Um analisador de CV é um programa que pode analisar um documento e extrair dele os elementos do que o escritor realmente quis dizer. No caso de um currículo, as informações são sobre habilidades, experiência profissional, educação, detalhes de contato e realizações.

Processamento de Linguagem Natural

O Processamento de Linguagem Natural (ou NPL em inglês) é um ramo da inteligência artificial que ajuda os computadores a entender, interpretar e manipular a linguagem humana. A NPL se baseia em muitas disciplinas, incluindo ciência da computação e linguística computacional, em sua busca para preencher a lacuna entre a comunicação humana e o entendimento da computação.

Embora o processamento de linguagem natural não seja uma ciência nova, a tecnologia está avançando rapidamente graças ao crescente interesse nas comunicações homem-máquina, além de disponibilidade de big data, computação poderosa e algoritmos aprimorados.

Como humano, você pode falar e escrever em inglês, espanhol ou chinês. Mas a linguagem nativa de um computador – conhecida como código de máquina ou linguagem de máquina – é amplamente incompreensível para a maioria das pessoas. Nos níveis mais baixos do seu dispositivo, a comunicação ocorre não com palavras, mas através de milhões de zeros e que produzem ações lógicas.

OCR

Suponha que você queira digitalizar um currículo ou um contrato impresso. Você pode passar horas digitando e corrigindo erros de impressão. Ou você pode converter todos os materiais necessários em formato digital em segundos usando um software de reconhecimento óptico de caracteres.

O reconhecimento óptico de caracteres ou OCR é a conversão eletrônica ou mecânica de imagens de texto digitado, manuscrito ou impresso em texto codificado por máquina, seja de um documento digitalizado, de uma foto de um documento ou de uma foto de cena (por exemplo o texto em letreiros e outdoors em uma foto de paisagem) ou do texto de legenda sobreposto a uma imagem (por exemplo, de uma transmissão de televisão)