Por Luciano Gambato e Rodrigo Crespi
Você conhece o AI Document Intelligence?
Este serviço do Azure utiliza recursos de Inteligência Artificial (AI) e Machine Learning para extrair textos, tabelas e estruturas diversas de documentos de forma segura, com precisão e de maneira automatizada.
O serviço torna o processo de transformação dos documentos em dados utilizáveis possível, facilitando a análise e geração de informação. O tratamento dos documentos pode ser iniciado a partir de modelos prontos, isto é, predefinidos pela ferramenta ou através de modelos customizados criados com base em documentos específicos.
O formato habitual de utilização do recurso é através da integração de aplicações por meio das conexões de API, para ler e extrair dados de formulários, cartões, faturas, recibos etc. sem criar códigos extensos que, exigem constante adaptação. A interface de comunicação pode ser utilizada a partir do ambiente Web, denominado Document Intelligence Studio, ou através do SDK, específico para integração com outras aplicações.
Neste post, vamos abordar de forma introdutória alguns métodos e recursos utilizados no processamento e análise de documentos.
O primeiro recurso é o Layout Model, o qual é capaz de avaliar e extrair dados estruturados que representam o conteúdo dos documentos, com base em processos de análise que utilizam Machine Learning e Optical Character Recognition (OCR).
A análise de layout de documentos consegue decompor e extrair as áreas úteis e os seus relacionamentos, através de funções geométricas (texto e tabelas) e lógicas (títulos, cabeçalhos e rodapés).
A figura abaixo ilustra de forma prática a segregação das funções (cabeçalho, título, parágrafo, subtítulo etc.):
A próxima Figura, demonstra a identificação das diferentes seções do documento:
As funções geram, após a análise, a resposta no formato de arquivos JSON, que podem ser facilmente interpretados e integrados com diversas aplicações, conforme representado na figura abaixo:
O segundo recurso utiliza modelos predefinidos para identificação de documentos de fatura e ordens de compra ou venda, que podem ser compostas por imagens, documentos digitalizados e arquivos PDF. Nesse serviço, a API reconhece e indica informações como o nome do cliente, endereço da cobrança, valor, data etc. e, da mesma forma como apresentada na análise de layout, retorna os dados no formato JSON.
A próxima figura ilustra a interpretação de uma fatura:
Note os valores de confiança (confidence), para as informações extraídas e catalogadas. Esses valores podem ser utilizados como parâmetro durante a decodificação do JSON, servindo como forma de indicar o nível de assertividade do modelo na identificação daquela informação.
Com essas informações, imagine um cenário real em que uma empresa possui um processo manual de organização de contas a pagar, no qual um grupo de colaboradores recebe os recibos por e-mail e precisam ler, identificar o fornecedor, data de vencimento e demais informações, para após encaminhar ao setor responsável.
Nesse contexto, o AI Document Intelligence poderia ser utilizado para automatizar a leitura, identificação e classificação destes documentos. A ferramenta poderia consumir um repositório central com todos os documentos e, após a classificação, enviar por e-mail aos setores a síntese dos arquivos que devem ser vistos. Nesse mesmo fluxo, poderia ser incluída uma etapa para gravar as informações em um banco de dados.
Neste post, abordamos algumas funções e aplicações do AI Document Intelligence, aproveitamos para sinalizar que existem diversas atribuições e funcionalidades neste recurso.
Caso você deseje entender um pouco mais sobre, sugerimos a leitura deste material: What is Azure AI Document Intelligence (formerly Form Recognizer)? – Azure AI services | Microsoft Learn.
Esperamos que este post tenha ajudado você a entender um pouco sobre o assunto.
Até a próximo post! 😊