Azure AI Document Intelligence


Por Luciano Gambato e Rodrigo Crespi

Você conhece o AI Document Intelligence?

Este serviço do Azure utiliza recursos de Inteligência Artificial (AI) e Machine Learning para extrair textos, tabelas e estruturas diversas de documentos de forma segura, com precisão e de maneira automatizada.

O serviço torna o processo de transformação dos documentos em dados utilizáveis possível, facilitando a análise e geração de informação. O tratamento dos documentos pode ser iniciado a partir de modelos prontos, isto é, predefinidos pela ferramenta ou através de modelos customizados criados com base em documentos específicos.

O formato habitual de utilização do recurso é através da integração de aplicações por meio das conexões de API, para ler e extrair dados de formulários, cartões, faturas, recibos etc. sem criar códigos extensos que, exigem constante adaptação. A interface de comunicação pode ser utilizada a partir do ambiente Web, denominado Document Intelligence Studio, ou através do SDK, específico para integração com outras aplicações.

Neste post, vamos abordar de forma introdutória alguns métodos e recursos utilizados no processamento e análise de documentos.

O primeiro recurso é o Layout Model, o qual é capaz de avaliar e extrair dados estruturados que representam o conteúdo dos documentos, com base em processos de análise que utilizam Machine Learning e Optical Character Recognition (OCR).

A análise de layout de documentos consegue decompor e extrair as áreas úteis e os seus relacionamentos, através de funções geométricas (texto e tabelas) e lógicas (títulos, cabeçalhos e rodapés).

A figura abaixo ilustra de forma prática a segregação das funções (cabeçalho, título, parágrafo, subtítulo etc.):

A próxima Figura, demonstra a identificação das diferentes seções do documento:

As funções geram, após a análise, a resposta no formato de arquivos JSON, que podem ser facilmente interpretados e integrados com diversas aplicações, conforme representado na figura abaixo:

O segundo recurso utiliza modelos predefinidos para identificação de documentos de fatura e ordens de compra ou venda, que podem ser compostas por imagens, documentos digitalizados e arquivos PDF. Nesse serviço, a API reconhece e indica informações como o nome do cliente, endereço da cobrança, valor, data etc. e, da mesma forma como apresentada na análise de layout, retorna os dados no formato JSON.

A próxima figura ilustra a interpretação de uma fatura:

Note os valores de confiança (confidence), para as informações extraídas e catalogadas. Esses valores podem ser utilizados como parâmetro durante a decodificação do JSON, servindo como forma de indicar o nível de assertividade do modelo na identificação daquela informação.

Com essas informações, imagine um cenário real em que uma empresa possui um processo manual de organização de contas a pagar, no qual um grupo de colaboradores recebe os recibos por e-mail e precisam ler, identificar o fornecedor, data de vencimento e demais informações, para após encaminhar ao setor responsável.

Nesse contexto, o AI Document Intelligence poderia ser utilizado para automatizar a leitura, identificação e classificação destes documentos. A ferramenta poderia consumir um repositório central com todos os documentos e, após a classificação, enviar por e-mail aos setores a síntese dos arquivos que devem ser vistos. Nesse mesmo fluxo, poderia ser incluída uma etapa para gravar as informações em um banco de dados.

Neste post, abordamos algumas funções e aplicações do AI Document Intelligence, aproveitamos para sinalizar que existem diversas atribuições e funcionalidades neste recurso.

Caso você deseje entender um pouco mais sobre, sugerimos a leitura deste material: What is Azure AI Document Intelligence (formerly Form Recognizer)? – Azure AI services | Microsoft Learn.

Esperamos que este post tenha ajudado você a entender um pouco sobre o assunto.

Até a próximo post! 😊

Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors

Categorias

Categorias

Artigos Recentes

A Importância do Power BI na Tomada de Decisão: Um Novo Paradigma para as Empresas

Fale Conosco

Converse com nossos especialistas e descubra como transformar seus dados em informações seguras, disponíveis e acessíveis.

Endereço

Rua Angelo Antonello, 93 – Sala 62, Centro – Farroupilha/RS – CEP: 95170-492

Contato Comercial

Email: contato@cdbdatasolutions.com.br
Telefone: (54) 3401-1471

Abrir bate-papo
Olá
Podemos ajudar?