Giter Club home page Giter Club logo

dio-machine-learning-lab-02's Introduction

Reconhecimento Facial e transformação de imagens em Dados no Azure ML - Laboratório 2

Analise imagens, detecte rostos e leia textos no Vision Studio

Análise de imagens

O Azure AI Vision inclui inúmeras capacidades para compreender o conteúdo e o contexto da imagem e extrair informações das imagens. O Azure AI Vision Studio permite-lhe experimentar muitas das capacidades de análise de imagens. Neste exercício, você usará o Vision Studio para analisar imagens usando as experiências de teste integradas. Suponhamos que o retalhista fictício Northwind Traders tenha decidido implementar uma “loja inteligente”, na qual os serviços de IA monitorizam a loja para identificar os clientes que necessitam de assistência e direcionam os funcionários para os ajudar. Ao utilizar o Azure AI Vision, as imagens captadas por câmaras em toda a loja podem ser analisadas para fornecer descrições significativas do que representam.

Detecção de rostos

As soluções de visão geralmente exigem que a IA seja capaz de detectar rostos humanos. Suponha que a empresa varejista fictícia Northwind Traders queira localizar onde os clientes estão em uma loja para melhor atendê-los. Uma maneira de fazer isso é determinar se há algum rosto nas imagens e, em caso afirmativo, retornar as coordenadas da caixa delimitadora que mostram sua localização. Para testar as capacidades de deteção facial do serviço Azure AI Face, utilizará o Azure Vision Studio. Esta é uma plataforma baseada em UI que permite explorar os recursos do Azure AI Vision sem a necessidade de escrever nenhum código.

Leia textos

Neste exercício, você usará o serviço Azure AI para explorar os recursos de reconhecimento óptico de caracteres do Azure AI Vision. Você usará o Vision Studio para experimentar a extração de texto de imagens, sem precisar escrever nenhum código. Um desafio comum da visão computacional é detectar e interpretar texto incorporado em uma imagem. Isso é conhecido como reconhecimento óptico de caracteres (OCR). Neste exercício você usará um recurso de serviços de IA do Azure, que inclui serviços do Azure AI Vision. Em seguida, você usará o Vision Studio para testar o OCR com diferentes tipos de imagens.

Crie um recurso de serviços de IA do Azure

Você pode usar os recursos de análise de imagem do Azure AI Vision com um recurso multisserviço de serviços de IA do Azure. Se ainda não o fez, crie um recurso de serviços de IA do Azure na sua assinatura do Azure.

Em outra guia do navegador, abra o portal do Azure em https://portal.azure.com, entrando com a conta da Microsoft associada à sua assinatura do Azure.

  1. Clique no botão + Criar um recurso e pesquise os serviços de IA do Azure. Selecione criar um plano de serviços de IA do Azure. Você será levado a uma página para criar um recurso de serviços de IA do Azure. Configure-o com as seguintes configurações:
    • Assinatura: sua assinatura do Azure.
    • Grupo de recursos: Selecione ou crie um grupo de recursos com um nome exclusivo.
    • Região: Leste dos EUA.
    • Nome: Insira um nome exclusivo.
    • Nível de preços: Padrão S0.
  2. Ao marcar esta caixa, confirmo que li e compreendi todos os termos abaixo: Selecionado.
  3. Selecione Revisar + criar e depois Criar e aguarde a conclusão da implantação.

Conecte seu recurso de serviço de IA do Azure ao Vision Studio

Em seguida, conecte o recurso de serviços de IA do Azure provisionado acima ao Vision Studio.

  1. Em outra guia do navegador, navegue até Vision Studio em https://portal.vision.cognitive.azure.com.

  2. Entre com sua conta e certifique-se de usar o mesmo diretório onde você criou seu recurso de serviços de IA do Azure.

  3. Na página inicial do Vision Studio, selecione Visualizar todos os recursos no título Introdução ao Vision.

  4. Na página Selecione um recurso para trabalhar, passe o cursor do mouse sobre o recurso que você criou acima na lista e marque a caixa à esquerda do nome do recurso e selecione Selecionar como recurso padrão.

  5. Feche a página de configurações selecionando o “x” no canto superior direito da tela.

Gerar legendas para uma imagem

Agora você está pronto para usar o Vision Studio para analisar imagens tiradas por uma câmera na loja Northwind Traders .

Vejamos a funcionalidade de legenda de imagens do Azure AI Vision. As legendas das imagens estão disponíveis por meio dos recursos Legenda e Legendas densas.

  1. Em um navegador da web, navegue até Vision Studio.

  2. Na página inicial Introdução ao Vision, selecione a guia Análise de imagem e, em seguida, selecione o bloco Adicionar legendas às imagens.

  3. No subtítulo Experimente, reconheça a política de uso de recursos lendo e marcando a caixa.

  4. Selecione https://aka.ms/mslearn-images-for-análise para baixar image-análise.zip. Abra a pasta no seu computador e localize o arquivo chamado store-camera-1.jpg.

  5. Carregue a imagem store-camera-1.jpg arrastando-a para a caixa Arrastar e soltar arquivos aqui ou navegando até ela em seu sistema de arquivos.

  6. Observe o texto da legenda gerado, visível no painel Atributos detectados à direita da imagem. A funcionalidade Caption fornece uma única frase em inglês legível que descreve o conteúdo da imagem.

  7. Em seguida, use a mesma imagem para realizar legendas densas. Retorne à página inicial do Vision Studio e, como fez antes, selecione a guia Análise de imagem e, em seguida, selecione o bloco Legenda densa. O recurso Dense Captions difere do recurso Caption porque fornece diversas legendas legíveis para uma imagem, uma descrevendo o conteúdo da imagem e outras, cada uma cobrindo os objetos essenciais detectados na imagem. Cada objeto detectado inclui uma caixa delimitadora, que define as coordenadas dos pixels na imagem associada ao objeto.

  8. Passe o mouse sobre uma das legendas na lista de atributos detectados e observe o que acontece na imagem. Mova o cursor do mouse sobre as outras legendas da lista e observe como a caixa delimitadora muda na imagem para destacar a parte da imagem usada para gerar a legenda.

Marcando imagens

O próximo recurso que você experimentará é a funcionalidade Extrair Tags. Extrair tags é baseado em milhares de objetos reconhecíveis, incluindo seres vivos, cenários e ações.

  1. Retorne à página inicial do Vision Studio e selecione o bloco Extrair tags comuns de imagens na guia Análise de imagem.

  2. Em Escolha o modelo que deseja experimentar, deixe selecionado Produto pré-construído vs. modelo de lacuna. Em Escolha seu idioma, selecione um idioma de sua preferência.

  3. Abra a pasta que contém as imagens que você baixou e localize o arquivo chamado store-image-2.jpg.

  4. Carregue o arquivo store-camera-2.jpg.

  5. Revise a lista de tags extraídas da imagem e a pontuação de confiança de cada uma no painel de atributos detectados. Aqui, a pontuação de confiança é a probabilidade de o texto do atributo detectado descrever o que realmente está na imagem. Observe na lista de tags que ela inclui não apenas objetos, mas ações, como compras, vendas e permanência.

Detecção de objetos

Nesta tarefa, você usa o recurso de detecção de objetos da Análise de imagem. A detecção de objetos detecta e extrai caixas delimitadoras com base em milhares de objetos e seres vivos reconhecíveis.

  1. Retorne à página inicial do Vision Studio e selecione o bloco Detectar objetos comuns em imagens na guia Análise de imagem.

  2. Em Escolha o modelo que deseja experimentar, deixe selecionado Produto pré-construído vs. modelo de lacuna.

  3. Abra a pasta que contém as imagens que você baixou e localize o arquivo chamado store-camera-3.jpg.

  4. Carregue o arquivo store-camera-3.jpg.

  5. Na caixa Atributos detectados, observe a lista de objetos detectados e suas pontuações de confiança.

  6. Passe o cursor do mouse sobre os objetos na lista Atributos detectados para destacar a caixa delimitadora do objeto na imagem.

  7. Mova o controle deslizante Valor limite até que um valor de 70 seja exibido à direita do controle deslizante. Observe o que acontece com os objetos da lista. O controle deslizante de limite especifica que somente objetos identificados com uma pontuação de confiança ou probabilidade maior que o limite devem ser exibidos.

Detecte rostos no Vision Studio

  1. Num navegador web, navegue até Vision Studio em https://portal.vision.cognitive.azure.com .

  2. Na página inicial Introdução ao Vision, selecione a guia Face e, em seguida, selecione o bloco Detectar rostos em uma imagem.

  3. No subtítulo Experimente, reconheça a política de uso de recursos lendo e marcando a caixa.

  4. Selecione cada uma das imagens de amostra e observe os dados de detecção facial retornados.

  5. Agora vamos tentar com algumas de nossas próprias imagens. Selecione https://aka.ms/mslearn-detect-faces para baixar detect-faces.zip. Em seguida, abra a pasta no seu computador.

  6. Localize o arquivo chamado store-camera-1.jpg.

  7. Faça upload de store-camera-1.jpg e revise os detalhes de detecção de rosto retornados.

  8. Localize o arquivo chamado store-camera-2.jpg.

  9. Faça upload de store-camera-2.jpg e revise os detalhes de detecção de rosto retornados.

  10. Localize o arquivo chamado store-camera-3.jpg.

  11. Faça upload de store-camera-3.jpg e revise os detalhes de detecção de rosto retornados. Observe como o Azure AI Face não detectou o rosto que está obscurecido.

Neste exercício você explorou como os serviços de IA do Azure podem detectar rostos em imagens. Se você tiver tempo, sinta-se à vontade para experimentar as imagens de amostra ou algumas de suas próprias imagens.

Extraia texto de imagens no Vision Studio

  1. Num navegador web, navegue até Vision Studio em https://portal.vision.cognitive.azure.com .

  2. Na página inicial Introdução ao Vision, selecione Reconhecimento óptico de caracteres e, em seguida, o bloco Extrair texto de imagens.

  3. No subtítulo Experimente, reconheça a política de uso de recursos lendo e marcando a caixa.

  4. Selecione https://aka.ms/mslearn-ocr-images para baixar ocr-images.zip. Em seguida, abra a pasta.

  5. No portal, selecione Procurar um arquivo e navegue até a pasta em seu computador onde você baixou ocr-images.zip. Selecione advert.jpg e selecione Abrir.

  6. Agora revise o que é retornado:

    • Nos atributos detectados, qualquer texto encontrado na imagem é organizado em uma estrutura hierárquica de regiões, linhas e palavras.
    • Na imagem, a localização do texto é indicada por uma caixa delimitadora, conforme mostrado aqui:
  7. Agora você pode tentar outra imagem. Selecione Procurar um arquivo e navegue até a pasta onde você salvou os arquivos do GitHub. Selecione letter.jpg.

  8. Revise os resultados da segunda imagem. Deve retornar o texto e as caixas delimitadoras do texto. Se você tiver tempo, tente note.jpg e receipt.jpg.

Limpar

Se não pretende fazer mais exercícios, exclua todos os recursos que não precisa mais. Isso evita acumular custos desnecessários.

Abra o portal do Azure e selecione o grupo de recursos que contém o recurso que você criou. Selecione o recurso e selecione Excluir e depois Sim para confirmar. O recurso é então excluído.

Instruções de uso dos laboratórios extraídas e traduzidas para pt-BR dos seguintes links:

https://microsoftlearning.github.io/mslearn-ai-fundamentals/Instructions/Labs/03-image-analysis.html

https://microsoftlearning.github.io/mslearn-ai-fundamentals/Instructions/Labs/04-face.html

https://microsoftlearning.github.io/mslearn-ai-fundamentals/Instructions/Labs/05-ocr.html

dio-machine-learning-lab-02's People

Contributors

amandadolci avatar

Watchers

 avatar

Forkers

mario-lacerda

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.