Implemente rapidamente IA e aprendizado de máquina poderosos e eficientes usando MCUs Renesas RA8M1

By Kenton Williston

Contributed By DigiKey's North American Editors

2024-03-20

A ascensão da inteligência artificial (IA), do aprendizado de máquina (ML) e de outras cargas de trabalho computacionalmente intensivas na borda da rede para a Internet das Coisas (IoT) está colocando uma carga extra de processamento nos microcontroladores (MCUs). A manipulação dessas novas cargas de trabalho aumenta o consumo de energia, mesmo quando os projetistas são solicitados a minimizar a energia e acelerar o tempo de comercialização.

Os projetistas precisam de uma opção de computação que mantenha a eficiência de um MCU e, ao mesmo tempo, adicione recursos de alto desempenho adaptados especificamente para casos de uso de baixa potência. Essa opção também deve preservar os modelos de implantação simples associados aos MCUs tradicionais e, ao mesmo tempo, adicionar recursos suficientes para dar suporte às aplicações sofisticadas possibilitadas pela IA e pelo ML, como controle de voz e manutenção preditiva.

Este artigo discute os fatores que impulsionam a demanda por IA e ML e explica por que novas arquiteturas de processador são necessárias para fornecer esses recursos de forma eficiente. Em seguida, ele apresenta a família de MCUs RA8M1 da Renesas e mostra como ela pode ser usada para atender a essas exigências.

As exigências da IA e ML na borda

A demanda por IA e ML está aumentando nas aplicações de borda IoT, desde automação predial e dispositivos industriais até eletrodomésticos. Mesmo os sistemas embarcados relativamente pequenos e de baixa potência agora são encarregados de cargas de trabalho como detecção de palavras-chave, controle de comandos de voz e processamento de áudio/imagem. As aplicações-alvo incluem hubs de sensores, navegação e controle de drones, realidade aumentada (AR), realidade virtual (VR) e equipamentos de comunicação.

Para minimizar o uso de energia, a sobrecarga e a latência e, ao mesmo tempo, garantir a privacidade, o processamento de dados na borda geralmente é preferível do que enviar para a nuvem. Isso é um desafio para os projetistas, pois os dispositivos de borda frequentemente têm recursos limitados, principalmente quando são alimentados por bateria.

MCUs aprimorados para computação de borda

As cargas de trabalho de IA e ML geralmente envolvem a execução da mesma operação matemática repetidamente em um grande conjunto de dados. Essas cargas de trabalho são passíveis de aceleração com o uso de processamento de instrução única e dados múltiplos (SIMD). O SIMD executa várias operações matemáticas em paralelo, proporcionando uma taxa de transferência consideravelmente maior e melhor eficiência energética do que o processamento convencional.

Como os MCUs tradicionais não têm a funcionalidade SIMD, elas precisam de ajuda para executar cargas de trabalho de IA e ML. Uma solução é usar um processador de sinal digital (DSP) ou outros aceleradores SIMD junto com o MCU. No entanto, essa abordagem de vários processadores complica o projeto do sistema.

Outra opção é mudar para uma unidade de microprocessador (MPU) de alto desempenho equipada com recursos SIMD. Isso pode proporcionar o desempenho necessário em uma configuração de processador único, mas as MPUs têm desvantagens no consumo de energia e nos conjuntos de recursos. Por exemplo, nem todas as MPUs são projetadas para fornecer a computação determinística e de baixa latência exigida em aplicações orientadas por MCU.

Habilitando IA e ML em MCUs

Reconhecendo a necessidade de um conjunto otimizado de MCUs para suportar cargas de trabalho de IA e ML, a Renesas apresentou a série de MCUs RA8M1 (Figura 1). A série é baseada em uma arquitetura Arm® Cortex®-M85 com Helium e TrustZone, e pode ser executada a 480 megahertz (MHz) com um consumo de energia típico de 225 microamperes por megahertz (µA/MHz).

Figura 1: O MCU Renesas RA8M1 é baseado em um Arm Cortex-M85 e inclui a tecnologia Helium para acelerar o processamento de IA e ML. (Fonte da imagem: Renesas)

Projetado para proporcionar desempenho eficiente e baixo consumo de energia, o MCU RA8M1 tem recursos como determinismo, tempo de interrupção curto e suporte ao gerenciamento de energia do estado da arte. O processador atinge uma eficiência de desempenho de 6,39 CoreMark por megahertz (CoreMark/MHz).

O Helium é uma extensão vetorial M-Profile (MVE) SIMD que acelera significativamente o processamento de sinais e o ML. Ele adiciona 150 instruções escalares e vetoriais e permite o processamento de registradores de 128 bits (Figura 2). Está otimizado para microcontroladores de baixa potência e com restrição de recursos. Por exemplo, o Helium reutiliza os registradores da unidade de ponto flutuante (FPU) em vez de introduzir novos registradores SIMD. Isso ajuda a diminuir o consumo de energia do processador e a reduzir a complexidade do projeto.

Diagrama do Helium que reutiliza o banco de registradores da FPU para processamento de vetores Figura 2: O Helium reutiliza o banco de registradores da FPU para processamento de vetores. (Fonte da imagem: Arm)

Conforme mostrado na Figura 3, o Cortex-M85 do RA8M1 inclui a tecnologia TrustZone da Arm. O TrustZone oferece isolamento de hardware para firmware, ativos e informações privadas essenciais. O Cortex-M85 também acrescenta novos recursos de segurança e proteção, como a extensão PACBTI (autenticação de ponteiro e identificação de alvo de ramificação). Esses recursos de segurança são particularmente valiosos em um contexto de IA em que um dispositivo pode interagir com dados pessoais.

Imagem do TrustZone do Arm Cortex-M85 Figura 3: o TrustZone do Cortex-M85 oferece isolamento de hardware para firmware, ativos e informações privadas essenciais. (Fonte da imagem: Arm)

Recursos de hardware a serem procurados em um MCU com capacidade de IA

Um MCU deve combinar desempenho eficiente com um conjunto robusto de recursos para dar suporte a aplicações de IA. O RA8M1 está bem equipado para controle de motores, controle lógico programável (CLP), medição e outras aplicações industriais e de IoT.

Por exemplo, os algoritmos de IA exigem muita memória. A memória do sistema RA8M1 inclui até 2 megabytes (Mbytes) de flash e 1 Mbyte de SRAM. A SRAM inclui 128 quilobytes (Kbytes) de memória fortemente acoplada (TCM), que permite acesso rápido à memória para cálculos de alto desempenho.

Para garantir uma operação confiável, 384 Kbytes da SRAM do usuário e todos os 128 Kbytes da TCM são configurados como memória de código de correção de erros (ECC). Os caches de dados e de instruções de 32 Kbytes também são protegidos por ECC.

O RA8M1 incorpora vários recursos de segurança, além daqueles incluídos no núcleo Arm. Isso inclui o mecanismo criptográfico RSIP (propriedade intelectual protegida em dispositivo reprogramáveis) para processamento seguro de dados, armazenamento imutável para proteção de dados críticos e mecanismos de proteção contra violações.

Para interfaces de comunicação, o MCU é equipado com Ethernet para conectividade de rede, taxa de dados flexível de rede da área de controle (CAN FD) para aplicações automotivas e industriais e USB de alta velocidade/velocidade máxima para conectividade geral. Também incorpora uma interface de câmera e uma interface periférica serial (SPI) octal com decodificação instantânea para memória externa.

As interfaces analógicas incluem conversores analógico-digitais (ADCs) e conversores digital-analógicos (DACs) de 12 bits, comparadores analógicos de alta velocidade e três circuitos de amostragem e retenção. Para comunicação serial, o RA8M1 oferece suporte a vários protocolos, incluindo uma interface de comunicação serial (SCI) com SPI, um receptor/transmissor assíncrono universal (UART) e modos de circuito inter-integrado (I²C). O MCU também oferece o Circuito Inter-integrado Aprimorado (I3C) para aumentar as taxas de transferência de dados e a eficiência.

Os desenvolvedores que precisam de acesso total a esses recursos de entrada/saída (E/S) podem usar um invólucro BGA (ball grid array) como o R7FA8M1AHECBD#UC0 de 224 pinos. Aqueles que buscam um processo de montagem e design de placa de circuito impresso mais simplificado podem considerar o uso de uma opção de invólucro plano, quadrado de perfil baixo (LQFP), como o R7FA8M1AHECFB#AA0 de 144 pinos.

Ambientes de desenvolvimento para aplicações de IA

Os projetistas interessados em fazer experiências com a série RA8M1 podem começar com a placa de teste EK-RA8M1 R7FA8M (Figura 4). Essa placa inclui uma interface Ethernet RJ45 RMII, uma interface de dispositivo e host USB de alta velocidade e um conector CAN FD de três pinos. Para a memória, ela possui 64 Mbytes de flash SPI octal.

Figura 4: A placa de teste EK-RA8M1 tem um suporte de E/S robusto para praticar com o MCU RA8M1. (Fonte da imagem: Renesas)

O RA8M1 é suportado pelo Flexible Software Package (FSP) da Renesas, uma estrutura abrangente projetada para fornecer uma base de software fácil de usar, escalável e de alta qualidade para projetos de sistemas embarcados.

O pacote oferece ferramentas de desenvolvimento, incluindo o ambiente de desenvolvimento integrado (IDE) e² studio, baseado no popular IDE Eclipse. Ele também contém dois sistemas operacionais em tempo real proeminentes e livres de royalties: Azure RTOS e FreeRTOS.

O pacote inclui drivers leves e prontos para produção que suportam casos de uso comuns em sistemas embarcados. Combinados com a placa de teste, esses drivers oferecem aos desenvolvedores um caminho rápido para fazer experiências com a E/S do RA8M1.

Conclusão

O RA8M1 oferece aos desenvolvedores uma nova opção para implementar cargas de trabalho de IA e ML em aplicações de borda IoT que economizam energia, melhoram o desempenho, reduzem a complexidade e diminuem o tempo de lançamento no mercado.

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.