Para abordar el rápido aumento de la computación con Inteligencia Artificial (IA) en el borde de la red y sus algoritmos de inferencia asociados, Intelligent Hardware Korea (IHWK) está desarrollando una plataforma de computación neuromórfica para dispositivos de neurotecnología. y dispositivos neuromórficos programables en campo. Microchip Technology, a través de su filial Silicon Storage Technology (SST) , colabora con el desarrollo de esta plataforma proporcionando un sistema de evaluación para su solución de memoria neuromórfica SuperFlash® memBrain™.. La solución se basa en la tecnología SuperFlash de memoria no volátil (NVM) de Microchip, probada en la industria, y está optimizada para realizar la multiplicación de matrices vectoriales (VMM) para redes neuronales a través de un enfoque de computación analógica en memoria.

El kit de evaluación de tecnología memBrain está diseñado para permitir a IHWK demostrar la eficiencia energética absoluta de su plataforma de computación neuromórfica para ejecutar algoritmos de inferencia en el borde. El objetivo final es crear una unidad de procesamiento analógico (APU) de consumo ultrabajo para aplicaciones como modelos de IA generativa, automóviles autónomos, diagnóstico médico, procesamiento de voz, seguridad/vigilancia y drones comerciales.

Dado que los modelos actuales de redes neuronales para la inferencia de borde pueden requerir 50 millones o más de sinapsis (pesos) para su procesamiento, resulta difícil tener suficiente ancho de banda para la DRAM fuera del chip que requieren las soluciones puramente digitales, lo que crea un cuello de botella para la computación de redes neuronales que acelera en general. potencia de cálculo. Por el contrario, la solución memBrain almacena pesos sinápticos en la puerta flotante del chip en modo subumbral de potencia ultrabaja y utiliza las mismas celdas de memoria para realizar los cálculos, lo que ofrece mejoras significativas tanto en la eficiencia energética como en la latencia del sistema. En comparación con los enfoques tradicionales basados ​​en DSP digital y SRAM/DRAM, ofrece un uso de energía de 10 a 20 veces menor por decisión de inferencia y puede reducir significativamente la factura general de materiales.

Para desarrollar la APU, IHWK también está trabajando con el Instituto Avanzado de Ciencia y Tecnología de Corea (KAIST), Daejeon, para el desarrollo de dispositivos y la Universidad de Yonsei, Seúl, para asistencia en el diseño de dispositivos. Se espera que la APU final optimice los algoritmos a nivel de sistema para la inferencia y funcione entre 20 y 80 TeraOPS por vatio, que es el mejor rendimiento disponible para una solución de computación en memoria diseñada para su uso en dispositivos que funcionan con baterías.

“Al utilizar NVM probada en lugar de soluciones alternativas de memoria fuera del chip para realizar cálculos de redes neuronales y almacenar pesos, la tecnología de computación en memoria memBrain de Microchip está preparada para eliminar los cuellos de botella masivos en las comunicaciones de datos que de otro modo se asociarían con la realización del procesamiento de IA en el borde de la red. ”, dijo Mark Reiten, vicepresidente de SST, la unidad de negocios de licencias de Microchip. «Trabajar con IHWK, las universidades y los primeros clientes es una gran oportunidad para probar aún más nuestra tecnología para el procesamiento neuronal y avanzar en nuestra participación en el espacio de la IA al colaborar con una empresa líder en investigación y desarrollo en Corea».

«Corea es un importante punto de acceso para el desarrollo de semiconductores de IA», afirmó Sanghoon Yoon, director de la sucursal de IHWK. «Nuestros expertos en memoria no volátil y emergente han validado que el producto memBrain de Microchip, basado en tecnología NVM probada, es la mejor opción cuando se trata de crear sistemas informáticos en memoria».

El almacenamiento permanente de modelos neuronales dentro del elemento de procesamiento de la solución memBrain también admite la funcionalidad instantánea para el procesamiento de redes neuronales en tiempo real. IHWK está aprovechando la no volatilidad de las celdas de puerta flotante de la memoria SuperFlash para lograr un nuevo punto de referencia en dispositivos informáticos de vanguardia de bajo consumo que admiten la inferencia de aprendizaje automático utilizando modelos de aprendizaje automático avanzados.