Compact Machine Learning Systems with Reconfigurable Computing

  1. Morán Costoya, Alejandro
Dirigida per:
  1. Josep Lluis Rosselló Sanz Director/a
  2. Vicente José Canals Guinand Director/a

Universitat de defensa: Universitat de les Illes Balears

Fecha de defensa: 28 de de gener de 2022

Tribunal:
  1. María Luisa López Vallejo President/a
  2. Gabriel Oliver Codina Secretari/ària
  3. Luis Parrilla Roure Vocal

Tipus: Tesi

Resum

• Introducció Recentment, la solució més avançada en l'àmbit de la internet de les coses consistia a enviar les dades captades pels nodes sensors al núvol i esperar la resposta del servidor. Aquest enfocament dependent del servidor requereix una quantitat significativa de transmissió de dades, la qual cosa al seu torn provoca una congestió de la xarxa. Encara que les transmissions de dades amb un rendiment suficient resoldrien el problema, l'augment del rendiment incrementa el consum d'energia. A més, existeixen problemes de privacitat relacionats amb l'enviament de dades dels sensors directament al núvol (per exemple, l'enviament d'imatges amb cares de persones). La solució a aquest problema és habilitar les capacitats d'inferència i anàlisi de dades en la vora, que estan prop de les fonts de dades. Aquest enfocament es coneix com Edge Computing. En comparació amb la transmissió directa de dades, el consum d'energia es redueix potencialment, ja que la inferència es realitza mitjançant dispositius de vora de baix consum, no existeix un problema de latència si el dispositiu és capaç de gestionar la inferència en temps real, i la privacitat deixa de ser un problema, ja que les dades en brut no es transmeten al núvol, sinó que només s'envien les metadades (per exemple, la data, la ubicació i la durada de l'esdeveniment) i els resultats de la inferència (per exemple, la detecció de compostos químics en l'aire o els trets o l'assistència per veu). En aquest context, la tesi se centra en la creació de prototips de solucions d'inferència de reconeixement de patrons de FPGA amb aplicacions potencials en l'en el camp del Edge Computing, ja sigui en petits nodes prop d'un sensor o com a part de dispositius IoT. • Contingut de la investigació En aquest treball, els models proposats són molt més petits i l'objectiu és contribuir a l'exploració d'arquitectures de maquinari simplificades altament/totalment paral·leles fetes a mida i no basades en una arquitectura de von Neumann, la qual cosa comporta potencials beneficis d'eficiència energètica. En particular, s'han proposat diversos dissenys de FPGA que implementen el procés d'inferència de diversos models d'Aprenentatge Automàtic i s'han provat en un conjunt de bases de dades de referència. Les implementacions FPGA inclouen dos models de computació de reservori basats en aritmètica de punt fix de baixa precisió i una Xarxa Neuronal de Funció de Base Radial basada en Computació Estocàstica. A més, s'ha simulat i avaluat una Xarxa Neuronal convolucional basada en dues variants diferents de computació estocàstica per diferents precisions de bits, ambdues entrenades utilitzant un enfocament de quantització conscient de l'entrenament. • Conclusió En general, les implementacions proposades presenten simplificacions que contribueixen a disminuir tant el tamany del circuit com el seu consum, així com un entrenament específic per a treballar amb paràmetres de baixa precisió. Si bé és cert que les implementacions detallades en la tesi poden considerar-se independents l'una de l'altra, cal concloure que en la majoria de casos s'han obtingut millores en termes de consum energètic comparat amb l'estat de l'art, sense que això repercuteixi notablement en el ràtio d'encert. Això fa que els dissenys proposats siguin molt atractius per a petits dispositius portàtils alimentats amb bateries, ja que un menor consum energètic es tradueix en una major durada de la bateria. A més, cal destacar que un menor consum pot ser també beneficiós per a realitzar inferència a gran escala, perquè un menor consum elèctric suposa també una reducció en les emissions de CO2 generades.