Методологія компресії нейронних мереж для моделей многосенсорних трансдюсерних мереж на основі периферійних обчислень

Main Article Content

Ivan M. Lobachev
Svitlana G. Antoshchuk
Mykola A. Hodovychenko

Анотація

У цій статті основна увага приділяється розробці методу компресії нейронних мереж, який заснований на механізмі виключення нейронів прихованих шарів. Вищезазначені нейронні мережі створюються для обробки даних, що генеруються численними сенсорами, присутніми в трансдюсерних мережах, які використовуються в області створення розумних будинків. Запропонований метод реалізує єдиний підхід до компресії як згорткових нейронних мереж, так і рекурентних нейронних мереж, які використовуються для задач класифікації і регресії. Основний принцип цього методу заснований на механізмі виключення, який використовується в якості механізму регуляризації нейронних мереж. Ідея запропонованого методу полягає у виборі оптимальної ймовірності виключення нейрона прихованого шару на основі параметра надмірності. Новизна цього методу полягає у використанні спеціальної мережі-оптимізатора, яка представляє собою рекурентну нейронну мережу, що дозволяє обчислювати параметр надмірності не тільки на одному прихованому шарі, але і на кількох шарах. Додатковий аспект новизни полягає в ітеративній оптимізації мережі-оптимізатора для постійного поліпшення обчислення параметрів надмірності вхідної нейронної мережі. Для експериментальної оцінки запропонованого методу була обрана задача розпізнавання зображень камерою низького розширення, для емуляції сценарію використовувався набір даних CIFAR10. В якості експериментальної нейронної мережі була обрана згорткова нейронна мережа VGGNet, яка містить згорткові і повнозв'язні шари. В якості методів-аналогів був узятий метод MagBase, який заснований на принципі спарцифікаціі, а також метод, заснований на розрідженому представленні з використанням підходу розрідженого кодування SFAC. Результати експерименту показали, що кількість параметрів в скомпресованій моделі складає всього 2,38 % від оригінальної моделі. Це дозволило скоротити час логічного висновку на 93,7 % і споживання енергії на 94,8 %. Запропонований метод дозволяє ефективно використовувати глибокі нейронні мережі в трансдюсерних мережах, що використовують архітектуру периферійних обчислень. Це, в свою чергу, дозволяє системі обробляти дані в реальному часі, скоротити споживання енергії і час логічного висновку, а також зменшити вимоги до пам'яті та сховища для реальних додатків.

Downloads

Download data is not yet available.

Article Details

Тематика

Розділ

Інформаційні технології та комп'ютерні системи

Автори

Біографії авторів

Ivan M. Lobachev, Одеський національний політехнічний університет, пр. Шевченка, 1. Одеса, 65044,Україна

аспірант кафедри Інформаційних систем

Scopus ID: 57192379296

Svitlana G. Antoshchuk, Одеський національний політехнічний університет, пр. Шевченка, 1. Одеса, 65044,Україна

доктор технічних наук, професор, директор інституту Комп’ютерних систем

Scopus ID: 8393582500

Mykola A. Hodovychenko, Одеський національний політехнічний університет, пр. Шевченка, 1. Одеса, 65044,Україна

кандидат технічних наук, доцент кафедри Проектного навчання в IT

Scopus ID: 57188700773

Схожі статті

Ви також можете розпочати розширений пошук схожих статей для цієї статті.