Прогнозування сигналу ЕКГ на основі представлень для переднавчання нейронних мереж
Main Article Content
Анотація
Обмежений набір даних для навчання є відомою проблемою при застосуванні методів глибокого навчання нейронних мереж. Проблема є особливо актуальною в галузі обробки біомедичних сигналів, таких як сигнал електрокардіограми, оскільки підготовка навчальних даних є трудомісткою і вимагає залучення кваліфікованих спеціалістів. Методи самокерованного навчання які спочатку зародилися в таких галузях машинного навчання, як обробка природної мови та комп’ютерний зір, є одним із шляхів розв’язання цієї проблеми і набувають все більшого поширення в сфері обробки біомедичних сигналів. Однак, пряма адаптація методів самокерованного навчання розроблених для інших доменів, не враховує таких особливостей даних електрокардіограм, як квазіперіодичність, локалізація морфологічних ознак, чутливість до шумів. Це робить актуальним розвиток специфічних методів самокерованного навчання для даних електрокардіограм. У цій роботі представлено новий метод самокерованного навчання для переднавчання нейронних мереж на нерозмічених даних електрокардіограм. Запропонований метод використовує задачу прогнозування короткої наступної підвибірки сигналу на основі попередньої підвибірки та вектора представлення. Моделі прогнозування та трансформації сигналу у вектори представлення навчаються спільно на датасеті MIMIC-ECG-IV із використанням методу зворотного поширення помилки при мінімізації середньоквадратичної помилки між спрогнозованою та оригінальною підвибірками сигналу. Як приклад цільової задачі було обрано навчання лінійних бінарних класифікаторів на датасеті PTB-XL для діагностики патологічних станів пацієнта за I-м відведенням. Розмір навчальної вибірки для кожного діагнозу обмежено тридцятьма чотирма прикладами. Спочатку модель отримання представлень була навчена на нерозміченому датасеті MIMIC-ECG-IV, а потім навчалися лінійні моделі класифікації отриманих представлень для кожного обраного діагнозу в PTB-XL. Також проводилося порівняння з навчанням моделі представлень із випадково ініціалізованими вагами разом із навчанням класифікатора. Ефективність запропонованого методу порівнювалася з адаптаціями таких методів, як Contrastive Learning, Contrastive Predictive Coding та Masked Autoencoders. Для забезпечення принципів контрольованості експериментів були розроблені власні реалізації розглянутих методів із використанням спільної кодової бази та архітектурних блоків. Результати експериментів показали значну перевагу всіх розглянутих методів порівняно із сумісним навчанням моделі виділення ознак, а також перевагу запропонованого методу самокерованного навчання над іншими розглянутими методами, особливо на діагнозах із неявно вираженими короткочасними ознаками форми сигналу, таких як фібриляція та тріпотіння передсердь. Проведені експерименти демонструють перспективність подальших досліджень у галузі розробки специфічних методів самокерованного навчання для даних електрокардіограм як ефективного підходу до підвищення ефективності нейромережевих методів в умовах обмеження навчальних даних.