Нейромережеве стиснення з втратами зашумлених аудіосигналів та їх постфільтрація на основі ДКП
DOI: 10.31673/2412-9070.2026.023601
Анотація
Розглянуто нещодавно запропонований нейромережевий кодек TSAC для стиснення аудіосигналів із втратами, який застосовувався до музичних та мовних сигналів, спотворених адитивним білим гаусовим шумом (АБГШ). Основними цілями були: 1) Аналіз залежності коефіцієнта стиснення (КС) від вхідного відношення сигнал/шум (ВСШ); 2) Вивчення природи спотворень, що вносяться кодеком; 3) Оцінка доцільності та ефективності застосування пост-фільтрації на основі дискретного косинусного перетворення (ДКП) для придушення залишкового шуму в декодованих сигналах. Експериментально встановлено, що кодек має високу робастність: КС перевищує 100 для всіх рівнів вхідного шуму. При цьому спостерігається тенденція до збільшення КС із зростанням ВСШ від 0 до 20 дБ. Аналіз показав, що кодек має частотно-залежний вплив на шум: для сигналів з високим ВСШ (15-20 дБ) спостерігається часткове придушення шуму у високочастотній області (вище 5 кГц), але при цьому вносяться спотворення на низьких частотах. Для сигналів з низьким ВСШ (0 дБ) спотворення на низьких частотах стають більш вираженими, проте ефект шумозаглушення на високих частотах зберігається. Застосування постфільтрації на основі ДКП після декомпресії виявилося високоефективною стратегією саме для сильно зашумлених сигналів. Для вхідних ВСШ в діапазоні 0-10 дБ вдалося досягти значного поліпшення якості (позитивні значення метрики поліпшення ВСШ), з максимальним виграшем до 8-10 дБ при оптимальному виборі порогового коефіцієнта β. У той же час, для сигналів з високим ВСШ пост-фільтрація недоцільна, оскільки спотворення, що вносяться самим фільтром, переважають ефект шумозаглушення. Проведене дослідження підтверджує, що гібридний підхід, що поєднує високу ефективність стиснення сучасних нейромережевих кодеків з класичними методами шумозаглушення, є потужним і перспективним рішенням для обробки зашумлених аудіосигналів. Розглянутий кодек здатний ефективно стискати навіть сильно спотворені дані, а подальша фільтрація на основі ДКП дозволяє значно поліпшити якість відновленого сигналу в умовах низького відношення сигнал/шум.
Ключові слова: аудіосигнал, шум, стиснення iз втратами, фільтрація на основі ДКП, спотворення.