psilogic: (Default)
[personal profile] psilogic
У меня вопрос к знатокам математики... уже - дискретной математики, еще уже - тем, кто разбирается в звуковом синтезе. Если у вас есть такие знакомые, которые, быть может, знают ответ, киньте в меня линком на них или в них - линком на меня.

Итак.

Дана некоторая волна (на практике - звуковая, но не суть). Она записана в дискретном виде - как длинный-предлинный набор отсчетов амплитуды через равные промежутки времени. Над некоторым куском этой волны волны мы можем выполнить БПФ (быстрое дискретное преобразование Фурье). Получим спектр, опять же, дискретный.

Задача первая. Взять небольшой кусочек волны длительностью dt (скажем, полсекунды звучания некой мелодии). Сгенерировать кусочек подлинее DT. Чтобы, значит, та же самая нота длилась подольше. Как это сделать? Если я просто выполню обратное БПФ, то получу тот же самый кусочек, длиной dt, а мне надо больше. Если я попробую тупо скопировать кусочек DT/dt раз, возникнут две бяки:
1. Артефакты на границе между кусочками.
2. Паразитная частота 1/dt, которая может быть слышна как пульсация громкости.
Если просто растянуть сигнал с помощью аппроксимации, то получится другая нота - более низкая в DT/dt раз.

Задача вторая. Взять кусочек dt, что-нибудь сделать с его частотами (скажем, убрать ровно одну). Потом записать его назад. То есть, речь про БПФ-фильтр. Но... что делать с артефактами на границе? Я тут придумываю разные методы сглаживания артефактов... может, кто знает уже известный хороший метод?

Date: 2008-07-16 07:28 pm (UTC)
From: [identity profile] daddym.livejournal.com
Ты неправильно представляешь себе процесс цифровой фильтрации. Чтобы не было артефактов БПФ или другое преобразование, делается на каждый сэмпл. То есть ее окно постоянно сдвигается. В итоге ты получаешь спектральный массив на каждый момент дискретизации. Вот в этом случае никаких проблем с вырезанием спектра или наоборот с добавлением тона нет. Другое дело что вычислительная мощность для БПФ требуется немаленькая.
Если интересно пороюсь какие у меня есть книжки, могу прислать. Хотя как правила обычных фильтров для большинства задач хватает. Они у меня точно были, вместе с генератором кода для них.
From: [identity profile] sanitareugen.livejournal.com
...то БПФ (или не БПФ, а просто ПФ, иногда это, как ни странно, оказывается дешевле) делается единожды. Для перехода от АЧХ к импульсной характеристике. И далее всё производится во временнОй области.
А если хотим считать непременно через БПФ - то делается по отрезкам. Но непременно с перекрытием (или наложением) см. выше, а подробнее - у Рабинера и Голда или, скажем, у Гольденберга, Матюшкина и Поляка
http://dsp-book.narod.ru

Date: 2008-07-17 06:39 am (UTC)
From: [identity profile] psilogic.livejournal.com
Ага! С наложением - и на месте наложения cross-fade - так?
From: [identity profile] sanitareugen.livejournal.com
Если "постепенное ослабление звука" с одновременным усилением другого источника - то нет. Для "свёртки с наложением" используется банальная сумма.
From: [identity profile] psilogic.livejournal.com
Да, оно самое. Я представлял себе это так. Берем два прекрывающихся участка длиной dt и с перекрытием длиной p
1: от t0 до t0 + dt
2: от t0 + dt - p до t0 + 2dt - p
Делаем БПФ, фильтрацию, обратную БПФ, а потом на участке перекрытия делаем corss-fade. А вы что имели в виду? Свертка с наложением - это как?

Нет.

Date: 2008-07-17 07:26 am (UTC)
From: [identity profile] sanitareugen.livejournal.com
Немного теории (но Рабинера и Голда читать всё же надо, невзирая на толщину, если не для понимания, то для укрепления воли;):
0. Появление "щелчков" и т.п. при обработке это не неумелость программиста, а фундаментальный факт, проявление "принципа неопределённости", не позволяющего добиться одновременно высокого разрешения временнОго и частотного. Победить его нельзя, а свести действие к желаемому - можно.
Частным проявлением этого принципа является появление временнЫх искажений при узкополосной фильтрации (не только щелчков). Любой фильтр имеет некое последействие, и чем уже полоса - тем оно дольше.
1. В частности, если мы, для задач фильтрации, разбиваем сигнал на отрезки, делаем их ПФ (в частности, БПФ), обрабатываем в частотной области и обратно, то, при правильной фильтрации, отрезок длиной t будет иметь последействие также длиной t (поскольку ПФ позволяет получать очень узкополосную фильтрацию, в размере одного отсчёта по частоте). Если мы этого не учтём, то последействие никуда не денется - но, поскольку обычная fictio iuris при применении Фурье состоит в том, что наш отрезок бесконечно много раз повторяется во времени (или, что эквивалентно, закольцован), это последействие наложится на отрезок с начала его. Понятно, что даже если сигнал перед разбиением на отрезки был непрерывен, после такого наложения никто непрерывность не гарантирует - а это и есть "щелчки".
2. Чтобы избежать их, надо, чтобы последействие накладывалось куда надо. Для этого, взяв отрезок длиной t, дополним его в конце нулями, сделаем ПФ, нужные частотные манипуляции и обратное ПФ. Тогда последействие фильтра будет в хвосте полученного отрезка, вместо нулей. Первую половину отрезка выдаём, вторую (последействие) запоминаем. Обрабатывая следующий отрезок - перед выдачей результата обработки прибавим этот запомненный отрезок в первой половине нового отрезка. Физически он представляет "звон фильтра", оставшийся от предыдущего отрезка.
3. "Окнами" и пр. пользоваться не следует. В том числе и cross-fade.
4. Фильтрацию можно производить и без ПФ. Для этого фильтрация производится во временнОй области, т.е. выход фильтра есть взвешенная сумма отсчётов входного сигнала (КИХ-фильтр, а если добавить, по обратной связи, выходные отсчёты фильтра - БИХ-фильтр). Впрочем, расчёт коэффициентов фильтров часто производится именно при помощи ПФ. В таких фильтрах удаётся получить меньшую длину последействия - платя за это ухудшением АЧХ фильтра, а для БИХ-фильтров ещё и неустойчивостью.

Re: Нет.

Date: 2008-07-17 07:46 am (UTC)
From: [identity profile] psilogic.livejournal.com
"если не для понимания, то для укрепления воли"

ага... похоже на то :))) именно воли: я как увидел, сколько там... начал читать и увидел, что 99% написанного на практике не пригодится никогда... :))

1. Угу, именно, именно, оно самое - стоит тронуть хоть одну частоту, и непрерывность может разрушиться.

2. Ага! Вот оно как!! А я то думал - и на хрена там и сям упоминаются "дополнения нулями", а это, оказывается, чтобы "закольцованность" убрать :)

Хм. Интересно, а что, если дополнять не нулями, а тем куском, который реально идет после этого отрезка... надо будет подумать...

3. Вроде cross-fade - это не окно, а так... что-то вроде весовой функции, про которую вы говорили.

4. Те фильтры я уже запрограммировал - первого порядка и биквадратные, вроде бы этого для большинства случаев хватит :) Сейчас буду делать на них эквалайзер... правда там меня сомнения кой-какие гложут, ну да ладно, это уже другая тема :)

Date: 2008-07-17 07:59 am (UTC)
From: [identity profile] sanitareugen.livejournal.com
А если дополнять не нулями - то это "свёртка с перекрытием". Тогда ничего складывать не надо, но надо брать только вторую часть отрезка...

Date: 2008-07-17 08:17 am (UTC)
From: [identity profile] psilogic.livejournal.com
Вторую часть какого отрезка? Ладно, наверное надо все-таки Р-Д читать. Там про свертки все есть?
From: [identity profile] psilogic.livejournal.com
Хм... такую книжку не помню. Надо будет поискать, я как-то с колхоза много чего скачивал...

Date: 2008-07-17 12:59 pm (UTC)
From: [identity profile] psilogic.livejournal.com
Во! Вот, что я буду читать на сон грядущий :)) Спасибо!

Стараемся...

Date: 2008-07-17 01:14 pm (UTC)
From: [identity profile] sanitareugen.livejournal.com
Два с полтиной гига...

Date: 2008-07-17 02:19 pm (UTC)
From: [identity profile] psilogic.livejournal.com
я смотрю вообще склад суперский - теперь будет у меня в закладках жить :)

А пополнить?

Date: 2008-07-17 02:36 pm (UTC)
From: [identity profile] sanitareugen.livejournal.com
Или вот есть хорошее занятие - писать "аннотированную библиографию"...
Нет желания?

Re: А пополнить?

Date: 2008-07-17 03:22 pm (UTC)
From: [identity profile] psilogic.livejournal.com
Я тут ваяю прогу... типа саундфоржа, только бесплатную. Прога уже очень солидная, просто некоторые вещи (уже немногие) недоделаны.

Так что со временем смогу пополнять исходниками программ - особенно по обработке звука.

Приветствуется.

From: [identity profile] sanitareugen.livejournal.com - Date: 2008-07-17 04:50 pm (UTC) - Expand

(no subject)

From: [identity profile] psilogic.livejournal.com - Date: 2008-07-17 08:06 pm (UTC) - Expand

Ну так это частный случай:)

Date: 2008-07-17 08:10 am (UTC)
From: [identity profile] daddym.livejournal.com
Чем больше перекрытие тем выше качество.
From: [identity profile] sanitareugen.livejournal.com
...дополнять отрезки равным числом нулей, а меньшим. А при бОльшем никакого улучшения не будет.
Подробнее я в этой ветке уже говорил...

Date: 2008-07-17 06:38 am (UTC)
From: [identity profile] psilogic.livejournal.com
Знаешь ли ты эффективные методы такой плавной сдвижки окна? Чтобы не считать БПФ заново при каждой сдвижке (это до пенсии вычисляться будет).

Date: 2008-07-17 08:15 am (UTC)
From: [identity profile] psilogic.livejournal.com
Да я не про то. Вот есть окно в N целочисленных отсчетов. Я сделал на нем БПФ (сложность NlogN). Получил спектр N комплексных чисел. Теперь сдвинул окно на один отсчет вправо. Изменился только один отсчет, остальные просто переместились на один индекс. Можно ли теперь вычислить БПФ для этих новых N отсчетов как-нибудь более эффективно, чем просто заново считать БПФ?
From: [identity profile] sanitareugen.livejournal.com
Комплексное умножение всех значений на "поворачивающий множитель", вычитание уходящей точки (умноженной на соответствующие множители) и добавление новопришедшей (аналогично).
Но зачем?!
From: [identity profile] psilogic.livejournal.com
да вдруг пригодится :) только не забыть время от времени вычислять весь спектр заново, а то ошибки округления накопятся.
From: [identity profile] sanitareugen.livejournal.com
Предыдущие значения с весом (1-alpha), вновь поступившее alpha.
И спектр всегда как новенький...
Page generated Aug. 21st, 2025 01:12 am
Powered by Dreamwidth Studios