разделение источников
May. 29th, 2013 09:13 pmЯ задал вопрос на реддите - попросил рассказать, умеют ли сейчас из аудио-записи выделять или удалять отдельные голоса или инструменты. Это может показаться странным, если вы не имели дела с компьютерной обработкой сигналов, но это на удивление тяжелая задача. Я знал об этом в очень общих чертах, но не знал, какого прогресса в ней добились.
Мне накидали полезных ссылок. В частности, набор слайдов, рассказывающий об основных алгоритмах, и примеры того, как работают алгоритмы из недавно опубликованной статьи. И еще несколько ссылок хороших там есть.
Вот, подумал, может не мне одному интересно.
Мне накидали полезных ссылок. В частности, набор слайдов, рассказывающий об основных алгоритмах, и примеры того, как работают алгоритмы из недавно опубликованной статьи. И еще несколько ссылок хороших там есть.
Вот, подумал, может не мне одному интересно.
no subject
Date: 2013-05-29 06:24 pm (UTC)no subject
Date: 2013-05-29 06:24 pm (UTC)no subject
Date: 2013-05-29 06:26 pm (UTC)(не, Ñ, конеÑно, понимаÑ, ÑÑо ÑÑо дÑÑгой ÐÑÑаний, но вÑе же)
no subject
Date: 2013-05-29 06:27 pm (UTC)no subject
Date: 2013-05-29 06:34 pm (UTC)no subject
Date: 2013-05-29 07:14 pm (UTC)no subject
Date: 2013-05-29 07:14 pm (UTC)ÐÑÐ¸Ð½Ð¸Ð¼Ð°Ñ Ð²Ð¾ внимание пÑоÑÐµÐ½Ñ Ð¿ÑеÑвелиÑÐµÐ½Ð¸Ñ Ð¼Ð¾Ð¶Ð½Ð¾ допÑÑÑиÑÑ, ÑÑо Ñема доволÑно ÑаÑÑопÑÐ°Ð½Ð½Ð°Ñ Ð¸ ÑазноÑенаÑ.
ХоÑÑ Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ð¾ Ñакой Ð¿Ð¾Ð´Ñ Ð¾Ð´ вообÑе не Ð¸Ð¼ÐµÐµÑ Ð¿Ñава на жизнÑ.
no subject
Date: 2013-05-29 07:15 pm (UTC)no subject
Date: 2013-05-29 07:21 pm (UTC)no subject
Date: 2013-05-29 07:43 pm (UTC)no subject
Date: 2013-05-29 08:06 pm (UTC)ÐÑим еÑÑ Ð¡Ð¾Ð»Ð¶ÐµÐ½Ñин в ÑаÑаÑке в "ÐÑÑге пеÑвом" занималÑÑ.
ÐÑоÑÑо гÑажданÑким ÑÑо не нÑжно - Ð²Ð¾Ñ Ð¸ не ÑмеÑÑ.
no subject
Date: 2013-05-29 08:25 pm (UTC)Ðак Ð²Ñ Ð¿Ð¾Ð»Ð°Ð³Ð°ÐµÑе ÐиÑлов винилово-магниÑнÑÑ Ð¸Ð· моно пеÑеводили в ÑÑеÑео Ñ ÑиÑÑкой ÑÑмов?
ÐолагаÑ, вÑÑленÑÑ ÐºÐ°Ð¶Ð´Ñй инÑÑÑÑменÑ/голоÑ.
no subject
Date: 2013-05-29 09:48 pm (UTC)no subject
Date: 2013-05-29 10:21 pm (UTC)по ÑÑÑлкам замеÑно, ÑÑо алгоÑиÑÐ¼Ñ Ð½Ðµ иÑполÑзÑÑÑ
даннÑе, извеÑÑнÑе апÑиоÑи:
на болÑÑинÑÑве ÑÑеков не ÑдаеÑÑÑ Ð¿Ð¾Ð»Ð½Ð¾ÑÑÑÑ
ÑазделиÑÑ Ð³Ð¾Ð»Ð¾Ñ Ð¸ аккомпанеменÑ.
мне кажеÑÑÑ, ÑÑо еÑли ÑÑиÑÑваÑÑ Ñиповое ÑаÑположение голоÑа
и инÑÑÑÑменÑов по ÑаÑÑоÑам, Ñо можно доÑÑиÑÑ
лÑÑÑÐ¸Ñ ÑезÑлÑÑаÑов и Ñ ÑÑими алгоÑиÑмами.
no subject
Date: 2013-05-30 06:15 am (UTC)no subject
Date: 2013-05-30 06:16 am (UTC)no subject
Date: 2013-05-30 08:54 am (UTC)1. У мÑзÑкалÑнÑÑ Ð¸Ð½ÑÑÑÑменÑов и голоÑа еÑÑÑ ÑембÑ. Ð¢ÐµÐ¼Ð±Ñ Ð¾Ð¿ÑеделÑеÑÑÑ "ÑмеÑÑÑ" обеÑÑонов. То еÑÑÑ Ð½Ð°Ð´Ð¾ ÑдвигаÑÑ Ð½Ðµ ÑолÑко ноÑÑ, но и вÑе обеÑÑонÑ. ЧÑо гоÑаздо Ñложнее.
2. ÐÑÑÐ³Ð°Ñ ÑложноÑÑÑ Ð² глиÑÑандо и ÑвÑзÑÑ Ð¼ÐµÐ¶Ð´Ñ Ð½Ð¾Ñами. ÐÑобенно ÑÑо замеÑно на голоÑе и ÑкÑипке. ÐоÑÑ Ð¿ÐµÑÐµÑ Ð¾Ð´ÑÑ Ð´ÑÑг в дÑÑга ÑеÑез плавнÑе пеÑÐµÑ Ð¾Ð´Ñ. Рнадо ÑÑанÑпониÑоваÑÑ Ð¿ÐµÑÐµÑ Ð¾Ð´, а не ÑолÑко наÑалÑнÑÑ Ð¸Ð»Ð¸ конеÑнÑÑ Ð½Ð¾ÑÑ. РеÑли ÑÑо ÑоÑÑепиано Ñ Ð¿ÐµÐ´Ð°Ð»ÑÑ, Ñо "ÑÑ Ð¾" Ð¾Ñ Ð½Ð¾ÑÑ Ð´Ð»Ð¸ÑÑÑ Ð² ÑеÑение неÑколÑÐºÐ¸Ñ Ð¿Ð¾ÑледÑÑÑÐ¸Ñ .
3. ТÑеÑÑÑ ÑложноÑÑÑ ÑвÑзана Ñ Ð¼ÐµÐ»Ð¾Ð´Ð¸ÐµÐ¹. РзавиÑимоÑÑи Ð¾Ñ Ð¼ÐµÐ»Ð¾Ð´Ð¸Ð¸, одна и Ñа же ноÑа Ð¼Ð¾Ð¶ÐµÑ ÑÑебоваÑÑ ÑÑанÑпониÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸Ð»Ð¸ неÑ. То еÑÑÑ Ð½Ð°Ð´Ð¾ понимаÑÑ, в какой ÑоналÑноÑÑи Ð¼ÐµÐ»Ð¾Ð´Ð¸Ñ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² даннÑй Ð¼Ð¾Ð¼ÐµÐ½Ñ (а ÑоналÑноÑÑÑ Ð¼Ð¾Ð¶ÐµÑ Ð¼ÐµÐ½ÑÑÑÑÑ), оÑÐ½Ð¾Ð²Ð½Ð°Ñ ÑÑо ноÑа или модиÑиÑиÑÐ¾Ð²Ð°Ð½Ð½Ð°Ñ Ð´Ð¸ÐµÐ·Ð¾Ð¼-бемолем-бекаÑом, и Ñ.п.
no subject
Date: 2013-05-30 08:56 am (UTC)no subject
Date: 2013-05-30 09:30 am (UTC)ÐеÑÑм ÑкземплÑÑ Ñигнал (поÑик, ÑÑо Ñам бÑло), пÑеобÑазÑем в ÑпекÑÑалÑнÑÑ ÑоÑмÑ, длÑÑе Ñмножаем ÑÑнкÑÐ¸Ñ ÑпекÑÑалÑного пÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ Ð½Ð° какой-Ñо коÑÑÑиÑÐ¸ÐµÐ½Ñ (пеÑÐµÑ Ð¾Ð´ Ð¾Ñ Ð½Ð¾ÑÑ "до" к ноÑе "Ñи" - ÑоÑÑÐ¾Ð¸Ñ Ð¸Ð¼ÐµÐ½Ð½Ð¾ в Ñмножении ÑаÑÑоÑÑ Ð½Ð° какÑÑ-Ñо велиÑинÑ) - и делаем обÑаÑное пÑеобÑазование.
Ðез компÑÑÑеÑов подобное ÑеализоваÑÑ Ñложнее, Ñ Ð¾ÑÑ, дÑÐ¼Ð°Ñ - Ñоже можно.
СдвинÑÑÑ ÑÐ¿ÐµÐºÑ "Ñеликом" не ÑколÑко-Ñо геÑÑ (когда к ÐºÐ°Ð¶Ð´Ð¾Ð¼Ñ Ð³Ð¾Ð»Ð¾ÑÑ Ð´Ð¾Ð±Ð°Ð²Ð»ÑеÑÑÑ Ð¿Ð¾ÑÑоÑнное ÑиÑло геÑÑ) - Ñоже можно, но ÑÑо делаеÑÑÑ Ð²Ð¾ вÑеменной облаÑÑи. ÐÑиÑÑм, пÑи опÑеделÑннÑÑ ÑÑилиÑÑ - оÑноÑиÑелÑно неÑложной ÑÐµÑ Ð½Ð¸ÐºÐ¾Ð¹. РазÑмееÑÑÑ Ð² ÑÑом ÑлÑÑае вÑÑ Ð³Ð°ÑÐ¼Ð¾Ð½Ð¸Ñ ÑаÑÑÑплеÑÑÑ.
no subject
Date: 2013-05-30 09:43 am (UTC)no subject
Date: 2013-05-30 01:20 pm (UTC)no subject
Date: 2013-05-30 02:13 pm (UTC)ÐоÑ, Ñ Ð½Ð°Ñел Ñо обÑÑждение и пÑимеÑÑ: http://fregimus.livejournal.com/208009.html
no subject
Date: 2013-05-30 02:22 pm (UTC)Ðо вÑе завиÑÐ¸Ñ Ð¾Ñ ÑÑебÑемого каÑеÑÑва, конеÑно, еÑли, к пÑимеÑÑ, ÑдовлеÑвоÑÐ¸Ñ Ð²Ð°ÑÐ¸Ð°Ð½Ñ "ÑазобÑаÑÑ Ð¿Ð¾ ноÑам паÑÑии вÑÐµÑ Ð¸Ð½ÑÑÑÑменÑов и ÑобÑаÑÑ Ð¸Ñ Ð¾Ð±ÑаÑно Ñ Ð¸ÑÑ Ð¾Ð´Ð½Ñми ÑембÑами, но не вÑе", Ñо ÑÑо гоÑаздо пÑоÑе
no subject
Date: 2013-06-01 01:58 pm (UTC)no subject
Date: 2013-06-03 06:48 am (UTC)У спектра можно разделить огибающую и частоты, можно заюзать вейвлет-преобразование, явно включающее в себя временной масштаб и т.д.
Собственно, есть программы, преобразующие звук в миди - а это уже практически чистая нотная запись.
Вот какое-то обсуждение по теме (http://forum.numi.ru/index.php?showtopic=3818).
no subject
Date: 2013-06-03 06:51 am (UTC)no subject
Date: 2013-06-03 09:04 am (UTC)Да, кстати, в топике ни о каком распознавании звука в миди ничего не нашёл. Есть только об обратном преобразовании.
no subject
Date: 2013-06-03 10:42 am (UTC)Я не уверен, что The Doors писали строго в рамках классической гармонии - и что писанные Вами сложности являются порождениями языка описания, а не самой "сущности" задачи.
Что же касаемо "wav в midi" - то я, видимо, где-то это увидел краем глаза.
Вот, скажем:
Между тем, существуют программы для “распознавания“ мелодий и нот (см. проекты на MIDI.Ru вроде akoff, midi-2-wav, widi). Они пытаются подобрать подходящие к звуку ноты (аккорды) - и получиться может очень даже похоже на оригинал (или совсем не похоже – почему так, вам расскажут их авторы в пояснениях к программе). Главная особенность таких программ – в получившейся мелодии инструменты и их звучание не будут соответствовать оригиналу, к тому же могут появиться "лишние" ноты и инструменты (это еще мягко сказано: могут.. 90% всех нот после конвертации такими программами лишние). (http://www.midi.ru/doc/40.htm)
Они там, сначала, правда, плачутся, что "восстановить невозможно", но, тем не менее. Про "вырезание голоса" они ещё жёстче высказываются.
no subject
Date: 2013-06-05 11:13 am (UTC)Что вы имеете ввиду под "классической гармонией"? Понятия "лад", "тональность", "аккорд", "мажор" и т.д. в полной мере применимы к их творчеству.
>...и что писанные Вами сложности являются порождениями языка
>описания, а не самой "сущности" задачи.
Описаннные сложности порождены самой сущностью задачи, которая состоит в том, что разные ноты должны повышаться на разную высоту. Например, для перевода натурального мажора в натуральный минор нужно опустить на полтона 3,6 и 7 ступени гаммы и при этом не изменять 1, 2,4 и 5 ступени.
no subject
Date: 2013-06-10 10:08 am (UTC)То самое, в рамках чего можно говорить про минорный / мажорный звукоряд.
Т.е, разметка звуков каммы как "основных" и "бемолей"/"диезов".
Описаннные сложности порождены самой сущностью задачи, которая состоит в том, что разные ноты должны повышаться на разную высоту.
Если есть мелодия, есть ноты - то их можно выделить - либо спектральным, либо спектрально-временным анализом. При этом можно делать вполне разумные допущения о том, что "нота" будет выглядеть "примерно одинаково" при любом возникновении в мелодии - т.е. формально это "около" синусоидальный сигнал с определённой огибающей (атака, поддержка, затухание).
Подобные элементы могут быть выделены из сигнала так-же корреляционным анализом.
Т.е. возможно я слегка ошибся, заявив, что задача совсем плёвая - но технически она выглядит вполне реализуемой.
В отличие от выделения голоса.
no subject
Date: 2013-06-10 11:29 am (UTC)>звукоряд.
>Т.е, разметка звуков каммы как "основных" и "бемолей"/"диезов".
Вот как раз она к Дорзам на 100% применима.
>При этом можно делать вполне разумные допущения о том, что
>"нота" будет выглядеть "примерно одинаково" при любом возникновении
>в мелодии - т.е. формально это "около" синусоидальный сигнал
>с определённой огибающей (атака, поддержка, затухание).
А гармоники мы игнорируем? Напоминаю, кстати, что в норме гармоники звучащих нот очень часто совпадают, т.к. именно такие совпадения воспринимаются человеком как приятные созвучия.
И почему вы полагаете, что для голоса ситуация иная? Ну то есть она иная, конечно, но как раз описанные вами моменты (основной тон, атака, затухание и т.д.) в равной мере справедливы и для голоса.
no subject
Date: 2013-06-11 08:18 am (UTC)Ох.
Гармоника - это представление сигнала в частотной области.
Там чистая синусоида, безо всяких "огибающих".
"Гармоники", "тембр" - это не совсем синусоида ( т.е. тембр - если во временной области), на которую "повешена" огибающая.
Мы можем выполнять не "чисто спектральный анализм" - а некую помесь, "временной спектр", при помощи кореляции, согласованной фильтрации и т.д. разлагая звук на одельные составляющие.
Можно вообще попробовать подобрать некие "образцы звуков" - особенно если это синтезатор, и известна его модель. Тогда можны усзнать сэмплы звуков каким-то образом.
При этом разные звуки складываются линейно - а линайные операции обратимы.
И почему вы полагаете, что для голоса ситуация иная?
Про звук "мелодических" (условно госоря) инструменты, играющие по нотам - можно делать правдоподобные предположения относительно спектра и длительности звучания - такты и т.д.
При этом форма сигнала сигнала будет достаточно стабильна - нота "до", сыгранная на синтезаторе, имитирующем флейту - будет иметь одинаковый набор гармоник и их соотношение, ноты разной длительности будут иметь разную продолжительность поддержки и только.
С человеческим голосом на фоне музыки такое предсказать сложнее.