تشخیص خودکا دستگاه و گام موقی سی ایانی مبتنی ب تکنوازی سازهای تا و سو به وله استخاج هوشمند 3 2 متضی دیند صاب عبده زادگان 1 شهام جعفی 1 دانشکده مهند بق و کامپیوت دانشگاه شیاز saber.abdollahzade@gmail.com 2 دانشکده مهند بق و کامپیوت دانشگاه شیاز jafaris@shirazu.ac.ir 3 موسسه فهنگی و هنی طنین اوه m.sepher@yahoo.com چکیده تشخیص دستگاه قطعات موقی سی ایانی همواه بای عقه مندان موقی دستگاهی و دیف شده ی ایانی موضوعی با پیچیده و جب بوده که به دلیل کابدهای وان آن د زنه هایی مانند آموزش و آهنگ سازی از اهت با بایی بخودا است. این کا به واسطه صف شنیدن یک قطعه موقی کا با دشوای است و فقط اساتید متبح موقی و یا کسانی که سها به این سبک موقی گوش داده و ساختا تما دستگاهها ا شناخته اند توانند از عهده این کا بآیند. همچنین بای دستیابی به این هدف فقط مطعه ساختا و تئوی موقی کافی نیست. د این مقه وشی خودکا و کاآمد اائه شده است که د آن ب پایه استخاج های نواخته شده و فواصل فکان آنها د قطعات تکنوازی توان دستگاه و گام یک قطعه موقی ا مشخص کد. د این پژوهش از دستگاه ها و گام های موقی متوت و سازهای تا و سو استده شده است و به هیج سبک نوازندگی خاص محد نشده است. که د پایان با دقت % 33 دستگاه و گام قطعات تکنوازی نواخته شده استخاج گشته است. کلمات کلیدی تشخیص دستگاه موقی گام استخاج تشخیص گو فواصل فکان 1- مقدمه اموزه تشخیص و جداسازی قطعات موقی ب اساس سبک محتوا و نوع آن به دلیل کابدهای وان به یکی از موضوعات مهم د این زنه تبدیل شده است که باعث شده تحقیقات وانی د این شاخه انجام گید. موقی سی و دستگاهی ایانی به دلیل پیچیدگی و قواعد خاصی که داد باعث شده تا تحقیق چندانی د این زنه انجام نگید اما موقی غبی به دلیل ساختا نسبتا ساده ت خود موجب شده تا محقیقن با استده از ویژگی هایی نظی تعداد کلمات ادا شده د ه دقیقه تعداد کلمات د ه سط نشانه هایی مانند ویگول نقطه و... به احتی بتوانند قطعات موقی ا ب اساس نوع آن مانند پاپ کک و... از یکدیگ جدا کنند همچنین استده از سعت و یتم نیز تواند با موث باشد] 3 [. د بخی از تحقیق ها نظی ]4[ از وش های یادگی مانند Support Vector Machine استده شده است که د این ان از ویژگی هایی نظی طیف ضب نخ عبو از صف ضایب فکان مل بهه گقته شده است. د عین ح بخی از تحقیق ها از تکیب چندین وش استده کده اند ]5[ و ]7[. اما موقی ایانی به دلیل داا بودن گام های مختلف و اجا با سعت های متوت د ه دستگاه موقی باعث شده تا وان از چنین ویزگی هایی بهه بد. از جمله فعیت های انجام شده د زنه موقی دستگاهی ایانی توان به دسته بندی خودکا گام ماهو اشاه کد] 1 [ که د آن با استده از ویژگی بسامد قوی تین هماهنگ های موجود د بیناب یک 918
قطعه موقی و به وله یک شبکه عصبی مصنوعی قطعاتی که د دستگاه ماهو هستند از سای دستگاه ها شناسایی شده اند. د این مقه با استده از یک شبکه عصبی RBF سامانه ای طاحی شده است که یک گن صوتی ا دیافت کند و د خوجی اعم کند که آیا دستگاه قطعه ی وودی ماهو است یا غی ماهو. از موادی که توان د این تحقیق به آن اشاه کد عدم شناسایی سای دستگاه های موجود د موقی ایانی و عدم استده از بخی تکنیک های نوازندگی نظی ویباون تیل و گلیسان اشاه کد که این تکنینک ها جهت زیبا ت کدن قطعات استده شود و این ام د نوازندگی با متداول باشد. همچنین د این فعیت فقط از ساز سه تا بای جمع آوی مجموعه داده استده شده است. د این مقه د کل یک ماتیس وودی با ابعاد 135 22 )زیا 22 قله غب د طیف فکان قطعه ها اخاب شده بود و تعداد داده های آموزشی باب 135 بدا بود( ا جهت آموزش شبکه تولید کدند.از این تعداد وودی 02 عدد از دستگاه ماهو و بقیه از پنج دستگاه دیگ بودند.خوجی شبکه نیز حت داشت: ماهو و غی ماهو که متناظ با صف و یک د بدا خوجی بود. د نهایت پس از آموزش شبکه با % 72 داده های پیش پدازش شده با تعداد 60 نون یه انی دقت شبکه د تشخیص دستگاه ماهو % 73/33 بود] 1 [. د یکی دیگ از پژوهش ها ]2[ نیز با استده از گام های موجود د قطعات و استخاج گام های ه یک از دستگاه ها توانسته اند با دقت بایی دستگاه قطعاتی ا که گام ها و های آن از قبل مشخص است شناسایی کنند که ستم استده شده د این مود نیز یک شبکه عصبی باشد. اما این وش ن تواند وشی خودکا بای این هدف باشد زیا نیازمند یک ناظ جهت استخاج فواصل موجود د ه قطعه موقی باشد. د مقه پیش و از وشیی متوت و کاآمدت نبت به ای وشها ایتده شییده ایت که د ادامه: د بخش 2 تعیفی از یاختا موییقی دستگاهی ایانی از نگاه علم مهند اائه شده است د بخش 3 ماحل مدل پیشینهادی ش داده شده و همچنین وشی جدید بای استخاج معفی شده است د بخش 4 نیز ایج و ازیابی مدل اائه شده آوده شده است و د بخش 5 جمع بندی و یجه گیی به عمل آمده است. 2- ساختا موقی دستگاهی ایانی دستگاه د موقی ایانی عبات است از یک توی از پده های مختلف موقی که اخاب این توی حس و شو خاصی به شنونده اق دهد. بای مث دستگاه تم حزین داد ولی دستگاه ماهو بیشت طب انگیز باشد. یک دستگاه موقی از نظ قب قطعه ای کامل و داای قواعد و قسمتهای مختلفی است که با ساز و آواز اجا شود. ه دستگاه از تعداد با زیادی گوشه تشکیل شده است و موقی سی ایانی شامل هفت دستگاه )شو ماهو چهاگاه نوا و است پنج گاه( باشد که طبق نظیه کلنل علینقی وزیی فتا و حات دستگاه است پنج گاه مانند ماهو و دستگاه نوا نیز همانند شو باشد] 6 [. لذا تقم بندی نهایی د این پژوهش به صوت زی است: دستگاه شو)نوا( دستگاه دستگاه چهاگاه دستگاه دستگاه ماهو )است پنج گاه( اما اگ بخواهیم تعیفی از دیتگاه د علم مهندیی اائه دهیم باید آن ا از نظ فواصیل فکان بیان کنیم: د یک قطعه موقی از تمام ها و پده های موجود د از اتده ن شیود بلکه تنها هایی با فکانس معین نواخته شود. بنا ب مطب گفته شییده توان دیافت که د قطعات موییقیایی نواخته شییده خواص و ویزگی هایی پنهان ایت که توان ب ایاس آنها گویی ا بای ه کدام از دتگاه ها مشیخص کد. جهت وشین ت شیدن موضییوع به تعیف گام نیز توجه کنیم: گام توی چند ایت که به تتیب اتع )زی و ب( متب شییده اند که این گام تواند با ونده یا پایین ونده باشیید. بای مث گام "" از "" شییوع شییده و پس از پیمودن فیاصییلیه هیایی مشییخص )یک اکتاو کامل( به ""ی بعدی د)-ی-----ل-(. به طو کلی صله یک اکتاو باب است با 1 س )cent( همچنین صله بین متوی )یک پده( باب با باشید اما د حت اتثنا صیله بین های )- ( و )ی- ( باب باشند. همچنین گام ماوو که د جوامع بین مللی مشتک است به صوت شکل زی است: شکل )1( : گام ماوو د حت کلی دستگاه ماهو از گام ماوو تبعیت کند به عباتی شکل فوق نمایانگ گام "" د دیتگاه ماهو ایت. به هن تتیب بای نمونه گام ل د دتگاه ماهو با توجه به فواصل مشخص شده به صوت زی خواهد بود: ل- - ی- - )#(- ل. همان طو که مشاهده شود د گام دستگاه ماهو د دجه هفتم گام به ی دیز تغیی کند. طبق قوانین موجود د موقی تعدادی عمتهای عضی وجود داند که صیدای های اصیلی ا با و پایین آوند این عمتهای عضیی شیامل بم لل) ъ ( کللن)> ( دیمز)#( و لیس ی)>( که ه کدام به تتیب صدای اصییلی ا نیم پده پایین بع پده پایین نیم پده با و بع پده با بند. به هن تتیب پس از بی ساختا تمام دستگاهها فواصل موجود د این دستگاهها د جل زی نشان داده شده است: دستگاه شو چهاگاه ماهو جل )1( : فواصل مبوط به ه دستگاه فواصل )س( ح با د نظ گفتن این فواصل بای ه دستگاه موقی توان ه گا ا ) شاهد( بای آنها مشخص کد که جل شماه 2 نیز دستگاهها و گامهای موجود د آنها ا نشان دهد که د موقی سی ایانی متداول بوده و مود استده قا گید. طبق بخی حات استثنا دجه ششم دستگاه 919
شو و متغی باشد.به عباتی د این تحقیق با یک مسئله 12 کسه وبو خواهیم بود و مجموعه داده ی جمع آوی شده نیز د چهاچوب این ده حت ضبط گدیده و مود آزمایش قا گفته است. 3- مدل پیشنهادی بناب مطب گفته شیده د زنه تشیخیص دتگاههای مویقی های نواخته شیده توط ساز نقش کلیدی ا ای کنند چنانچه بتوان های استده شده ا د قطعات موقی با دقت قابل قبولی استخاج کد توان به وله آنها فواصل موجود بین این ها ا مشخص کده و د نهایت به دلیل منحص به فد بودن گوها به دستگاه یک قطعه موقی پی بد. به هن منظو بیا توجیه بیه یاختیا تکنوازی قطعات وش موثتی جهت استخاج معفی شده است. لذا تمکز این وش ب وی تشخیص هوشمند نیت خواهید بود که این وش هوشییمند محد به یعت و تکنیک های نوازندگی که موجب دلنشیین ت کدن قطعه شوند نخواهد بود. به عباتی هچه های موجود د یک قطعه تکنوازی نواخته شییده با دقت بیشییتی استخاج شود دستگاه و گام آن قطعه نیز به دستی تعیین خواهد شد. د حت کلی وش اائه شیده د این مقه از محله تشیکیل شده است که محله اول تشخیص و محله م تعیین ساختا و دستگاه. گو ماهو ماهو شو شو چهاگاه چهاگاه جل )2( : گام های متداول د دستگاههای موقی ایانی دیز دیز دیز این منظو ابتیدا تما های موجود ب وی دیته ی تا ایانی از "" دت باز وی یم اول تا "" پایین دته توسط نوازنده ای نواخته شد و پس د یک یل صیوتی یخیه گدید. شکل 2 گن مبوط یه این یل صیوتی ا نشان دهد. همانگونه که محظه شود ز حمله و ز آزاد ازی ه نواخته شیده به خوبی دیده شیود)قمت اول شکل(. همچنین د قیمت م شییکل که شییا طیفی مبوط به همان ییگن باشد محل ضبه خودن مضاب ب وی م به وضو مشخص است. شکل) 2 ( : گن مبوط به تما پده های گام جهت دیتیابی به نقاطی که ها نواخته شییده اند و پس از آن محایبه فکانس مبوط به این نقاط د شیکل 3 یه بیونی این گن نمایش داده شده است که پیک های مشخص شده ب وی شکل زمان اجای ا ب حب شدت انوی نشان دهد. پس از این محله حول این پیک های به دت آمده پنجه هایی ا ب وی یگن اصلی اعم کنیم. به عبات دیگ یگن وودی با اتده از نقاط به دت آمده فیم بندی شود )شکل 4( تا محاسبات مبوط به یافتن فکانس فیم به فیم انجام شود تا د نهایت با دقت بیشتی های موجود د یک قطعه تکنوازی استخاج شوند. د این مقییه بای محیایبیه فکیانس غییب ه فیم از تیابع خود همبتگی) Autocorrelation ( اتده شده است که به وله ابطه زی بدست آید: R(s, t) = E{(X t μ t )(X s μ s )} (1) σ t σ s که د آن tو s زمان متوت و X نیز یک فآیند تکا پذی )ییگن وودی( باشند. از این تابع بای شناسایی یک فکانس گم شده د گن نیز اتده شیود. این عمل ا ب وی تما فیم های به دست آمده از قسمت قبل اعم کنیم تا د نهایت از وی فکانس به دست آمده بتوان های نواخته شده ا استخاج کد چا که ه موقی فکانس خاص خود ا داا باشد. Envelope Amplitutde شکل )3( : 1-3- استخاج تشخیص های نواخته شده د یک قطعه موقی مهمتین و اصلی تین قدم باشید که با توجه به تکنوازی بودن قطعات توان محابات مبوط به حوزه فکانس ا ب وی های نواخته شیده د یگن وودی انجام داد. بدین تتیب توان به صییوت تقیبی فکانس هایی ا از وی یگن وودی به دت آود که معف های نواخته شده خواهد بود. به Time(s) محل های نواخته شده ب وی گن 920
4- ایج و ازیابی ستم معادل شکل) 4 ( : فیم بندی گن د تئوی مویقی مبنای کوک از "" باشید که فکان 442 هتز داد و همچن د از هایی نظی تا و ه تا دست باز یم اول فکان باب با 204 هتز خواهد داشت. جل شماه 3 یجه محابات مبوطه ا نشان دهد و همانگونه که محظه شود با دقت بیییا بیایی فکانس مبوط به های "" و "" و تما ها به دت آمد. اما هنگام نواخته شیدن قطعات مویقی ها با سعت بایی اجا شوند و ممکن است گاهی چندین با یکدیگ تکیب شوند. ب این اساس پیش بینی شود هنگام انجام این محاسبات ب وی یک قطعه کامل مویقی ها به صوت کامل و منطبق با آنچه که نواخته شود نباشد. اما از آنجا که تعداد های اجا شده د یک قطعه موقی کامل با زیاد باشد لذا چنین خطاهایی ن تواند مانعی د وند تشخیص دستگاه باشد. دیز جل )3( : فکانس های بدست آمده فکانس)هتز( 204.233 260.371 233.157 323.342 321.467 334.503 343.542 302.232 372.235 2-3- تشخیص دستگاه و گام فکانس)هتز( 361.610 335.713 415.162 420.073 444.324 401.757 473.516 433.450 527.006 د این محله محاسبات بیان شده ا ب وی گن تمام قطعه اعم کنیم تا های اتده شیده د آن بدست آید. سپس به وله این ها یک گام کامل ا تشیکیل دهیم. ح با استده از جل شماه 2 توان دتگاه و گام آن قطعه مویقی ا مشخص کد. به عنوان مث یجه محابات ب وی تصینیف هزا دتان به این صیوت باشد: )(- - - )(- -. که با توجه به جل 2 توان تشخیص داد که این تصنیف د دستگاه چهاگاه و گام "" قا داد. به منظو تت یتم 42 قطعه توسط ساز تا د دستگاه ها و گام های متوتی )مطابق جل شماه 2( ضبط گدید. قطعات د فمت mp3 و نخ نمونیه بدای 44/1 کیلو هتز بای پدازش د نم افزا متلیب آاده گدید. همچنین چها قطعه نیز به ویله از سو به مجموعه داده اضافه گدیید. د این مجموعه )د کل 40 قطعه( قطعاتی شییامل تصیینیف منگ چهامضیاب بداهه نوازی و... توسط اساتید موقی نواخته و ضبط شد که د این مجموعه نوازندگان قطعات مویقی ا به صوت کامل و با استده از تکنییک های نوازندگی اجا کدند. جل شییماه 4 جزئیات داده های جمع آوی شده ا نشان دهد. از ان این قطعات دتگاه و گام فقط ه قطعه به اشتباه تشخیص داده شید که این سه قطعه د دستگاه های و بودند. همانطو که د جل شماه 2 مشاهده شود دستگاه بیشتین تغییات ا داد و هن ام تواند دلیل خطاهای خ داده باشیید. به عباتی عملکد وش پیشنهادی ب وی مجموعه ضبط شده دقتی معادل % 33 داد. دستگاه ماهو ماهو شو شو چهاگاه چهاگاه جل) 4 ( : دستگاه و تعداد قطعات ضبط شده تعداد 6 قطعه 2 قطعه 7 قطعه 5 قطعه 4 قطعه 4 قطعه 1 قطعه 5- یجه گیی د این مقه وشیی اائه شید که د مقایه با فعیت های مشیابه از ازهای مختلفی بای آزمایش اتده شد. همچنین د مجموعه داده جمع آوی شده نوازندگان قطعات موسبقی از تکنیک های نوازندگی جهت دلنشین ت کدن قطعات مویقی بهه جستند. که د نهایت با دقت با بایی هم دستگاه و هم گام قطعه تکنوازی نواخته شده مشخص گدید. فعیت هایی که د ادامه توان انجام داد عباتیت از یافتن نقاط اییت موجود د قطعات نواخته شیده که با استده از این نقاط ایست توان تمام هفت دستگاه و آوازهای موجود د موقی ایانی ا شناسایی کد. 921
ماجع س.محمودان و ا.بنوشی "دسته بندی خودکا گام ماهو موقی ایانی توسط یک شبکه عصبی مصنوعی" ن کننس بین مللی.1931 آکوستیک و اتعاشات دانشگاه صنعتی شیف [2] H.Hajimolahoseini, R.Amirfattahi and M.Zekri, Real time Classification of Persian Musical Dastgah Using Artificial Neural Network Artificial Intelligence and Signal Processing (AISP),16 th CSI International Symposium,2012. [3] R.Mayer, R.Neumayer and A.Rauber, Combination of Audio and Lyrics Features fore Genre Classification in Digital Audio Collections Proceedings of the 16 th ACM international Conference on multimedia,pages 159-168,2008. [4] C.Xu, N. C. Maddage, X.Shao,F. Cao and Q. Tian, Musical Genre Classification Using Support Vector Machines Acoustics Speech and signal Processing, IEEE Conference,20003. [5] D. Chathuranga and L. Jayaratne, Musical Genre Classification Using Ensemble of Classifiers Fourth International Conference on Computational Intelligence Modelling and Simulation,2012. [6] Y. Anan, K. Hatano, H. Bannai and M. Takeda, Music Genre Classification Using Similarity Functions 12 th International Society for Music Information Retrival Conference,ISMIR 2011. [7] R. Mayer, R.Neumayer and A.Rauber, Rhyme and Style Features For Musical Genre Classification By Song Lyrics ISMIR,2008. [8] A.N. Vaziri, Dasture Tar, Tehran,1913. [9] H. Farhat, The Dastgah Conception in Persian Music, Cambridge University Press,1990. [10] R. Gang, G.Bocko, J. Lundberg, S. Roessner,D. Headlam and M.F. Bocko, A Real Time Signal Processing Framework Of Musical Expressive Feature Extraction Using Matlab 12 th International Society For Music Information Retrieval Conference,2011. [11] F. Eyban, S. Bock, B. Schuller and A. Graves, Universal Onset Detection With Bidirectional Long Short-Term Memory Neural Networks 11 th International Society for Music Information Retrieval Conference,2010. [12] S. Bock, A. Arzt, F.Krebs and M. Schedl, Online Real Time Onset Detection With Recurrent Neural Networks 15 th Int Conference on Digital Audio Effects, 2012. ]1[ 922