System for the measurement of musical similarity, using expressive markers considering the acoustic intensity and temporal metrics.
Sistema para la medición de similitud musical, usando marcadores expresivos con respecto a la intensidad acústica y métricas temporales.
Autor
Jimenez Medina, Mauro Alejandro
López Miranda, Juan Sebastián
Fecha
2018-12-04Resumen
La comprensión sobre el concepto de música puede llevar a discusiones relacionadas con la estructura musical, clasificación y problemas semánticos, porque la idea simple de la música en sí misma puede ser abstracta. Dada esta complejidad, han surgido múltiples temáticas de investigación, siendo una de ellas la identificación de audio para garantizar su legitimidad o fraudulencia; pero ¿cómo garantizar la identificación de marcadores expresivos de forma objetiva?
Por ello el sistema propuesto actuaría como agente inteligente de control en casos de plagio usando marcadores expresivos, la transformada discreta del coseno y el coeficiente de correlación de Pearson para su desarrollo.
La metodología para desarrollar la métrica de similitud musical se describe en la siguiente serie de etapas. La etapa inicial 1 consiste en la lectura y el almacenamiento de la señal de audio o de varias señales de consulta para automatizar la tarea de consulta con el fin de otorgar flexibilidad al usuario; En la etapa 2, el preprocesamiento de la señal se realiza normalizándolo con respecto a los niveles de intensidad acústica en la escala logarítmica descrita por ISO 6926: 2016, luego se realiza un submuestreo de la señal a 44.1 KHz, esta opción está relacionada con La frecuencia máxima permitida por el teorema de Nyquist y, finalmente, la información de los canales se promedia para convertir la muestra de audio en una señal monofónica.
Durante la etapa 3 y 4 se realiza el procesamiento de la señal, este paso consiste en un análisis de frecuencia y temporal de la señal para generar una lista de candidatos utilizando el espectrograma de audio. La etapa 5 consiste en el desarrollo de un algoritmo de similitud que utiliza la transformada discreta del coseno para reducir el costo computacional y el coeficiente de correlación de Pearson para identificar tendencias de similitud. Understanding the concept of music can lead to discussions related to musical structure, classification, and semantic problems because the simple idea of music itself can be abstract. There is a psychological definition by G. Widmer and W. Goebl for musical performance as the action of improving human interaction with music, using various parameters of musical theory such as the duration of notes, dynamics, articulation, etc. but how to guarantee the identification of expressive markers objectively?
Therefore, the proposed system would act as an intelligent control agent in cases of plagiarism using expressive markers, the discrete cosine transform, and the Pearson correlation coefficient were implemented for its development.
The methodology for developing the musical similarity metric is described in the following series of stages. The initial stage 1 consists of the reading and storage of the audio signal or of several query signals in order to automate the consultation task in order to grant flexibility to the user; In stage 2, preprocessing of the signal is performed by normalizing it with respect to the levels of acoustic intensity in logarithmic scale described by ISO 6926: 2016, then a sub-sampling of the signal is performed at 44.1KHz, this choice is related to the frequency maximum allowed by the Nyquist theorem and finally the information of the channels is averaged to convert the audio sample to a monophonic signal.
During stage 3 and 4 signal processing is performed, this step consists of a frequency and temporal analysis of the signal to generate a list of candidates using the audio spectrogram. Stage 5 consists of the development of a similarity algorithm that uses the discrete cosine transform to reduce the computational cost and the Pearson correlation coefficient to identify similarity trends.