Sistema para la medición de similitud musical, usando marcadores expresivos con respecto a la intensidad acústica y métricas temporales
System for the measurement of musical commonality, using expressive markers with respect to the acoustic intensity and temporary metrics
Autor
Jimenez Medina, Mauro Alejandro
López Miranda, Juan Sebastián
Fecha
2018-12-04Resumen
La comprensión sobre el concepto de música puede llevar a discusiones relacionadas con la estructura musical, clasificación y problemas semánticos, porque la idea simple de la música en sí misma puede ser abstracta. Hay una definición psicológica por G. Widmer y W. Goebl para la interpretación musical como la acción de mejorar la interacción humana con la música, usando varios parámetros de la teoría musical como la duración de las notas, la dinámica, la articulación, etc. pero ¿cómo garantizar la identificación de marcadores expresivos de forma objetiva?
Por ello el sistema propuesto actuaría como agente inteligente de control en casos de plagio usando marcadores expresivos, la transformada discreta del coseno y el coeficiente de correlación de Pearson para su desarrollo.
La metodología para desarrollar la métrica de similitud musical se describe en la siguiente serie de etapas. La etapa inicial 1 consta de la lectura y almacenamiento de la señal de audio o de varias señales de consulta con tal de automatizar la tarea de consulta para otorgar flexibilidad al usuario; en la etapa 2 se realiza un preprocesamiento de la señal normalizándola con respecto a los niveles de intensidad acústica en escala logarítmica descritos por la ISO 6926:2016, luego se ejecuta un submuestreo de dicha señal a 44.1KHz, dicha elección esta relacionada con la frecuencia máxima permitida por el teorema de Nyquist y finalmente se promedia la información de los canales para convertir la muestra de audio a una señal monofónica.
Durante la etapa 3 y 4 se realiza el procesamiento de las señales, dicha etapa consta de un análisis frecuencial y temporal de la señal para generar una lista de candidatos usando el espectrograma del audio. La etapa 5 consiste en el desarrollo de un algoritmo de similitud que usa la transformada discreta del coseno para reducir el costo computacional y el coeficiente de correlacción de Pearson para identificar tendencias de similitud. Understanding the concept of music can lead to discussions related to musical structure, classification, and semantic problems because the simple idea of music itself can be abstract. There is a psychological definition by G. Widmer and W. Goebl for musical performance as the action of improving human interaction with music, using various parameters of musical theory such as the duration of notes, dynamics, articulation, etc. but how to guarantee the identification of expressive markers objectively?
Therefore, the proposed system would act as an intelligent control agent in cases of plagiarism using expressive markers, the discrete cosine transform, and the Pearson correlation coefficient was implemented for its development.
The methodology for developing the musical similarity metric is described in the following series of stages. The initial stage 1 consists of the reading and storage of the audio signal or of several query signals in order to automate the consultation task in order to grant flexibility to the user; In stage 2, preprocessing of the signal is performed by normalizing it with respect to the levels of acoustic intensity in logarithmic scale described by ISO 6926: 2016, then a sub-sampling of the signal is performed at 44.1KHz, this choice is related to the frequency maximum allowed by the Nyquist theorem and finally the information of the channels is averaged to convert the audio sample to a monophonic signal.
During stage 3 and 4 signal processing is performed, this step consists of a frequency and temporal analysis of the signal to generate a list of candidates using the audio spectrogram. Stage 5 consists of the development of a similarity algorithm that uses the discrete cosine transform to reduce the computational cost and the Pearson correlation coefficient to identify similarity trends.