19
Large-Scale Music Annotation and Retrieval: Learning to Rank in Joint Semantic Spaces Journal New Research Music 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Embed Size (px)

Citation preview

Page 1: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Large-Scale Music Annotation and Retrieval: Learning to

Rank in Joint Semantic Spaces

Journal New Research Music – 2012 Citado por 3 artigos

Alex Amorim Dutra

Jason Weston, Samy Bengio, and Philippe Hamel

Google, USA

Page 2: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Large-Scale Music Annotation and Retrieval: Learning to Rank in Joint Semantic Spaces

Trabalhos relacionados/Serviços Vantagens Algoritmo Resultados Conclusões Referências

Sumário

Page 3: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Predição de artistas

Predição de músicas

Artistas similares

Músicas similares

Predição de tags: retorna uma lista de tags, (e.g. rock, guitar, fast, . . . ).

Large-Scale Music Annotation and Retrieval

Page 4: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

LastFm, Pandora, iTunes

Sugestões da próxima música que irá tocar.

Sugestão de artistas dado um conjunto de ratings de artistas, músicas e albuns.

Pesquisa por genero, estilos, humor.

Trabalhos Relacionados e Serviços

Page 5: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Aplicado ao mundo real.

Exibiu altas perfomances em todas tarefas propostas.

Melhores performances sobre o baseline.

Baixo consumo de memória.

Vantagens

Page 6: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Encontrar os melhores parâmetros.

Minimizar a função:

Utilizou AUC Margin Ranking Loss e WARP Loss.

Fase de treinamento

Page 7: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Como utilizado stochastic gradient descent cada modelo aprende parametros com valores um pouco diferentes.

A média das funções:

Emsemble

Page 8: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Algoritmo

Page 9: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Meta dados - Cold start se utilizar somente filtragem colaborativa.

Baseada em conteúdo: MFCCs (Mel Frequency Cepstral Coefficient) e (SAI) Stabilized Auditory Image.

Features

Page 10: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

TagATune – Tem um conjunto de clips contendo 30 segundos. Tem anotações associadas. Coletado por usuários em forma de jogo.

TagATune usado no MIREX 2009 desafio de classificação de tags.

Para comparação utilizado mesmas tags e bases de treino.

Base de testes

Page 11: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Base de testes

Page 12: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

precision@k

number of true positives in the top k positionk

Medida de performance

Page 13: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Resultados

Page 14: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Resultados

Page 15: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Resultados

Page 16: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Resultados

Page 17: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Otimizando p@k melhora performance.

Os dados apresentam a distribuição de cauda longa.

O modelo tem respostas rápidas e baixa consumo de memória.

Conclusões

Page 18: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Weston, J., Bengio, S., Usunier, N.: Large scale image annotation: Learning to rank with joint word-image embeddings. In: European conference on Machine Learning. (2010)

Robbins, H., Monro, S.: A stochastic approximation method. Annals of Mathematical Statistics 22 (1951) 400–407

Pampalk, E., Dixon, S., Widmer, G.: On the evaluation of perceptual similarity measures for music. In: Intl. Conf. on Digital Audio Effects. (2003)

Law, E., West, K., Mandel, M., Bay, M., Downie, J.S.: Evaluation of algorithms using games: the case of music tagging. In: Proceedings of the 10th International Conference on Music Information Retrieval (ISMIR). (October 2009) 387–392

Foote, J.T.: Content-based retrieval of music and audio. In: SPIE. (1997) 138–147

Referências

Page 19: Journal New Research Music – 2012 Citado por 3 artigos Alex Amorim Dutra Jason Weston, Samy Bengio, and Philippe Hamel Google, USA

Dúvidas?