Séminaire n°36


Localisation, caractérisation et reconnaissance de voix chantées


Intervenante :  Lise Régnier

Contact : lise.regnier(at)gmail.com              

Date : 10/12/12

Résumé :
Ce séminaire présente mes travaux de thèse qui étaient d'étudier les caractéristiques vocales qui permettent de définir l'identité d'un chanteur. Ces travaux sont menés dans le but d'élaborer des systèmes capables de reconnaître automatiquement le chanteur d'une chanson donnée. Or dans la production musicale actuelle, il est rare que la voix soit a capella ce qui complexifie la tache. Il est donc nécessaire dans un premier temps de localiser la source à décrire au sein de la mixture instrumentale. Une fois les éléments correspondant au chant identifiés, il est ensuite nécessaire de définir des descripteurs qui caractérisent les éléments qui constituent la signature vocale des chanteurs. Pour finir la pertinence de ces descripteurs est évaluée à travers des taches classiques de reconnaissance.
Dans le travail présenté, nous proposons de décrire la voix chantée à l'aide de deux types de descripteurs : les descripteurs de timbre, basés sur l'enveloppe spectrale, et les descripteurs d'intonation, basés sur les variations temporelles de la fréquence fondamentale de la mélodie chantée. Les descripteurs de timbre, utilisés dans la plupart des tâches de classification audio, ont pour but de décrire « l'instrument du chanteur » (son conduit vocal) alors que les descripteurs d'intonation (qui décrivent des éléments expressifs de la voix tels que les vibrato/trémolo et portamento de la voix) ont pour but de décrire le style et la technique du chanteur. Nous montrons, à travers une série d'expériences, que les descripteurs d'intonation peuvent être utilisés pour distinguer efficacement le chant des autres instruments et que ces descripteurs peuvent être combinés aux descripteurs de timbre afin d'améliorer les performances des sytèmes de reconnaissance de chanteurs.