Séminaire n°36
Localisation,
caractérisation et reconnaissance de voix chantées
Intervenante : Lise
Régnier
Contact : lise.regnier(at)gmail.com
Date : 10/12/12
Résumé :
Ce séminaire présente mes travaux de thèse qui étaient d'étudier
les caractéristiques vocales qui
permettent de définir l'identité d'un chanteur. Ces travaux sont menés
dans le but d'élaborer des systèmes capables de reconnaître
automatiquement le chanteur d'une chanson donnée. Or dans la production
musicale actuelle, il est rare que la voix soit a capella ce qui
complexifie la tache. Il est donc nécessaire dans un premier temps de localiser la source à décrire au
sein de la mixture instrumentale. Une fois les éléments correspondant
au chant identifiés, il est ensuite nécessaire de définir des
descripteurs qui caractérisent
les éléments qui constituent la signature vocale des chanteurs. Pour
finir la pertinence de ces descripteurs est évaluée à travers des
taches classiques de reconnaissance.
Dans le travail présenté, nous proposons de décrire la voix chantée
à l'aide de deux types de descripteurs : les descripteurs de timbre,
basés sur l'enveloppe spectrale, et les descripteurs d'intonation,
basés sur les variations temporelles de la fréquence fondamentale de la
mélodie chantée. Les descripteurs de timbre, utilisés dans la plupart
des tâches de classification audio, ont pour but de décrire «
l'instrument du chanteur » (son conduit vocal) alors que les
descripteurs d'intonation (qui décrivent des éléments expressifs de la
voix tels que les vibrato/trémolo et portamento de la voix) ont pour
but de décrire le style et la technique du chanteur. Nous montrons, à
travers une série d'expériences, que les descripteurs d'intonation
peuvent être utilisés pour distinguer efficacement le chant des autres
instruments et que ces descripteurs peuvent être combinés aux
descripteurs de timbre afin d'améliorer les performances des sytèmes de
reconnaissance de chanteurs.