Deep Voice, Paris

Rencontre

mer 15, au ven 17 juin 2022,
14h00
SCAI et Ircam
Plan d'accès
programme-deep-voice-paris.pdf

Diversité et inclusion dans les technologies vocales

Contenu :
Deep Voice, Paris est l’événement parisien dédié à la voix et à l’intelligence artificielle dont l’objectif est de réunir expertises scientifique et technique, innovation et entrepreneuriat. La diversité et l’inclusion seront à l’honneur de cette deuxième édition, pour échanger et débattre sur la présence des langues rares, des langues peu dotées, de la langue des signes, des dialectes et des accents, des biais et des discriminations dans les technologies vocales. Des ateliers techniques – “hands-on” – seront proposés aux participants pour développer leurs compétences dans les domaines du traitement de la parole et du langage naturel. Des moments de rencontres et de réseautage en fin de journée faciliteront les rencontres et l’échange entre les participants en toute décontraction. Intervenants Emil Asmussen Q project, Mathieu Avanzi Sorbonne Université, Djenebou Bathily Université Vincennes – Saint-Denis, Mélissa Barkat Defradas Institut des Sciences de l'Evolution, Laurent Besacier GIPSA lab Grenoble, Eric de la Clergerie Inria, Luc Julia Renault, Victoria Khurshudyan INALCO, Anton Lozhkov Hugging Face, Carl Robinson Rumble studio, Djamé Seddah Sorbonne Université, Maxim Serebryakov SANAS, Laure Soulier Sorbonne Université, Agnès Vourc'h CNRHR Robert Laplane Organisation Nicolas Obin Sorbonne Université-STMS, Xavier Fresquet SCAI (Sorbonne Center for Artificial Intelligence, Sorbonne Université) Programme Mercredi 15 juin (14h-17h, lieu : SCAI) 14h-14h15 au SCAI Mot d’introduction, Nicolas Obin, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture) et Xavier Fresquet, Sorbonne Center for Artificial Intelligence, Sorbonne Université 14h15-15h30 au SCAI Keynote “Histoire des technologies vocale, évolutions actuelles et perspectives” Intervenant : Luc Julia, Renault Animateur : Nicolas OBIN, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture) 15h30-17h au SCAI Discussion (en anglais) : “Quoi ma voix, qu’est-ce qu’elle a comme genre ?” Résumé : Quelles sont les relations entre voix et genre ? Comment le genre interagit avec l’identité et l’émotion ? Comment envisager le genre dans les technologies vocales ? Intervenants : Emil Asmussen, Creative Director of Meet Q, The World’s First Genderless Voice, Melissa A. Barkat-Defradas, Institut des Sciences de l'Evolution, Nadine Lavan, Queen Mary University of London, Giulia Perugia,  Eindhoven University of Technology (TU/e) – Eindhoven (Netherlands) Animateurs : Victor Rosi (Ircam), Sylvie Saget (Université de Gothenburg, en présence) 17h-18h30 Réception au SCAI, soirée rencontres et réseautage Jeudi 16 juin (10h-13h, lieu : SCAI, puis 14h-17h, lieu : Ircam) 10h-13h au SCAI Atelier #1: Hands-on speech-to-text with neural networks Intervenants : Yann Teytaut et Clément Le Moine Veillon, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture) 14h-16h à l'Ircam Session langue des signes + performance SLAM Intervenants : Agnès Vourc'h, CNRHR Robert Laplane, Michael Filhol, LIMSI, Djenebou Bathily, Université Vincennes - Saint-Denis 16h-17h30 à l'Ircam Discussion : Diversité des langues dans le monde numérique  Résumé : Quelle représentation des langues minoritaires dans les technologies vocales? Comment la technologie peut-elle aider à préserver les langues et les cultures ? Intervenants : Laurent Besacier, GIPSA lab, Victoria Khurshudyan, INALCO, Esther Klabbers, ReadSpeaker Animateur : Nicolas Obin, STMS lab (Ircam, Sorbonne Université, CNRS, Ministère de la culture) Vendredi 17 juin (10h-13h lieu : SCAI, puis 14h-17h, lieu : Ircam) 10h-13h au SCAI Atelier #2 : Hands-on CamemBERT Intervenants : Benjamin Muller, Roman Castagne, Nathan Godey (INRIA) 14h-15h30 à l'Ircam Discussion : Le biais est dans le texte? Intervenants : Eric de la Clergerie, Inria, Djamé Seddah, Sorbonne Université, Aurélie Névéol, Université Paris-Saclay Animatrice : Laure Soulier, Sorbonne Université 15h30-17h à l'Ircam Table ronde (en anglais) : diversité dialectale et accentuelle dans les technologies vocales Intervenants : Mathieu Avanzi, Sorbonne Université, Anton Lozhkov, Hugging Face, Maxim Serebryakov, SANAS Animateur : Carl Robinson (Rumble studio) 17h-17h15 à l'Ircam Mot de conclusion, Nicolas Obin, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture) et Xavier Fresquet, Sorbonne Université, SCAI

Deep Voice, Paris est l’événement parisien dédié à la voix et à l’intelligence artificielle dont l’objectif est de réunir expertises scientifique et technique, innovation et entrepreneuriat. La diversité et l’inclusion seront à l’honneur de cette deuxième édition, pour échanger et débattre sur la présence des langues rares, des langues peu dotées, de la langue des signes, des dialectes et des accents, des biais et des discriminations dans les technologies vocales.

Des ateliers techniques – “hands-on” – seront proposés aux participants pour développer leurs compétences dans les domaines du traitement de la parole et du langage naturel. Des moments de rencontres et de réseautage en fin de journée faciliteront les rencontres et l’échange entre les participants en toute décontraction.

Intervenants Emil Asmussen Q project, Mathieu Avanzi Sorbonne Université, Djenebou Bathily Université Vincennes – Saint-Denis, Mélissa Barkat Defradas Institut des Sciences de l'Evolution, Laurent Besacier GIPSA lab Grenoble, Eric de la Clergerie Inria, Luc Julia Renault, Victoria Khurshudyan INALCO, Anton Lozhkov Hugging Face, Carl Robinson Rumble studio, Djamé Seddah Sorbonne Université, Maxim Serebryakov SANAS, Laure Soulier Sorbonne Université, Agnès Vourc'h CNRHR Robert Laplane

Organisation Nicolas Obin Sorbonne Université-STMS, Xavier Fresquet SCAI (Sorbonne Center for Artificial Intelligence, Sorbonne Université)

Programme

Mercredi 15 juin (14h-17h, lieu : SCAI)

14h-14h15 au SCAI
Mot d’introduction, Nicolas Obin, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture) et Xavier Fresquet, Sorbonne Center for Artificial Intelligence, Sorbonne Université

14h15-15h30 au SCAI
Keynote “Histoire des technologies vocale, évolutions actuelles et perspectives”
Intervenant : Luc Julia, Renault
Animateur : Nicolas OBIN, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture)

15h30-17h au SCAI
Discussion (en anglais) : “Quoi ma voix, qu’est-ce qu’elle a comme genre ?”
Résumé : Quelles sont les relations entre voix et genre ? Comment le genre interagit avec l’identité et l’émotion ? Comment envisager le genre dans les technologies vocales ?
Intervenants : Emil Asmussen, Creative Director of Meet Q, The World’s First Genderless Voice, Melissa A. Barkat-Defradas, Institut des Sciences de l'Evolution, Nadine Lavan, Queen Mary University of London, Giulia Perugia, Eindhoven University of Technology (TU/e) – Eindhoven (Netherlands)
Animateurs : Victor Rosi (Ircam), Sylvie Saget (Université de Gothenburg, en présence)

17h-18h30
Réception au SCAI, soirée rencontres et réseautage

Jeudi 16 juin (10h-13h, lieu : SCAI, puis 14h-17h, lieu : Ircam)

10h-13h au SCAI
Atelier #1: Hands-on speech-to-text with neural networks
Intervenants : Yann Teytaut et Clément Le Moine Veillon, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture)

14h-16h à l'Ircam
Session langue des signes + performance SLAM
Intervenants : Agnès Vourc'h, CNRHR Robert Laplane, Michael Filhol, LIMSI, Djenebou Bathily, Université Vincennes - Saint-Denis

16h-17h30 à l'Ircam
Discussion : Diversité des langues dans le monde numérique
Résumé : Quelle représentation des langues minoritaires dans les technologies vocales? Comment la technologie peut-elle aider à préserver les langues et les cultures ?
Intervenants : Laurent Besacier, GIPSA lab, Victoria Khurshudyan, INALCO, Esther Klabbers, ReadSpeaker
Animateur : Nicolas Obin, STMS lab (Ircam, Sorbonne Université, CNRS, Ministère de la culture)

Vendredi 17 juin (10h-13h lieu : SCAI, puis 14h-17h, lieu : Ircam)

10h-13h au SCAI
Atelier #2 : Hands-on CamemBERT
Intervenants : Benjamin Muller, Roman Castagne, Nathan Godey (INRIA)

14h-15h30 à l'Ircam
Discussion : Le biais est dans le texte?
Intervenants : Eric de la Clergerie, Inria, Djamé Seddah, Sorbonne Université, Aurélie Névéol, Université Paris-Saclay
Animatrice : Laure Soulier, Sorbonne Université

15h30-17h à l'Ircam
Table ronde (en anglais) : diversité dialectale et accentuelle dans les technologies vocales
Intervenants : Mathieu Avanzi, Sorbonne Université, Anton Lozhkov, Hugging Face, Maxim Serebryakov, SANAS
Animateur : Carl Robinson (Rumble studio)

17h-17h15 à l'Ircam
Mot de conclusion, Nicolas Obin, STMS (Ircam, Sorbonne Université, CNRS, Ministère de la culture) et Xavier Fresquet, Sorbonne Université, SCAI

Éditer

https://www.sorbonne-universite.fr/evenements/deep-voice-paris