Méthodologie 3-way d'extraction d'un modèle articulatoire de la parole à partir des données d'un locuteur

التفاصيل البيبلوغرافية
العنوان: Méthodologie 3-way d'extraction d'un modèle articulatoire de la parole à partir des données d'un locuteur
المؤلفون: Cadot, Martine, Laprie, Yves
المساهمون: Cadot, Martine, Machine Learning and Computational Biology (ABC), Department of Algorithms, Computation, Image and Geometry (LORIA - ALGO), Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria), Analysis, perception and recognition of speech (PAROLE), Inria Nancy - Grand Est, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Department of Natural Language Processing & Knowledge Discovery (LORIA - NLPKD), Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)
المصدر: Atelier Fouille de Données Complexes des 14èmes Journées Francophones "Extraction et Gestion des Connaissances"
Atelier Fouille de Données Complexes des 14èmes Journées Francophones "Extraction et Gestion des Connaissances", Jan 2014, Rennes, France. pp.1-12
بيانات النشر: HAL CCSD, 2014.
سنة النشر: 2014
مصطلحات موضوعية: [STAT.ME] Statistics [stat]/Methodology [stat.ME], [SPI] Engineering Sciences [physics], [SHS.INFO]Humanities and Social Sciences/Library and information sciences, [STAT.ML] Statistics [stat]/Machine Learning [stat.ML], [INFO.INFO-SD] Computer Science [cs]/Sound [cs.SD], [SHS.INFO] Humanities and Social Sciences/Library and information sciences, [SPI]Engineering Sciences [physics], [STAT.ML]Statistics [stat]/Machine Learning [stat.ML], [INFO.INFO-IR]Computer Science [cs]/Information Retrieval [cs.IR], [INFO.INFO-SD]Computer Science [cs]/Sound [cs.SD], fouille de données spatio-temporelles extraction de modèle articulatoire 3-way MDS (MultiDimensional Scaling) algorithme INDSCAL M-SVM (Multiple Support Vector Machine), [INFO.INFO-IR] Computer Science [cs]/Information Retrieval [cs.IR], [STAT.ME]Statistics [stat]/Methodology [stat.ME], spatio-temporal data mining extraction of articulatory model 3-way MDS (MultiDimensional Scaling) INDSCAL algorithm M-SVM (Multiple Support Vector Machine)
الوصف: For speaking, a speaker sets in motion a complex set of articulators: the jaw that opens more or less, the tongue which takes many shapes and positions, the lips that allow him to leave the air escaping more or less abruptly, etc.. The best-known articulary model is the one of Maeda (1990), derived from Principal Component Analysis made on arrays of coordinates of points of the articulators of a speaker talking. We propose a 3-way analysis of the same data type, after converting tables into distances. We validate our model by predicting spoken sounds, which prediction proved almost as good as the acoustic model, and even better when co-articulation is taken into account.
Pour parler, le locuteur met en mouvement un ensemble complexe d'articulateurs : la mâchoire qu'il ouvre plus ou moins la langue à laquelle il fait prendre de nombreuses formes et positions, les lèvres qui lui permettent de laisser l'air s'échapper plus ou moins brutalement, etc. Le modèle articulatoire le plus connu est celui de Maeda (1990), obtenu à partir d'Analyses en Composantes Principales faites sur les tableaux de coordonnées des points des articulateurs d'un locuteur en train de parler. Nous proposons ici une analyse 3-way du même type de données, après leur transformation en tableaux de distances. Nous validons notre modèle par la prédiction des sons prononcés, qui s'avère presque aussi bonne que celle du modèle acoustique, et même meilleure quand on prend en compte la co-articulation.
وصف الملف: application/pdf
اللغة: French
URL الوصول: https://explore.openaire.eu/search/publication?articleId=dedup_wf_001::9fc55aadd6be27f9046914f51403e55f
https://hal.archives-ouvertes.fr/hal-00934436
حقوق: OPEN
رقم الأكسشن: edsair.dedup.wf.001..9fc55aadd6be27f9046914f51403e55f
قاعدة البيانات: OpenAIRE