Přejít na obsah

Detail publikace

Citace

Železný, M. and Císař, P. and Krňoul, Z. and Ronzhin, A. and Li, I. and Karpov, A. : Design of Russian audio-visual speech corpus for bimodal speech recognition . SPECOM 2005 proceedings, p. 397-400, Moscow State Linguistic University, Moscow , 2005.

Abstrakt

In this paper we present design of an audio-visual speech corpus in the Russian language for bimodal speech recognition task. At the University of West Bohemia in Plzen the audio-visual speech recognition system is developed for the Czech language. At the Saint-Petersburg Institute of Informatics and Automation of Russian Academy of Sciences the acoustic-only speech recognition system SIRIUS is developed. The paper presents the idea of joining these two projects and designing audiovisual speech recognition in the Russian language. In the paper the recording setup, preprocessing of a text part and a visual part of the corpus is presented. Paper concludes with possible application of such system.

Abstrakt v češtině

V článku prezentujeme návrh audiovizuálního řečového korpusu v ruském jazyce pro úlohu bimodálního rozpoznávání řeči. Na Západočeské univerzitě v Plzni je vyvíjen systém audiovizuálního rozpoznávání řeči pro češtinu. V Sankt-Petěrburgském institutu informatiky a automatizace Ruské akademie věd je vyvíjen systém akustického rozpoznávání řeči SIRIUS. Článek prezentuje myšlenku spojení těchto dvou projektů a návrh audiovizuálního systému rozpoznávání řeči pro ruštinu. V článku je prezentováno nastavení při nahrávání, předzpracování jak textové, tak i vizuální části korpusu. Článek je uzavřen možnou aplikací takového systému.

Detail publikace

Název: Design of Russian audio-visual speech corpus for bimodal speech recognition
Autor: Železný, M. ; Císař, P. ; Krňoul, Z. ; Ronzhin, A. ; Li, I. ; Karpov, A.
Název - česky: Návrh ruského audiovizuálního řečového korpusu pro bimodální rozpoznávání řeči
Jazyk publikace: anglicky
Datum vydání: 17.10.2005
Rok vydání: 2005
Typ publikace: Stať ve sborníku
Název časopisu / knihy: SPECOM 2005 proceedings
Strana: 397 - 400
ISBN: 5-7452-0110-X
Nakladatel: Moscow State Linguistic University
Místo vydání: Moscow
Datum: 17.10.2005 - 19.10.2005
/ /

Klíčová slova

speech recognition, speech corpora, audio-visual speech processing

Klíčová slova v češtině

rozpoznávání řeči, řečové korpusy, audiovizuální zpracování řeči

BibTeX

@INPROCEEDINGS{ZeleznyM_2005_DesignofRussian,
 author = {\v{Z}elezn\'{y}, M. and C\'{i}sa\v{r}, P. and Kr\v{n}oul, Z. and Ronzhin, A. and Li, I. and Karpov, A.},
 title = {Design of Russian audio-visual speech corpus for bimodal speech recognition},
 year = {2005},
 publisher = {Moscow State Linguistic University},
 journal = {SPECOM 2005 proceedings},
 address = {Moscow },
 pages = {397-400},
 ISBN = {5-7452-0110-X},
 url = {http://www.kky.zcu.cz/en/publications/ZeleznyM_2005_DesignofRussian},
}