Přejít na obsah

Detail publikace

Citace

Císař, P. and Zelinka, J. and Železný, M. and Karpov, A. and Ronzhin, A. : Audio-visual speech recognition for Slavonic languages (Czech and Russian) . Proceedings of the 11th international conference "Speech and computer" SPECOM'2006 , p. 493-498, Anatolya Publishers, St.Petersburg, 2006.

Abstrakt

The paper presents the results of recent experiments with audio-visual speech recognition for two popular Slavonic languages: Russian and Czech. The description of test applied tasks, the process of multimodal databases collection and data pre-processing, methods for visual features extraction (geometric shape-based features; DCT and PCA pixel-based visual parameterization) as well as models of audio-visual recognition (concatenation of feature vectors and multi-stream models) are described. The prototypes of applied systems which will use the audio-visual speech recognition engine are mainly directed to the market of intellectual applications such as inquiry machines, video conference communications, moving objects control in noisy environments, etc.

Abstrakt v češtině

Článek prezentuje výsledky posledních experimentů s audiovizuálním rozpoznáváním řeči pro dva slovanské jazyky: ruštinu a češtinu. V článku je uveden popis testovacích aplikačních úloh, proces sbírání multimodální databáze a předzpracování dat, metody pro extrakci vizuálních příznaků (geometrické příznaky založené na tvaru a DCT a PCA parametrizace založené na hodnotě pixelů) a modely audiovizuálního rozpoznávání (spojování příznakových vektorů a multistreamové modely). Prototypy aplikovaných systémů, které používají modul audiovizuálního rozpoznávání řeči jsou směrovány především na trh intelektuiálních aplikací jako jsou dotazovací systémy, videokonferenční komunikace, ovládání pohyblivých objektů v hlučném prostředí atd.

Detail publikace

Název: Audio-visual speech recognition for Slavonic languages (Czech and Russian)
Autor: Císař, P. ; Zelinka, J. ; Železný, M. ; Karpov, A. ; Ronzhin, A.
Název - česky: Audiovizuální rozpoznávání řeči pro slovanské jazyky (češtinu a ruštinu)
Jazyk publikace: anglicky
Datum vydání: 25.6.2006
Rok vydání: 2006
Typ publikace: Stať ve sborníku
Název časopisu / knihy: Proceedings of the 11th international conference "Speech and computer" SPECOM'2006
Strana: 493 - 498
ISBN: 5-7452-0074-X
Nakladatel: Anatolya Publishers
Místo vydání: St.Petersburg
Datum: 25.6.2006 - 29.6.2006
/ /

Klíčová slova

audio-visual speech recognition, slavonic languages

Klíčová slova v češtině

audiovizuální rozpoznávání řeči, slovanské jazyky

BibTeX

@INPROCEEDINGS{CisarP_2006_Audio-visualspeech,
 author = {C\'{i}sa\v{r}, P. and Zelinka, J. and \v{Z}elezn\'{y}, M. and Karpov, A. and Ronzhin, A.},
 title = {Audio-visual speech recognition for Slavonic languages (Czech and Russian)},
 year = {2006},
 publisher = {Anatolya Publishers},
 journal = {Proceedings of the 11th international conference "Speech and computer" SPECOM'2006 },
 address = {St.Petersburg},
 pages = {493-498},
 ISBN = {5-7452-0074-X},
 url = {http://www.kky.zcu.cz/en/publications/CisarP_2006_Audio-visualspeech},
}