Přejít na obsah

Detail publikace

Citace

Císař, P. and Železný, M. : Using of lip-reading for speech recognition in noisy environments . Speech Processing, p. 137-142, Academy of Sciences of the Czech Republic, Prague, 2004.

Abstrakt

This paper is focused on using lipreading methods for isolated words recognition from visual part of utterance. First we will introduce the Lipreading problem. Next we will show the structure of isolated words recognition. Then we will describe Lip extraction, lips parameterization and training of the models. Finally we will present the results of isolated words recognition and verification of our new dynamic features.

Abstrakt v češtině

Článek je zaměřen na využití metod odezírání ze rtů pro rozpoznávání izolovaných z vizuální složky řeči. Nejprve je popsán problém odezírání řeči. Po té je čtenář seznámen se strukturou rozpoynávače izolovaných slov. V další části je objasněn proces nalezení rtů a natrénování potřebných modelů. Poslední část ukazuje výsledky rozpoznávání a vylepšení, kterých jsme dosáhli použitím našich dynamických příznaků.

Detail publikace

Název: Using of lip-reading for speech recognition in noisy environments
Autor: Císař, P. ; Železný, M.
Název - česky: Použití metod odezírání ye rtů pro rozpoznávání řeči v hlučných prostředích
Jazyk publikace: anglicky
Datum vydání: 15.9.2003
Rok vydání: 2004
Typ publikace: Stať ve sborníku
Název časopisu / knihy: Speech Processing
Strana: 137 - 142
ISBN: 80-86269-10-8
Nakladatel: Academy of Sciences of the Czech Republic
Místo vydání: Prague
Datum: 15.9.2003 - 17.9.2003
/ /

Klíčová slova

automatic lip-reading, speech recognition, noisy speech processing

Klíčová slova v češtině

automatické odezírání ze rtů, rozpoznávání řeči, zpracování zašuměné řeči

BibTeX

@INPROCEEDINGS{CisarP_2004_Usingoflip-reading,
 author = {C\'{i}sa\v{r}, P. and \v{Z}elezn\'{y}, M.},
 title = {Using of lip-reading for speech recognition in noisy environments},
 year = {2004},
 publisher = {Academy of Sciences of the Czech Republic},
 journal = {Speech Processing},
 address = {Prague},
 pages = {137-142},
 ISBN = {80-86269-10-8},
 url = {http://www.kky.zcu.cz/en/publications/CisarP_2004_Usingoflip-reading},
}