Přejít na obsah

Detail publikace

Citace

Císař, P. and Železný, M. and Krňoul, Z. : 3D lip-tracking for audio-visual speech recognition in real applications . Journal of the Acoustical Society of Korea, p. 2521-2524, Sunjin Printing Co., Jeju, 2004.

Abstrakt

In this paper, we present a solution to the problem of tracking 3D information about the shape of lips from 2D picture of a speaker. We focus on lip-tracking of audio-visual speech recordings from the Czech in-vehicle audio-visual speech corpus (CIVAVC). The corpus consists of 4 h 40 min records of audiovisual speech of driver recorded in a car during driving in an usual traffic. In real conditions a head of a speaker (a car driver) can move and turn in various directions. To cope with this movements and to avoid recognition errors caused by changing 3D position of lips, our algorithm utilizes a 3Dmodel- based approach to the lip-tracking process.

Abstrakt v češtině

Článek se zabývá problémem sledování 3D tvaru rtů z 2D obrazu. Procej je zaměřen na sledování rtů v audiovizuálních nahrávkách z korpusu Czech in-vehicle audio-visual speech corpus (CIVAVC). Ve skutčném prostředí automobilu se hlava pohybuje v 3D prostoru. Změna orientace rtů v 3D prostoru zhoršuje výsledky rozpoznávání řeči. Proto jsme vytvořili algoritmus, který využívá 3D model rtů pro sledování jejich tvaru a 3D prostoru.

Detail publikace

Název: 3D lip-tracking for audio-visual speech recognition in real applications
Autor: Císař, P. ; Železný, M. ; Krňoul, Z.
Název - česky: 3D sledování rtů pro audio-vizuální rozpoznávání řeči v reálných aplikacích
Jazyk publikace: anglicky
Datum vydání: 4.10.2004
Rok vydání: 2004
Typ publikace: Článek z časopisu
Název časopisu / knihy: Journal of the Acoustical Society of Korea
Strana: 2521 - 2524
ISBN: 1225-441X
ISSN: 1225-441x
Nakladatel: Sunjin Printing Co.
Místo vydání: Jeju
Datum: 4.10.2004 - 8.10.2004
/ /

Klíčová slova

liptracking, 3D, speech recognition, templates, 3D tracking

Klíčová slova v češtině

odezírání ze rtů, 3D, rozpoznávání řeči, vizuální složka řeči, 3D sledování

BibTeX

@ARTICLE{CisarP_2004_3Dlip-trackingfor_1,
 author = {C\'{i}sa\v{r}, P. and \v{Z}elezn\'{y}, M. and Kr\v{n}oul, Z.},
 title = {3D lip-tracking for audio-visual speech recognition in real applications},
 year = {2004},
 publisher = {Sunjin Printing Co.},
 journal = {Journal of the Acoustical Society of Korea},
 address = {Jeju},
 pages = {2521-2524},
 ISBN = {1225-441X},
 ISSN = {1225-441x},
 url = {http://www.kky.zcu.cz/en/publications/CisarP_2004_3Dlip-trackingfor_1},
}