Přejít na obsah

Detail publikace

Citace

Železný, M. and Krňoul, Z. : Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation . Digest of the Proceedings of the WSEAS Conferences, p. 4631741-4631746, WSEAS, Rethymno, 2003.

Abstrakt

The task of visual speech synthesis is usually solved by concatenation of basic speech units selected from a visual speech database. There are two main problems in this process. The first problem is a design of a database, that means estimation of the database parameters for all basic speech units. Second problem is a way how to concatenate selected basic phonetic units so as to eliminate the coarticulation effect. Both problems are aimed in our work, resulting in the Czech audio-visual speech synthesizer. We use HMM training process instead of some form of averaging for obtaining statistically best parameters for all basic phonetic units. For solution of a coarticulation effect we use the method of dominance functions.

Abstrakt v češtině

Syntéza vizuální řeči je většinou řešena konkatenací základních řečových jednotek vybíraných z databáze. Existují obecně dva hlavní problémy. Prvním je návrh vizuální databáze spolu s estimací hodnot řídicích parametrů. Druhý problém je je vlastní spojování jednotek. Oba problémy jsou řešeny v tomto článku a je navržena nová vizuální syntéza češtiny pomocí statistického přístupu. Je využito skrytých Markovových modelů (HMM) a dominančních funkcí pro řešení koartikulace.

Detail publikace

Název: Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation
Autor: Železný, M. ; Krňoul, Z.
Název - česky: Česká audiovizuální syntéza řeči
Jazyk publikace: anglicky
Datum vydání: 13.10.2003
Rok vydání: 2003
Typ publikace: Stať ve sborníku
Název časopisu / knihy: Digest of the Proceedings of the WSEAS Conferences
Strana: 4631741 - 4631746
ISBN: 960-8052-90-4
Nakladatel: WSEAS
Místo vydání: Rethymno
Datum: 13.10.2003 - 15.10.2003
/ /

Klíčová slova

audio-visual speech database, audio-visual speech synthesis, talking head, coarticulation, hidden Markov models

Klíčová slova v češtině

audiovizuální řečové databáze, audiovizuální syntéza řeči, mluvící hlava, koartikulace, skryté Markovovy modely

BibTeX

@INPROCEEDINGS{ZeleznyM_2003_Czechaudio-visual_2,
 author = {\v{Z}elezn\'{y}, M. and Kr\v{n}oul, Z.},
 title = {Czech audio-visual speech synthesis with an HMM-trained speech database and enhanced coarticulation},
 year = {2003},
 publisher = {WSEAS},
 journal = {Digest of the Proceedings of the WSEAS Conferences},
 address = {Rethymno},
 pages = {4631741-4631746},
 ISBN = {960-8052-90-4},
 url = {http://www.kky.zcu.cz/en/publications/ZeleznyM_2003_Czechaudio-visual_2},
}