Přejít na obsah

Detail publikace

Citace

Tihelka, D. and Matoušek, J. : Revealing the most significant deterioration factors in single candidate synthetic speech . Specom 2005, proceedings of 10th International Conference SPEECH and COMPUTER, p. 171-174, Moscow State Linguistic University, Moscow , 2005.

Abstrakt

The paper focuses on revealing the factors that cause the deterioration of the naturalness of synthetic speech. Modified listening tests are used for this task, as we also need to determine the impact of each considered factor. Synthetic speech generated by the single candidate version of our TTS was examined with the use of modified listening tests, and the most prominent deterioration factors were evaluated on two corpora. The most significant factor turned out to be the extensive modification of units, followed by segmentation inaccuracy and spectral discontinuities. However, the last two were not so significant. Listening tests described in this paper can be used not only for testing single candidate TTS systems, but also for testing other types of TTS. In fact, what is required to test depends only on the definition of the set of factors.

Abstrakt v češtině

Článek se zaměřuje na odhalování faktorů způsobujících degradaci přirozenosti syntetické řeči. Pro tuto úlohu jsou použity modifikované poslechové testy, protože potřebujeme také určit dopad jednotlivých uvažovaných faktorů. Zkoumána byla řeč generovaná naším TTS systémem ve verzi s jedním kandidátem a nejvýznamnější faktory byly hodnoceny na dvou korpusech. Jako nejvýznamnější faktor byla určena nadměrná modifikace jednotek, následovaná nepřesností segmentace a spektrálními nespojitostmi, ačkoli poslední dva faktory nebyly zdaleka tak významné. Poslechové testy popsané v tomto článku mohou být použity nejen pro zkoumání TTS systémů s jedním kandidátem, ale také pro jiné typy TTS systémů – zkoumané faktory v zásadě určují co se bude zkoumat.

Detail publikace

Název: Revealing the most significant deterioration factors in single candidate synthetic speech
Autor: Tihelka, D. ; Matoušek, J.
Název - česky: Odhalování nejvýznamnějších faktorů způsobujících degradaci kvality v syntéze řeči s jedním kandidátem
Jazyk publikace: anglicky
Datum vydání: 17.10.2005
Rok vydání: 2005
Typ publikace: Stať ve sborníku
Název knihy: Specom 2005, proceedings of 10th International Conference SPEECH and COMPUTER
Strana: 171 - 174
ISBN: 5-7452-0110-X
Nakladatel: Moscow State Linguistic University
Místo vydání: Moscow
Datum: 17.10.2005 - 19.10.2005
/ 2008-05-19 15:29:56 /

Klíčová slova

syntetic speech quality, deterioration factors, single instance TTS, extensive modification, segmentation inaccuracy, spectral discontinuities

Klíčová slova v češtině

kvalita syntetické řeči, faktory způsobující degradaci kvality, TTS systém s jedním kandidátem, nadměrná modifikace, nepřesnosti segmentace, spektrální nespojitosti

BibTeX

@INPROCEEDINGS{TihelkaD_2005_Revealingthemost,
 author = {Tihelka, D. and Matou\v{s}ek, J.},
 title = {Revealing the most significant deterioration factors in single candidate synthetic speech},
 year = {2005},
 publisher = {Moscow State Linguistic University},
 address = {Moscow },
 pages = {171-174},
 booktitle = {Specom 2005, proceedings of 10th International Conference SPEECH and COMPUTER},
 ISBN = {5-7452-0110-X},
 url = {http://www.kky.zcu.cz/en/publications/TihelkaD_2005_Revealingthemost},
}