Přejít na obsah

Detail publikace

Citace

Tihelka, D. : Symbolic prosody driven unit selection for highly natural synthetic speech . Interspeech 2005 — Eurospeech, proceedings of 9th European Conference on Speech Communication and Technology, p. 2525-2528, ISCA, Bonn, 2005.

Abstrakt

In the effort to obtain synthetic speech with the quality near to natural, the unit selection approach has become very important. To increase the naturalness of our native TTS system ARTIC we employed the specific version of the approach. It is driven by the high-level symbolic prosody description, defined according to the phenomena of prosodic synonymy and homonymy. The concrete prosody of a synthesized phrase is not explicitly set here, but emerges on the basis of the target and concatenation costs. Although this is our first treatment requiring some simplification, and for the synonymy/homonymy phenomena only the basics are defined, the first results have already shown that there is a significant shift towards high quality. Listening tests comparing speech from single-instance version to selection-based version of ARTIC showed clear preference of the selection-based version. In addition, the level of naturalness was on average assessed as "close to natural".

Abstrakt v češtině

Přístup výběru jednotek se stal velice důležitým v úsilí dosáhnout syntetickou řeč kvalitou se blížící přirozené, a potenciálně být schopni vytvořit emotivní syntézu. Pro zvýšení přirozenosti našeho vlastního TTS systému ARTIC jsme přišli se speciální modifikací tohoto přístupu. V ní je výběr řízen symbolicky popsanou prozodií, definovanou na základě fenoménů prozodické synonymie a homonymie. Konkrétní prozodie syntetizované fráze není explicitně určena, ale "zjevuje"na podle požadavků cen cíle a řetězení. Ačkoli se jedná o první pokus o tuto metodiku a definovali jsme pouze základy fenoménů synonymie/homonymie, první výsledky již ukázaly významný posun směrem k vyšší kvalitě. Poslechové testy porovnávající kvalitu řeči generované TTS systémem ARTIC s výběrem jednotek a bez něj ukázaly jasnou preferenci verze s výběrem, úroveň přirozenosti byla navíc hodnocena v průměru jako "téměř přirozená".

Detail publikace

Název: Symbolic prosody driven unit selection for highly natural synthetic speech
Autor: Tihelka, D.
Název - česky: Metoda výběru jednotek řízená symbolicky popsanou prozodií k získání vysoce přirozené syntetické řeči
Jazyk publikace: anglicky
Datum vydání: 4.9.2005
Rok vydání: 2005
Typ publikace: Stať ve sborníku
Název knihy: Interspeech 2005 — Eurospeech, proceedings of 9th European Conference on Speech Communication and Technology
Strana: 2525 - 2528
Nakladatel: ISCA
Místo vydání: Bonn
Datum: 4.9.2005 - 8.9.2005
/ 2008-05-19 15:30:24 /

Klíčová slova

unit selection, symbolic prosody, synthetic speech naturalness, prosodic synonymy, prosodic homonymy

Klíčová slova v češtině

dynamický výběr jednotek, symbolicky popsaná prozodie, přirozenost syntetické řeči, prozodická synonymie, prozodická homonymie

BibTeX

@INPROCEEDINGS{TihelkaD_2005_Symbolicprosody,
 author = {Tihelka, D.},
 title = {Symbolic prosody driven unit selection for highly natural synthetic speech},
 year = {2005},
 publisher = {ISCA},
 address = {Bonn},
 pages = {2525-2528},
 booktitle = {Interspeech 2005 -- Eurospeech, proceedings of 9th European Conference on Speech Communication and Technology},
 url = {http://www.kky.zcu.cz/en/publications/TihelkaD_2005_Symbolicprosody},
}