Přejít na obsah

Detail publikace

Citace

Tychtl, Z. : Phase-mismatch-free and data efficient approach to natural sounding harmonic concatenative speech synthesis . EUSIPCO - 2004, p. 1027-1030, Technische Universität, Wien, 2004.

Abstrakt

The paper proposes our innovative approach to speech signal representation and generation in the harmonic/noise based speech synthesis. It is aimed to the high-quality synthesis on the low resource devices. The other implementations with artificial phases (linear, minimal, zeroed, etc.) produce the synthesized speech with unsatisfactory quality. In proposed approach we use phase data derived from real speech signals to reach natural sounding synthesis. We choose, so-called, representative phase vectors, that are only stored to the speech unit database. We reached a dramatic reduction of demands for the database storage space. It corresponds with the rate (number of voiced speech units):(number of voiced speech frames) stored in the database. Our proposed method also ensures the phase coherence in t he synthesized speech signal automatically.

Abstrakt v češtině

Příspěvek představuje náš inovativní přístup k reprezentaci řečových signálů a jejich generování v harmonicko/stochastické syntéze řeči. Cílem je vysoce kvalitní syntéza na nevýkonných zařízeních. Jiné přístupy s umělou fází (lineární, minimální, nulovanou, atd.) vytvářejí syntetickou řeč neuspokojivé kvality. V představovaném přístupu pro dosažení maximální přirozenosti syntézy používáme fáze signálů získané ze skutečných řečových signálů. Vybíráme tzv. fázové reprezentativní vektory, které jsou jediné uloženy do databáze řečových jednotek. Dosahujeme dramatického snížení nároků na úložný prostor pro databázi jednotek. Snížení odpovídá poměru (počet znělých jednotek):(počet znělých segmentů) uložených v databázi. Naše metoda zároveň automaticky zaručuje fázovou koherenci v syntetizovaném řečovém signálu.

Detail publikace

Název: Phase-mismatch-free and data efficient approach to natural sounding harmonic concatenative speech synthesis
Autor: Tychtl, Z.
Název - česky: Data efektivní a přirozeně znějící přístup k harmonické konkatenační syntéze bez fázových nespojitostí
Jazyk publikace: anglicky
Datum vydání: 6.9.2004
Rok vydání: 2004
Typ publikace: Stať ve sborníku
Název časopisu / knihy: EUSIPCO - 2004
Strana: 1027 - 1030
ISBN: 3-200-00165-8
Nakladatel: Technische Universität
Místo vydání: Wien
Datum: 6.9.2004 - 10.9.2004
/ /

Klíčová slova

harmonic synthehesis, speech synthesis, phase coherence

Klíčová slova v češtině

harmonická syntéza, syntéza řeči, fázová koherence

BibTeX

@INPROCEEDINGS{TychtlZ_2004_Phase-mismatch-free,
 author = {Tychtl, Z.},
 title = {Phase-mismatch-free and data efficient approach to natural sounding harmonic concatenative speech synthesis},
 year = {2004},
 publisher = {Technische Universit?t},
 journal = {EUSIPCO - 2004},
 address = {Wien},
 pages = {1027-1030},
 ISBN = {3-200-00165-8},
 url = {http://www.kky.zcu.cz/en/publications/TychtlZ_2004_Phase-mismatch-free},
}