Přejít na obsah

Detail publikace

Citace

Méner Martin and Tihelka Daniel : The possibilities of time scale modification of speech . Speech Processing, p. 107-113, Institute of Photonics and Electronics AS CR, Praha, 2009.

Abstrakt

The present paper deals with time-scale modifications of speech. The aim is to utilize high quality speech signal stretching method into the project ELJABR, or more specifically, into the part of project including automatic audio track generation. The audio track is produced from subtitles by TTS (text-to-speech) system, and one of the most frequented problems is that synthetic speech often exceeds the time slot in which subtitles are displayed. Therefore, the length of synthetic speech and time-slot of subtitles must be synchronized, mostly by increasing the speed of synthetic speech, while the quality of speech must be kept. This issue can be solved by WSOLA technique.

Abstrakt v češtině

Článek se zabývá modifikacemi časování řeči, s cílem využití metody pro vysoce kvalitní zkracování/natahování řeči v projektu ELJABR, především pak jeho části zabývající se automatickým vytvářením doprovodné zvukové stopy. Do této stopy je z titulků generována řeč systémem TTS (syntéza řeči z textu), a jeden z nejčastějších problémů je, že syntetická řeč přesahuje časový rámec vymezený dobou zobrazení titulku. Proto je nutné synchronizovat délku (časování) řeči s časováním titulků, zpravidla zrychlením řeči, přičemž je ale nutné zachovat původní kvalitu synttické řeči. To může být řešeno technikou WSOLA.

Detail publikace

Název: The possibilities of time scale modification of speech
Autor: Méner Martin ; Tihelka Daniel
Název - česky: Možnosti modifikací časování řeči
Jazyk publikace: anglicky
Rok vydání: 2009
Typ publikace: Stať ve sborníku
Název časopisu / knihy: Speech Processing
Strana: 107 - 113
ISBN: 978-80-86269-18-4
Nakladatel: Institute of Photonics and Electronics AS CR
Místo vydání: Praha
Datum: 1.10.2009
2011-03-15 16:21:45 / 2011-03-15 16:21:45 / 1

Klíčová slova

WSOLA, text-to-speech, subtitles, ELJABR

Klíčová slova v češtině

WSOLA, syntéza řeči z textu, titulky, ELJABR

BibTeX

@INPROCEEDINGS{MenerMartin_2009_Thepossibilitiesof,
 author = {M\'{e}ner Martin and Tihelka Daniel},
 title = {The possibilities of time scale modification of speech},
 year = {2009},
 publisher = {Institute of Photonics and Electronics AS CR},
 journal = {Speech Processing},
 address = {Praha},
 pages = {107-113},
 ISBN = {978-80-86269-18-4},
 url = {http://www.kky.zcu.cz/en/publications/MenerMartin_2009_Thepossibilitiesof},
}