Přejít na obsah

Detail publikace

Citace

Pražák, A. and Müller, L. and Psutka Josef V.. and Psutka, J. : LIVE TV SUBTITLING - Fast 2-pass LVCSR System for Online Subtitling . SIGMAP 2007, , p. 139-142, INSTICC PRESS, Lisabon, 2007.

Abstrakt

The paper describes a fast 2-pass large vocabulary continuous speech recognition (LVCSR) system for automatic online subtitling of live TV programs. The proposed system implementation can be used for direct recognition of TV program audio channel or recognition of a shadow speaker who re-speaks the original audio channel. The first part of this paper focuses on preparation of an adaptive language model for TV programs, where person names are specific for each subtitling session and have to be added to the recognition vocabulary. The second part outlines the recognition system conception for automatic online subtitling with vocabulary up to 150 000 words in real-time. The recognition system is based on Hidden Markov Models, lexical trees and bigram and quadgram language models in the first and second pass, respectively. Finally, experimental results from our project with the Czech Television are reported and discussed.

Abstrakt v češtině

Článek popisuje rychlý dvouprůchodový rozpoznávací systém spojité řeči s velkým slovníkem (LVCSR) pro automatické online titulkování živých televizních pořadů. Implementace navrženého systému může být použita jak pro přímé rozpoznávání audio kanálu televizního programu, tak pro rozpoznávání stínového řečníka, který přemlouvá originální zvukový kanál. První část článku se zaměřuje na přípravu adaptivního jazykového modelu pro televizní programy, ve kterých jsou osobní jména specifická pro každou titulkovací úlohu a musejí být přidána do rozpoznávacího slovníku. Druhá část nastiňuje koncepci rozpoznávacího systému pro automatické online rozpoznávání se slovníkem do 150000 slov v reálném čase. Rozpoznávací systém je založen na Skrytých Markovových modelech, lexikálních stromech a bigramovém jazykovém modelu pro první průchod a čtyřgramovém jazykovém modelu pro druhý průchod. Závěrem jsou podány a diskutovány experimentální výsledky z našeho projektu s Českou televizí.

Detail publikace

Název: LIVE TV SUBTITLING - Fast 2-pass LVCSR System for Online Subtitling
Autor: Pražák, A. ; Müller, L. ; Psutka Josef V.. ; Psutka, J.
Název - česky: Titulkování živých televizních pořadů - rychlý dvouprůchodový LVCSR systém pro online titulkování
Jazyk publikace: anglicky
Datum vydání: 28.7.2007
Rok vydání: 2007
Typ publikace: Stať ve sborníku
Název časopisu / knihy: SIGMAP 2007
Edice:
Strana: 139 - 142
ISBN: 978-989-8111-13-5
Nakladatel: INSTICC PRESS
Místo vydání: Lisabon
Datum: 28.7.2007 - 31.7.2007
/ 2011-06-09 12:59:42 /

Klíčová slova

ASR, LVCSR, HMM, real-time, class-based language model, live TV, online subtitling

Klíčová slova v češtině

ASR, LVCSR, HMM, reálný čas, třídový jazykový model, živé televizní vysílání, online titulkování

BibTeX

@INPROCEEDINGS{PrazakA_2007_LIVETVSUBTITLING,
 author = {Pra\v{z}\'{a}k, A. and M\"{u}ller, L. and Psutka Josef V.. and Psutka, J.},
 title = {LIVE TV SUBTITLING - Fast 2-pass LVCSR System for Online Subtitling},
 year = {2007},
 publisher = {INSTICC PRESS},
 journal = {SIGMAP 2007},
 address = {Lisabon},
 pages = {139-142},
 ISBN = {978-989-8111-13-5},
 url = {http://www.kky.zcu.cz/en/publications/PrazakA_2007_LIVETVSUBTITLING},
}