Přejít na obsah

Detail publikace

Citace

Vaněk Jan and Psutka Josef V. and Zelinka Jan and Pražák Aleš and Psutka Josef : Training of Speaker-Clustered Acoustic Models for Use in Real-Time Recognizers . Proceedings of the International Conference on Signal Processing and Multimedia Application, p. 131-135, INSTICC, Miláno, 2009.

PDF ke stažení

PDF

Abstrakt

The paper deals with training of speaker-clustered acoustic models. Various training techniques - Maximum Likelihood, Discriminative Training and two adaptation based on the MAP and Discriminative MAP were tested in order to minimize an impact of speaker changes to the correct function of the recognizer when a response of the automatic cluster detector is delayed or incorrect. Such situation is very frequent e.g. in on-line subtitling of TV discussions (Parliament meetings). In our experiments the best cluster-dependent training procedure was discriminative adaptation which provided the best trade-off between recognition results with correct and non-correct cluster detector information.

Abstrakt v češtině

Článek se zabývá trénováním skupinových akustických modelů. Byly zde testováný různé metody modelování: Maximální věrohodnosti, diskriminativní trénování a dva druhy adaptace založené na metodě MAP a diskriminativním MAP. Metody byly hodnoceny s ohledem na možné zpoždění nebo chybovost automatického detektoru správné skupiny. Tato situace je velice častá, například v úloze automatického titulkování televizních přenosů (zasedání parlamentu). Podle našich experimentů, nejlepší metodou pro trénování skupinových modelů byla diskriminativní adaptace, která dosahovala nejlepších výsledků jak v případech, kdy byla informace od detektoru správná, tak v případě chybné informace.

Detail publikace

Název: Training of Speaker-Clustered Acoustic Models for Use in Real-Time Recognizers
Autor: Vaněk Jan ; Psutka Josef V. ; Zelinka Jan ; Pražák Aleš ; Psutka Josef
Název - česky: Trénování skupinových kustických modelů pro použití v systémech rozpoznávání řeči pracujících v reálném čase
Jazyk publikace: anglicky
Datum vydání: 10.7.2009
Rok vydání: 2009
Typ publikace: Stať ve sborníku
Název časopisu / knihy: Proceedings of the International Conference on Signal Processing and Multimedia Application
Strana: 131 - 135
ISBN: 978-989-674-007-8
Nakladatel: INSTICC
Místo vydání: Miláno
2011-03-15 16:21:46 / 2012-02-17 11:21:03 / 1

Klíčová slova

Acoustic models training, discriminative training, clustering, gender-dependent models

Klíčová slova v češtině

trénovaní akustických modelů, diskriminativní trénování, shlukování, gender-dependent modely

BibTeX

@INPROCEEDINGS{VanekJan_2009_Trainingof,
 author = {Van\v{e}k Jan and Psutka Josef V. and Zelinka Jan and Pra\v{z}\'{a}k Ale\v{s} and Psutka Josef},
 title = {Training of Speaker-Clustered Acoustic Models for Use in Real-Time Recognizers},
 year = {2009},
 publisher = {INSTICC},
 journal = {Proceedings of the International Conference on Signal Processing and Multimedia Application},
 address = {Mil\'{a}no},
 pages = {131-135},
 ISBN = {978-989-674-007-8},
 url = {http://www.kky.zcu.cz/en/publications/VanekJan_2009_Trainingof},
}