Přejít na obsah

Detail publikace

Citace

Jan Zelinka and Jan Vaněk and Luděk Müller : Neural-Network-based Spectrum Processing for Speech Recognition and Speaker Verification . Statistical Language and Speech Processing, Third International Conference, SLSP 2015, p. 288-299, Springer, 2015.

Abstrakt

In this paper, neural networks are applied as a feature extractors for a speech recognition system and a speaker verification system. A long-temporal features with delta coefficients, mean and variance normalization are applied when a neural-network-based feature extraction is trained together with a neural-network-based voice activity detector and with a neural-network-based acoustic model for speech recognition. In speaker verification, the acoustic model is replaced with a score computation. The performance of our speech recognition system was evaluated on the British English speech corpus WSJCAM0 and the performance of our speech verification system was evaluated on our Czech speech corpus.

Abstrakt v češtině

V tomto článku je popsána aplikace neuronové sítě jako extraktoru vektoru příznaků pro rozpoznávání mluvené řeči a pro verifikaci řečníka. Dlouhodobé příznaky s delta koeficienty, normalizací střední hodnoty a variance jsou použity při současném trénování vah neuronové sítě pro extrakci příznaků a neuronové sítě pro akustický model pro rozpoznávání mluvené řeči. V případě verifikace řečníka je akustický model nahrazen výpočtem skóre shody. Prezentované metody pro rozpoznávání mluvené řeči byly ověřeny na anglickém korpusu WSJCAM0 a metody pro verifikaci řečníka na korpusu českém.

Detail publikace

Název: Neural-Network-based Spectrum Processing for Speech Recognition and Speaker Verification
Autor: Jan Zelinka ; Jan Vaněk ; Luděk Müller
Jazyk publikace: anglicky
Rok vydání: 2015
Typ publikace: Stať ve sborníku
Název časopisu / knihy: Statistical Language and Speech Processing, Third International Conference, SLSP 2015
Strana: 288 - 299
ISBN: 978-3-319-25788-4
ISSN: 0302-9743
Nakladatel: Springer
/ 2019-11-18 12:50:43 /

BibTeX

@MISC{JanZelinka_2015_Neural-Network-based,
 author = {Jan Zelinka and Jan Van\v{e}k and Lud\v{e}k M\"{u}ller},
 title = {Neural-Network-based Spectrum Processing for Speech Recognition and Speaker Verification},
 year = {2015},
 publisher = {Springer},
 journal = {Statistical Language and Speech Processing, Third International Conference, SLSP 2015},
 pages = {288-299},
 ISBN = {978-3-319-25788-4},
 ISSN = {0302-9743},
 url = {http://www.kky.zcu.cz/en/publications/JanZelinka_2015_Neural-Network-based},
}