Přejít na obsah

Detail publikace

Citace

Zbynek Zajic and Jan Zelinka and Ludek Muller : Neural Network Speaker Descriptor in Speaker Diarization of Telephone Speech . Speech and Computer 19th International Conference (SPECOM 2017), p. 555-563, Springer, 2017.

PDF ke stažení

PDF 2

Abstrakt

In this paper, we have been investigating an approach to a speaker representation for a diarization system that clusters short telephone conversation segments (produced by the same speaker). The proposed approach applies a neural-network-based descriptor that replaces a usual i-vector descriptor in the state-of-the-art diarization systems. The comparison of these two techniques was done on the English part of the CallHome corpus. The final results indicate the superiority of the i-vector’s approach although our proposed descriptor brings an additive information. Thus, the combined descriptor represents a speaker in a segment for diarization purpose with lower diarization error (almost 20% relative improvement compared with only i-vector application).

Abstrakt v češtině

V tomto článku jsme vyšetřovali přítup k reprezentaci řečníka v úloze diarizace, pro shlukování podobných segmentů nahrávky. Navrhovaný přístup založený na neuronové síti (NN) nahrazuje přístuup i-vektorů z state-of-the-art diarizacního systému. Porovnání tšchto dvou technik bylo provedena na anglické části korpusu CallHome. Výsledky indikují nadřazenost metody založené na i-vektorech, ale kombinace obou přístupů vykazuje zlepšení v úspěšnosti diarizace, tedy systém založený na NN obsahuje dopˇmkovou informaci k i-vektorům.

Detail publikace

Název: Neural Network Speaker Descriptor in Speaker Diarization of Telephone Speech
Autor: Zbynek Zajic ; Jan Zelinka ; Ludek Muller
Název - česky: Neuronová síť pro popis řečníka v úloze diarizace telefonních hovorů
Jazyk publikace: anglicky
Rok vydání: 2017
Typ publikace: Prezentace na kongresech a seminářích v zahraničí
Název časopisu / knihy: Speech and Computer 19th International Conference (SPECOM 2017)
Strana: 555 - 563
DOI: 10.1007/978-3-319-66429-3_55
Nakladatel: Springer
/ 2019-11-15 14:44:26 /

Klíčová slova

Neural network, Speaker diarization, i-Vector

Klíčová slova v češtině

Neuronová síť, diarizace, i-vektor

BibTeX

@INPROCEEDINGS{ZbynekZajic_2017_NeuralNetwork,
 author = {Zbynek Zajic and Jan Zelinka and Ludek Muller},
 title = {Neural Network Speaker Descriptor in Speaker Diarization of Telephone Speech},
 year = {2017},
 publisher = {Springer},
 journal = {Speech and Computer 19th International Conference (SPECOM 2017)},
 pages = {555-563},
 doi = {10.1007/978-3-319-66429-3_55},
 url = {http://www.kky.zcu.cz/en/publications/ZbynekZajic_2017_NeuralNetwork},
}