Přejít na obsah

Detail publikace

Citace

Psutka Josef V. and Švec Jan and Psutka Josef and Vaněk Jan and Pražák Aleš and Šmídl Luboš : Fast Phonetic/Lexical Searching in the Archives of the Czech Holocaust Testimonies: Advancing Towards the MALACH Project Visions . Lecture Notes in Computer Science, vol. 2010, p. 385-391, Springer, Heidelberg, 2010.

PDF ke stažení

PDF

Abstrakt

In this paper we describe the system for a fast phonetic/lexical searching in the large archives of the Czech holocaust testimonies. The developed system is the first step to a fulfillment of the MALACH project visions [1,2], at least as for an easier and faster access to the Czech part of the archives. More than one thousand hours of spontaneous, accented and highly emotional speech of Czech holocaust survivors stored at the USC Shoah Foundation Institute as videointerviews were automatically transcribed and phonetically/lexically indexed. Special attention was paid to processing of colloquial words that appear very frequently in the Czech spontaneous speech. The final access to the archives is very fast allowing to detect segments of interviews containing pronounced words, clusters of words presented in pre-defined time intervals, and also words that were not included in the working vocabulary (OOV words).

Abstrakt v češtině

Tento článek popisuje systém pro rychlé fonetické/lexikální prohledávání velkého audiovizuálního archívu českého holokaustu. Popisovaný systém je prvním krokem k naplnění projektu Malach. Více než 1000 hodin výpovědí bylo automaticky rozpoznáno a foneticky indexováno. Speciální pozornost byla věnována nespisvným slovům.

Detail publikace

Název: Fast Phonetic/Lexical Searching in the Archives of the Czech Holocaust Testimonies: Advancing Towards the MALACH Project Visions
Autor: Psutka Josef V. ; Švec Jan ; Psutka Josef ; Vaněk Jan ; Pražák Aleš ; Šmídl Luboš
Název - česky: Rychlé fonetické/lexikální hledání v archivech výpovědí českého holokaustu: Směřování k cílům projektu MALACH
Jazyk publikace: anglicky
Rok vydání: 2010
Typ publikace: Článek z časopisu
Název časopisu / knihy: Lecture Notes in Computer Science
Číslo vydání: 2010
Strana: 385 - 391
ISSN: 0302-9743
Nakladatel: Springer
Místo vydání: Heidelberg
2011-03-15 16:21:57 / 2011-09-19 08:31:40 / 1

Klíčová slova

speech recognition, phonetic searching, lexical searching

Klíčová slova v češtině

rozpoznávání řeči, fonetické vyhledávání, slovní vzhledávání

BibTeX

@ARTICLE{PsutkaJosefV_2010_FastPhoneticLexical,
 author = {Psutka Josef V. and \v{S}vec Jan and Psutka Josef and Van\v{e}k Jan and Pra\v{z}\'{a}k Ale\v{s} and \v{S}m\'{i}dl Lubo\v{s}},
 title = {Fast Phonetic/Lexical Searching in the Archives of the Czech Holocaust Testimonies: Advancing Towards the MALACH Project Visions},
 year = {2010},
 publisher = {Springer},
 journal = {Lecture Notes in Computer Science},
 address = {Heidelberg},
 volume = {2010},
 pages = {385-391},
 ISSN = {0302-9743},
 url = {http://www.kky.zcu.cz/en/publications/PsutkaJosefV_2010_FastPhoneticLexical},
}