Přejít na obsah

Flag-en show English version

Identifikace výsledku:
ZCU/KKY/2012/041

autorizovaný software (R)

Rok vydání: 2012
Autor: Jan Vaněk Josef Michálek

Nástroj pro rychlou extrakci příznaků

Softwarový nástroj pro rychlou extrakci příznaků pro analýzu a zpracování řečového signálu. Obsahuje standardní příznaky MFCC, PLP a TRAPS. Tento softwarový nástroj je speciálně navržen pro rychlé zpracování velkých objemů akustických dat. Využívá akcelerace pomocí grafických karet. Pokud kompatibilní GPU není k dispozici, využívá speciální SSE instrukce procesoru pro urychlení výpočtu.

ZdrojovÉ kódy a binární soubory

Jedná se o open-source software. Zdrojové kódy a binární spustilelné aplikace pro nejpoužívanější platformy jsou k dispozici v repozitáři na SourceForge.net

uŽivatelská Dokumentace

Uživatelská dokumentace s příklady použití ve formátu PDF je ZDE.

VERIFIKACE a validace

Software byl verifikován na několika desítkách hodin telefonní i vysoce kvalitní řeči. Výstupní příznakové vektory byly porovnány s referencním software HTK. Dosažené výsledky byly porovnatelné. Celkový výpočetní čas byl 3-20x kratší. 10 hodin řeči bylo zpracováno za 6 minut. Konkrétní urychlení značně závisí na konfiguraci počítače, zejména pak na rychlosti disku a výkonu grafické karty.



Licenční podmínky

Jedná se o open-source a freeware software.



Lokalizace výsledku / potvrzení o užívání

Software je volně k dispozici všem pracovištím zabývajícím se řečovými technologiemi. Rovněž je používáno na Katedře Kybernetiky Západočeské Uiverzity v Plzni.


Kontaktní formulář

Tento software je chráněn licencí, pro jeho stažení, kontrolu RIV, či získání informací o něm, prosím, vyplňte tento formulář:


text to speech