An Investigation on Initialization Schemes for Multilayer Perceptron Training Using Multilingual Data and Their Effect on ASR Performance

Vu, Ngoc Thang; Breiter, Wojtek; Metze, Florian; Schultz, Tanja

doi:10.1184/R1/6473039.v1

file.pdf (258.74 kB)

An Investigation on Initialization Schemes for Multilayer Perceptron Training Using Multilingual Data and Their Effect on ASR Performance

journal contribution

posted on 2012-09-01, 00:00 authored by Ngoc Thang Vu, Wojtek Breiter, Florian MetzeFlorian Metze, Tanja Schultz

In this paper we present our latest investigation on initialization schemes for Multilayer Perceptron (MLP) training using multilingual data. We show that the overall performance of an MLP network improves significantly by initializing it with a multilingual MLP. We propose a new strategy called "open target language" MLP to train more flexible models for language adaptation, which is particularly suited for small amounts of training data. Furthermore, by applying Bottle-Neck feature (BN) initialized with multilingual MLP the ASR performance increases on both, on those languages which were used for multilingual MLP training, and on a new language. Our experiments show word error rate improvements of up to 16.9% relative on a range of tasks for different target languages (Creole and Vietnamese) with manually and automatically transcribed training data.

History

Publisher Statement

Date

2012-09-01

Usage metrics

Keywords

multilingual multilayer perceptron Bottle-Neck feature language adaptation

Licence

In Copyright

Exports

RefWorks

BibTeX

Ref. manager

Endnote

DataCite

NLM

DC

An Investigation on Initialization Schemes for Multilayer Perceptron Training Using Multilingual Data and Their Effect on ASR Performance

History

Publisher Statement

Date

Usage metrics

Categories

Keywords

Licence

Exports