Linguistic Structured Sparsity in Text Categorization

Yogatama, Dani; A. Smith, Noah

doi:10.1184/R1/6473504.v1

file.pdf (253.08 kB)

Linguistic Structured Sparsity in Text Categorization

journal contribution

posted on 2014-06-01, 00:00 authored by Dani Yogatama, Noah A. Smith

We introduce three linguistically motivated structured regularizers based on parse trees, topics, and hierarchical word clusters for text categorization. These regularizers impose linguistic bias in feature weights, enabling us to incorporate prior knowledge into conventional bagof-words models. We show that our structured regularizers consistently improve classification accuracies compared to standard regularizers that penalize features in isolation (such as lasso, ridge, and elastic net regularizers) on a range of datasets for various text prediction problems: topic classification, sentiment analysis, and forecasting.

History

Publisher Statement

Date

2014-06-01

Usage metrics

Keywords

Language Technologies

Licence

In Copyright

Exports

RefWorks

BibTeX

Ref. manager

Endnote

DataCite

NLM

DC

Linguistic Structured Sparsity in Text Categorization

History

Publisher Statement

Date

Usage metrics

Categories

Keywords

Licence

Exports