标注问题和隐马尔科夫模型

标注问题(tagging problem)(或序列标注问题(sequence labeling problem))是将源序列 (标注模型的输入)映射到标记序列 (标注模型的输出)的问题。

假设我们有训练集 ,其中 为句子 为标签序列 。即 是第 个训练句子的第 个单词, 是它的标签。那么标注问题就是从该训练集中学习出一个能把这些句子映射到其标签序列的函数。

参考

  1. Tagging Problems, and Hidden Markov Models (Notes). Michael Collins. Columbia University.
  2. Tagging Problems, and Hidden Markov Models (Slides). Michael Collins. Columbia University.
  3. The Noisy Channel Model and Markov Models. Mark Johnson. Macquarie University.
  4. Natural Language Processing for Online Applications: Text Retrieval, Extraction and Categorization