损失函数

交叉熵损失

交叉熵损失函数(Cross-Entropy Loss Function)一般用于分类问题。假设样本的标签为 个离散的类别,模型 的输出为标签类别的条件概率分布,即:

为模型 的输出向量的第 维,且满足:

可以用一个 维的独热编码(one-hot encoding)向量 来表示标签。如果标签为 k,那么向量 的第 k 维为 1,其它维都为 0。 可以被看做标签的真实条件概率分布,它属于第 k 类的概率为 1,属于其他类的概率为 0。

可以用交叉熵来衡量真实分布 和模型预测分布 之间的差距:

因为 是 one-hot 向量,所以上式也可以写为:

其中, 可以被看做真实类别 k 的似然函数,所以交叉熵损失函数也就是负对数似然函数(Negative Log-Likelihood)。