如果图模型中不含隐变量(latent variable),即所有变量都是可观测的,那么网络参数一般可以直接通过最大似然来进行估计。
给定 N 个训练样本 D={x(n)}n=1N,其对数似然函数为:
L(D;θ)=N1n=1∑Nlogpθ(x(n))=N1n=1∑Nk=1∑Klogpθk(xk(n)∣xπk(n))
其中 θk 为第 k 个变量的局部条件概率的参数。第二步可以由贝叶斯网络的定义推出。
因为所有变量都是可观测的,所以在参数估计时,分别最大化每个变量的条件似然即可:
θk=argmaxn=1∑Nlogpθk(xk(n)∣xπk(n))
贝叶斯网络 参数学习:EM 算法