σ1e−2σ2(x−η)2则条件概率为:
P(ak∣yi)=g(ak,ηyi,σyi)
- 当训练样本中某个类别没出现过某种特征,P(ai∣yk)=0?
解决这个问题的办法是给每个特征和类别的组合加上给定个数的虚假样本(“hallucinated” examples)。
假设特征ai 的取值有J个,并假设为每个xi 对应的概率增加s个虚假样本,这样得到的估计称为平滑估计(smoothed estimate):
P^(Xi=xi∣C=ck)=P{C=ck}+sJP{Xi=xi∧C=ck}+s
特别的,当s=1时,上述平滑称为拉普拉斯平滑(Laplace smoothing)。
- 为何假设属性之间条件独立?
减少模型参数量,否则贝叶斯定理不成立。
联系作者
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 梦家博客! 打赏
wechat
alipay