# 受限玻尔兹曼机

## 结构

${\displaystyle E(v,h)=-\sum _{i}a_{i}v_{i}-\sum _{j}b_{j}h_{j}-\sum _{i}\sum _{j}h_{j}w_{i,j}v_{i))$

${\displaystyle E(v,h)=-a^{\mathrm {T} }v-b^{\mathrm {T} }h-h^{\mathrm {T} }Wv}$

${\displaystyle P(v,h)={\frac {1}{Z))e^{-E(v,h)))$

${\displaystyle P(v)={\frac {1}{Z))\sum _{h}e^{-E(v,h)))$

${\displaystyle P(v|h)=\prod _{i=1}^{m}P(v_{i}|h)}$.

${\displaystyle P(h|v)=\prod _{j=1}^{n}P(h_{j}|v)}$.

${\displaystyle P(h_{j}=1|v)=\sigma \left(b_{j}+\sum _{i=1}^{m}w_{i,j}v_{i}\right)\,}$${\displaystyle \,P(v_{i}=1|h)=\sigma \left(a_{i}+\sum _{j=1}^{n}w_{i,j}h_{j}\right)}$

## 训练算法

${\displaystyle \arg \max _{W}\prod _{v\in V}P(v)}$

${\displaystyle \arg \max _{W}\mathbb {E} \left[\sum _{v\in V}\log P(v)\right]}$

1. 取一个训练样本v，计算隐层节点的概率，在此基础上从这一概率分布中获取一个隐层节点激活向量的样本h
2. 计算vh外积，称为“正梯度”；
3. h获取一个重构的可见层节点的激活向量样本v'，此后从v'再次获得一个隐层节点的激活向量样本h'
4. 计算v'h'的外积，称为“负梯度”；
5. 使用正梯度和负梯度的差以一定的学习率更新权重${\displaystyle w_{i,j))$${\displaystyle \Delta w_{i,j}=\epsilon (vh^{\mathsf {T))-v'h'^{\mathsf {T)))}$

