现有的deep hierarchical topic model没有将prior belief结合到topic hierarchical learning中
将prior structural knowledge作为inductive bias注入到学习当中,提出的TopicNet将每个主题表示为一个高斯分布的嵌入向量,将各层主题投影到一个嵌入空间,探索高斯嵌入向量之间的对称性和不对称性。
本文提出了一种新的基于知识的分层主题模型,其核心思想是将每个主题表示为高斯嵌入,然后将各层主题投影到共享嵌入空间中,便于向模型中注入结构化的先验知识。
Gaussian-distributed embedding + SawETM => Gaussian SawETM
Gaussian SawETM +prior belief 在相邻的层之间约束主题,鼓励其捕获满足预定义的hypernym relation,再使用auto-encoding variational inference,通过最小化ELBO和正则化项来实现端到端的训练。

简单的取两个高斯均值做内积的方法没有利用Gaussian-distributed embedding中的语义信息。所以采用期望似然核来作为相似度度量:

T隐藏层的decoder可以表示为:

采用了更加适合建模稀疏和非负文档表示的伽马分布潜变量。但,由于重参数化伽马分布的随机变量很困难,所以使用Weibull upward-downward variational encoder


最大化ELBO

描述如何将prior knowledge融合到Gaussian SawETM中


