码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • 【论文阅读】NIPS21 TopicNet: Semantic Graph-Guided Topic Discovery


    文章目录

    • Background
      • Motivation
      • Idea
      • Challenges
      • Related Paper
    • Model
      • Gaussian SawETM
        • 对称相似度
        • 带有sawtooth factorization和Gaussian embedding的文档解码器
        • 文档编码器:Weibull upward and downward encoder network
        • Inference 和 Estimation
      • TopicNet: Semantic graph-guided topic discovery
        • TopicTree: Semantic graph constructed by prior knowledge
        • Partial order: Asymmetric entailment relationship
        • Objective: ELBO with a prior regularity

    在这里插入图片描述

    Background

    Motivation

    现有的deep hierarchical topic model没有将prior belief结合到topic hierarchical learning中

    • 许多的现有的hierarchical topic model都是纯数据驱动的,没有考虑prior domain knowledge,这会导致学习到的主题无法描述一个语义连贯的概念
    • 添加prior knowledge的不灵活性也在一定程度上限制了分层主题模型的适用性

    Idea

    将prior structural knowledge作为inductive bias注入到学习当中,提出的TopicNet将每个主题表示为一个高斯分布的嵌入向量,将各层主题投影到一个嵌入空间,探索高斯嵌入向量之间的对称性和不对称性。

    • 假设一个预定义的topic hierarchy形式的structured prior,其中每个主题都由一个语义概念描述,相邻层的概念遵循上一层的关系。
    • 层次结构可以通过通用知识图(如WordNet)或者用户自定义来轻松构建

    本文提出了一种新的基于知识的分层主题模型,其核心思想是将每个主题表示为高斯嵌入,然后将各层主题投影到共享嵌入空间中,便于向模型中注入结构化的先验知识。
    Gaussian-distributed embedding + SawETM => Gaussian SawETM
    Gaussian SawETM +prior belief 在相邻的层之间约束主题,鼓励其捕获满足预定义的hypernym relation,再使用auto-encoding variational inference,通过最小化ELBO和正则化项来实现端到端的训练。


    Challenges

    • 如何建模这种语义的层次(semantic hierarchy)
    • 如何将它与其主题模型联系起来

    Related Paper

    Model

    Gaussian SawETM

    在这里插入图片描述

    对称相似度

    简单的取两个高斯均值做内积的方法没有利用Gaussian-distributed embedding中的语义信息。所以采用期望似然核来作为相似度度量:
    在这里插入图片描述

    带有sawtooth factorization和Gaussian embedding的文档解码器

    T隐藏层的decoder可以表示为:
    在这里插入图片描述

    文档编码器:Weibull upward and downward encoder network

    采用了更加适合建模稀疏和非负文档表示的伽马分布潜变量。但,由于重参数化伽马分布的随机变量很困难,所以使用Weibull upward-downward variational encoder
    在这里插入图片描述
    在这里插入图片描述

    Inference 和 Estimation

    最大化ELBO
    在这里插入图片描述

    TopicNet: Semantic graph-guided topic discovery

    描述如何将prior knowledge融合到Gaussian SawETM中

    TopicTree: Semantic graph constructed by prior knowledge

    Partial order: Asymmetric entailment relationship

    Objective: ELBO with a prior regularity

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

  • 相关阅读:
    【永艺XY椅】试用体验
    【AWS】如何用SSH连接aws上的EC2实例(虚拟机)?
    2023江苏省领航杯(部分CRYPTO题目复现)
    Rt-Thread 移植2--线程定义与切换(KF32)
    vue-swiper组件化:解决异步请求数据时swiper过早初始化问题:
    制作本地kubernetes镜像仓库(使用reposync、createrepo、httpd)
    基于机器视觉的移动消防机器人(二)--详细设计
    osqp的原理ADMM(交替方向乘子法)理解
    小白备战大厂算法笔试(九)——九大排序算法
    【Java 进阶篇】HTML 图片标签详解
  • 原文地址:https://blog.csdn.net/weixin_41894030/article/details/125787013
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号