半监督节点分类
目录
前言
Label Propagation (Relational Classification)
这是一种集体分类方法。
Iterative Classification
这是一种集体分类方法。
既要用到节点的连接信息,也要用到节点本身的属性信息(特征),分别训练两个分类器解决。
我是什么类别仅取决于与我直接相连的节点是什么类别,而间接的邻居与我无关。(马尔可夫假设)
初始化所有节点类别(训练∂1) –> 捕捉相关关系和连接关系(训练∂2) –> 迭代去预测(传播)
Correct & Smooth
OGB数据集:https://ogb.stanford.edu
这是一种后处理的方法,修正结果变得更好。
这里使用的soft_labels就是每个类别都有一个概率,概率之和是1。
L = D - A
ā的值是超参数,越大表示更愿意相信传播过来的ERROR,越小表示更愿意相信上一时刻的ERROR。
结果求和不为一,但置信度仍较高。
Loopy Belief Propagation
这是一种消息传递方法。
动态规划算法,下一时刻的状态仅取决于上一时刻。
Masked Label Prediction
这是一种自监督方法。
已有的信息随机的抹除,然后用剩下的已有信息去预测,自监督地学习。
总结
都是用来解决半监督节点分类问题的。
直推式(也称为演绎推理)是从特定的前提或事实中推导出具体的结论,而归纳式(也称为归纳推理)则是从一般的观察或模式中推断出普遍的结论。可以这么说,直推是由特殊到一般,而归纳是由一般到特殊。
归纳式在有新的节点出现时可以很好的使用原模型,不用重新训练,而直推式需要重新训练。