背景:
辅导的过程中遇到了一个比较新颖的问题,下面是我对这个问题的分析和简要思路介绍。
思路分析:
这算机器学习下面的无监督学习,标签传播算法简称LPA,传统的标签传播算法会出现非对齐问题,一句话描述就是预测的结果对比真实数据来说,不够精准。
我做的研究就是添加了成对约束条件(来源于真实的空手道数据集),在传统LPA算法过程中添加了必连和非必连条件,去在迭代的过程中一定程度上控制结果,一定程度上解决了非对齐问题,提高了精准性。
过程:
原始空手道数据图:
传统LPA结果图分析:
添加成对约束后的LPA结果图分析:
结论:
添加成对约束后,由于我算法设置的是成对约束条件随机来源于真实的空手道数据集,所以有时候添加成对约束的LPA在空手道数据集表现上优于传统的LPA算法,但有时候又不行,有一定的随机性。目前我的测试结果是4次有3次表现优于传统的LPA,平面结果图上的社区分布也和原始空手道数据的社区分布更为贴近。
说明添加了成对约束条件后,还是有用的,即预测结果相较于原始的LPA算法处理空手道数据集会更好,在一定程度上能解决非对齐问题。
源码、演示视频、指导手册获取
我在解决中主要是查看知网的文献、看国外的对应网站以及学习机器学习。