toDF().as("a").join(df2,Seq("seq1"),"right")
.filter($"a.seq1".isNotNull)toDF().as("a").join(df2,Seq("seq1"),"right")
.filter($"seq1".isNotNull)
今天之前我认为这里不应该用别名,因为join进程已经结束,两个dataFrame的组合键已经对应完成,新df的schema只有一个seq1。
今天实验的时候发现别名会对结果产生影响,就像schema里有两个seq1,对不同的seq1筛选范围不一样