同问题在stackoverflow,spark社区上也问了,暂无回答,并行着放到知乎上了。
近日在玩弄Spark,我需要抓取Eclipse Scala IDE中Console的输出Log,然后做一些挖掘工作。后来因为某些原因,需要从控制台提交并直接抓取数据。在Linux和Win下各有一个完全等价的集群。
Linux下通过Spark-Shell提交了一个Jar包,输出到控制台的Log跟Eclipse Console中打出来的是一样的。但相同背景下,从Win集群的Master结点上用cmd通过Spark-shell提交的同一个Jar包打出来的Log却不同(少了很多行),这是为什么?
即:Eclipse打出来的Log跟Linux控制台一模一样,但却跟cmd下的输出不同。
例如:
Eclipse Console‘s Log = Linux's Log, Sample Log such as:
XXXXXXXXXX
AAAAAAAAAA
XXXXXXXXXX
BBBBBBBBBB
XXXXXXXXXX