Apache Pig是MapReduce的一个抽象。它是一个工具/平台,用于分析较大的数据集,将它们表示为数据流。Pig通常与 hadoop 一起使用;我们可以使用Pig在Hadoop中执行所有的数据操作操作。