2012-01-28 Hadoop Hadoop HadoopApache Hadoopは大規模データの分散処理を支えるJavaソフトウェアフレームワークであり、フリーソフトウェアとして配布されている。 Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。Hadoop - WikipediaHadoop分散ファイルシステム(HDFS:Hadoop Distributed File System)は 大きなファイル(理想的には64MBの倍数[4])を複数の計算機にまたがり格納することができる。