by shigemk2

当面は技術的なことしか書かない

Hadoop

Hadoop

Apache Hadoopは大規模データの分散処理を支えるJavaソフトウェアフレームワークであり、フリーソフトウェアとして配布されている。
Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。

Hadoop - Wikipedia

Hadoop分散ファイルシステム(HDFS:Hadoop Distributed File System)は
大きなファイル(理想的には64MBの倍数[4])を複数の計算機にまたがり格納することができる。