本記事では,CSVの代替として有望かつビッグデータ分析にも適しているParquetを紹介します. さて,データフレーム(Data Frames)は,データ分析において最も基本的なデータ構造の1つです.Rのtibble・dplyrやPythonのpandasなどのデータフレーム操作のためのパッケージを使えば,これまでExcelなどの表計算ソフトで行っていたデータ分析をさらに効率的に行うことができます. このようにデータ分析ツールが充実している一方で,データの保存にはExcelなどとの互換性が高いCSVが未だに広く使われています.しかし,CSVは,必ずしもデータ分析に適したファイル形式とは言えません.そこで,CSVの代替として使われることが多くなっているParquetをCSVと比較してみましょう. サンプルデータの準備 CSVとParquetを比較するため,まずは,データ分析にありがちなサンプ