こんにちは。開発担当の金内です。
このところ「データ」な話題が盛り上がってますね。ビッグデータ、オープンデータ、データサイエンティストなどなど。私が日ごろ扱うデータはあまりビッグでもオープンでもなかったりするわけですが、Excel などの表計算ソフトで集計をしたり、傾向を見るために分析することはあります。
今日はそういうデータ集計や分析に役立つ機能「ピボットテーブル」の使い方をご紹介します。ピボットテーブルは、表計算ソフトに備わっている中でも最強の機能のひとつだと思うのですが、知らない方も多いのではないでしょうか。コツさえつかめば簡単に使えるので、ぜひマスターしてササッと仕事を終わらせてください。
説明の画面には Mac 版の Excel を使いますが、LibreOffice / OpenOffice Calc でも(もちろん Windows 版 Excel でも)だいたい同じ方法で使えます。
こんな時どうする?
次のような 2000 件ほどの名簿データがあるとしましょう(データは架空のものです)。ここから、たとえば「都道府県」が新潟県の人の数を出すにはどうしたらよいでしょうか?
ひとつ思いつくのは COUNTIF 関数を使って「新潟県」の数を出す方法です。1 つの都道府県についてなら十分な方法です。
では、全データから、都道府県別に男女の数を出すとしたら、どうするのがよいでしょうか。 関数だけではかなり面倒そうですね。面倒すぎて、画面を指さしながら「いち、にぃ、さん…」と数えてしまいそうです。
ピボットテーブル登場
さすがに指で数えるのは辛いので、ピボットテーブルに活躍してもらいましょう。まず、データの中のセルを選択した状態で「データ」メニューから「ピボットテーブル」を選びます。
次のようなダイアログが表示されるのでここはデフォルトのまま「OK」を押します。
新しいシートができて、空の表と「ピボットテーブルビルダー」が表示されます。ここで、どのように集計してほしいかを指定します。欲しいのは都道府県別の男女数ですから、縦に都道府県一覧が、横に性別が並ぶようにしましょう。ピボットテーブルビルダー内で以下の操作をしてください。
- フィールド名にある「都道府県」を、行ラベルの欄にドラッグ&ドロップ
- フィールド名にある「性別」を、列ラベルの欄にドラッグ&ドロップ
- フィールド名にある「氏名」を、値欄にドラッグ&ドロップ
さっきまで空だった左側の表が、あっと言う間に都道府県別の男女数の表になりましたね。もちろん、元のデータが更新されればこの表にも反映されます(場合によっては明示的に再計算を指定する必要があります)。
このテーブルをグラフにすれば、まぁキレイ。これで明日のプレゼンはばっちりです。
集計方法はいろいろ
先ほどの例では、表の中身にはデータの個数を表示していました。ピボットテーブルでは、個数の他にもさまざまな集計方法を選べます。
別の例として各都道府県の男女別平均年齢を出してみましょう。ピボットテーブルビルダーで次のように操作してください。
- 値欄にある「氏名」を、フィールド名欄にドラッグ&ドロップ
- フィールド名欄にある「年齢」を、値欄にドラッグ&ドロップ
- 「年齢」の右の”i”ボタンをクリックして「ピボットテーブルフィールド」ダイアログを表示する
- ダイアログ内の集計方法で「平均」を選択して「OK」ボタンを押す
できましたね。セルの書式を指定して都合のよい桁数で収まるように変更してください。これで来週のプレゼンもばっちりです。
もっと複雑な集計・分析にも
今回は縦軸、横軸にそれぞれ1つずつの項目を指定しましたが、複数の項目を指定して階層的に集計することもできます。たとえばさきほどのデータに「20代」「30代」などの列を加えておいて、その世代によってさらに分類するなど、自由自在です。
いかがでしょう。ピボットテーブルの威力を感じていただけたでしょうか。何より素晴らしいのは、目的に応じて集計方法をどんどん変えられることです。そうした試行錯誤があってこそ、データの海に隠れている事実が見えてくるというものですよね。
データの集計はまさにコンピュータの得意とするところなので、コンピュータに任せてしまいましょう。
フェンリルのオフィシャル Twitter アカウントでは、フェンリルプロダクトの最新情報などをつぶやいています。よろしければフォローしてください!