こんにちは!
タダケン(@tadaken3)です。
新宿のとあるIT企業でデータサイエンティストとして働いてます。1
データ分析を学びたい人、データ分析でビジネスを改善したい人へ、おすすめの本を紹介していきます。初心者データサイエンティストや、エンジニアさん、マーケターさん、独学でやってたけど基礎を学びたい人などもどうぞ!
ジャンル別に紹介しています!
- データ分析を始める前に読む本 / マインドセット
- SQL編 / データを自在に集計するために
- Python 入門編
- 統計学 入門編
- 統計学 手を動かして学ぶ
- データ分析の実務で役に立つ一冊
- 番外編
- まとめ
- 最後に少しお願いです。
データ分析を始める前に読む本 / マインドセット
会社を変える分析の力

- 作者:河本 薫
- 発売日: 2013/07/18
- メディア: 新書
大阪ガスのチーフデータサイエンティストの河本さんの書籍。「なんのためにデータ分析をするのか?」ということを気付かされてくれる一冊です。
ビジネスの現場において、
- ビジネスにプラスのインパクトを与えるか
- 正しい意思決定にどれだけ貢献できたか
がいかに重要かということを教えてくれます。難しい数値計算してもビジネスインパクトがゼロの分析だと意味がないですよね。
本物のデータ分析力が身に付く本
続けて大阪ガスの河本さんの本。こちらはワークショップ形式の本で、実際に手を動かしながら読み進めていく、いわば実践の書です。
この本では「課題設定の方法」と「データの前処理をきちんとする」ということに紙面の多く割かれています。
実際に分析に使うのはExcelだけなのですが、「課題設定」さえ正しくおこなって、「データの前処理」をきちんとおこなえば、精度の高い分析ができることを実感できると思います。
Google流資料作成術

- 作者:コール・ヌッスバウマー・ナフリック
- 発売日: 2017/02/16
- メディア: 単行本
最初に紹介した2冊が「課題設定」に関する本であるならば、「Google流資料作成術」はデータを使って「いかに人を動かすか」ということにフォーカスした本です。日本語の書籍名だと小手先の資料作成のテクニック本に感じられますが、全く違います。
原題は「Storytelling with data」となっており、
- データを使って人を動かすストーリーをつむぐ方法
- そのストーリーを最大限伝えるためのグラフ作成術
について書かれています。今回紹介した本のなかでどれか1冊を選ぶとしたら、間違いなくこの本です。
本ブログでも以前、書評を書いているので詳しく知りたい方はこちらもご覧になってくださいな。
ちなみにTHE GUILDのAndoさんにも、こちらの本を紹介したところ、以下のコメントいただきました。
こちらのレビューを書かれた @tadaken3 さんに教えていただきました。🙏
— Go Ando / THE GUILD (@goando) 2018年5月5日
『Google流資料作成術』はデータを使ってビジネスを改善したい人の必読書です https://t.co/VTHLHJUdQ2
SQL編 / データを自在に集計するために
10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く

10年戦えるデータ分析入門 SQLを武器にデータ活用時代を生き抜く (Informatics &IDEA)
- 作者:青木 峰郎
- 発売日: 2015/06/30
- メディア: 単行本
分析用のSQLを勉強するとしたらこの1冊がすごくオススメ。SQLの基本から始まり、具体的で実務レベルで使えるSQLの書き方を学ぶことができます。
データ分析といえばPythonやRじゃないの?と思われた方がいるかもしれません。ですが、企業が取り扱うデータはほとんどの場合、データベースに格納されています。データベースに入ったデータをいちいち開発エンジニアに頼んでいて、データを出してもらっていては、分析も一向に進みません。そのため、データ分析においては、SQLはほぼ必須といっても過言ではありません。
いまやメルカリやピクシブ、クックパッドなどのIT企業ではディレクター・プランナーやマーケターなどの非エンジニアの方が自分でSQLを書いてデータ分析をしています。
逆に言うと非エンジニア職でも、まずはSQLさえかければ、自在にデータを扱えます。大丈夫。この1冊を読めばあなたもSQLが書けるようになるはずです。
ビッグデータ分析・活用のためのSQLレシピ
こっちのSQL本はデータ分析でよく使うテクニックがまとめられています。中級者向け。「10年戦えるSQL本」を読んでから読むのがおすすめです。
この本の良いところは、Google Big Query・Redshift・HIVE・Spark・PostgreSQLなど、多様なデータベースに対応したSQLがまとめられているところです。コードの検証作業むちゃくちゃ大変だったんだろうなと思わせる一冊。
また、SQLだけでレコメンドエンジンを実装するところまで学べます(若干、やりすぎ感もありますが)。SQL上級者でも、きっと参考になるテクニックが見つかるとお思います。
Python 入門編
みんなのPython

- 作者:柴田 淳
- 発売日: 2016/12/22
- メディア: 単行本
みんなだいすきPythonさん!Pythonブームが来ているので、巷ではPython関連の入門書がたくさん出版されていますが、この本が一番わかりやすいし、内容も過不足ないと思います。
初版は2006年8月26日に発売されましたが、Pythonのバージョンアップに合わせて、現在は第4版までアップデートされています。歴史の波に揉まれて第4版となっていることもあり、内容はほんとに洗練されています。
Python初心者の方はまずこの1冊を読んで、手を動かしてみることをおすすめします。
Pythonによるデータ分析入門

Pythonによるデータ分析入門 第2版 ―NumPy、pandasを使ったデータ処理
- 作者:Wes McKinney
- 発売日: 2018/07/26
- メディア: 単行本(ソフトカバー)
Pythonで、データ分析をする際によく使うNumpyやPandasについて解説した本。ちょっと分厚い本なので、手元においておいて、リファレンス的に読むのがいいです。最近、第2版が発売されたばかりというのも熱いです。
統計学 入門編
「マンガでわかる統計学」シリーズです。
マンガでわかる統計学
マンガでわかる統計学 回帰分析編
マンガでわかる統計学 因子分析編
マンガだからといって侮ってはいけません。専門書だと読む気がなくすような内容も、イラストとストーリーのおかげで比較的楽に読み終えることが出来きるはずです。難しい専門書を読んで理解できずに挫折するぐらいなら、この本を繰り返し読んで、基礎を固めるほうがずっといいです。
3冊とも全部オススメなのですが、3冊のなかでどれか1冊だけ選ぶとすれば「回帰分析編」です。気になる方はまず、「回帰分析編」を読んでみてくださいな。
完全独習 統計学入門

- 作者:小島 寛之
- 発売日: 2006/09/28
- メディア: 単行本(ソフトカバー)
「これ以上何かを削ったら、統計学にならない」というコンセプトで書かれた本です。といいつつも平均や標準偏差からはじまり、カイ二乗分布、t分布といったところまで網羅されています。
この本を読めば「偏差値70」といわれて、その人がどれぐらいの位置にいるのか、具体的に理解できるようになると思います。
統計学 手を動かして学ぶ
心理統計学の基礎

- 作者:南風原 朝和
- 発売日: 2002/06/01
- メディア: 単行本
「統計学をきちんと使えることを目指して初歩から勉強する」場合のテキストとして、この本は「神レベル」だと思います。「統計学的なものの考え方」を身につけるための解説と「実際の分析の方法」を身につけるための解説が、いい感じにミックスされています。数式の解説もすごく丁寧です。
「マンガでわかる統計学」「完全独習 統計学入門」と比べて、少し難しいところもあるかと思いますが、じっくり読むことで、データ分析を進めていく上ので基礎を固めることができる1冊です。
Rによるやさしい統計学
「よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)」の内容を統計用のプログラミング言語Rで実践する本です。
「心理統計学の基礎」が統計の解説書だとすれば「Rによるやさしい統計学」はRの実践書になります。Rを使って統計を学びたい方は「Rによるやさしい統計学」を読みながら、手を動かしてみるとすごく力つきます。
データ分析の実務で役に立つ一冊
統計学が最強の学問である[ビジネス編]
![統計学が最強の学問である[ビジネス編]――データを利益に変える知恵とデザイン 統計学が最強の学問である[ビジネス編]――データを利益に変える知恵とデザイン](https://m.media-amazon.com/images/I/41l5Qf+FCgL._SL160_.jpg)
統計学が最強の学問である[ビジネス編]――データを利益に変える知恵とデザイン
- 作者:西内 啓
- 発売日: 2016/09/16
- メディア: 単行本(ソフトカバー)
ベストセラーとなった「統計学が最強の学問である」の続編です。
このブログを読んでいる方は「統計学が最強の学問である」を読んだことがあるかもしれませんね。この「ビジネス編」は「統計学が最強の学問である」の内容をビジネスの現場に落とし込んだ1冊です。
「経営戦略・人事・マーケティングなどでの領域でどうやって統計学を活かすのか」といったことに踏み込んで書かれています。また、「統計学が最強の学問である」は統計手法の中でも「回帰分析」に特化していおり、実践しやすいのも良いところです。
前処理大全
![前処理大全[データ分析のためのSQL/R/Python実践テクニック] 前処理大全[データ分析のためのSQL/R/Python実践テクニック]](https://m.media-amazon.com/images/I/61D0XQc0fwL._SL160_.jpg)
前処理大全[データ分析のためのSQL/R/Python実践テクニック]
- 作者:本橋 智光
- 発売日: 2018/04/13
- メディア: 大型本
データ分析において、前処理は全行程の8割を占めます。その前処理について書かれた本です。
精度の高い分析をするには、データの前処理を丁寧にやることが本当に重要です。
データ分析のさしすせそは
- さ:さっさと前処理しろ
- し:しっかり前処理しろ
- す:素早く前処理しろ
- せ:正確に前処理しろ
- そ:早急に前処理しろ
とも、いわれています。何度も言いますが、それぐらい前処理大事です。
GoogleのデータサイエンティストであるTJOさんもこのようにおっしゃています。
企業でデータ分析をやるっていうのは、例えば「統計学なり機械学習なり応用数理なりで価値を生み出す」フェーズに、それらで扱えるようなデータを泥臭い前処理山ほどやって持ち込めて初めて価値が生み出せるもの。そこが疎かならどんなに高度な手法を使っても価値なんぞこれっぽっちも生み出せない
— TJO (@TJO_datasci) 2015年1月17日
この本には、SQL・R・Pythonのそれぞれでデータの前処理をどのようにしたらいいのかまとまられています。読むためにはコードが理解できるぐらいの知識は必要ですが、手元においておくとすごく便利です。
仕事ではじめる機械学習
「機械学習をどうやってシステムに落とし込んで設計していくのか」をイメージできる良書です。
この本のいいところは、機械学習の本なのに「機械学習をせずに分析を進めることができない」かがきちんとかかれていることです。上司や取引先に「AIとか機械学習でなんか」と言われたときに読んでおくとすごく助かります。
正直、「機械学習はコストになりやすい技術」です。機械学習をシステム化を検討する場合、負債化させないためにどうしたらいいのかということまで書かれていてとても勉強になります。
番外編
改訂2版 データサイエンティスト養成読本
データサイエンティストの業務領域をさらっと理解するのに適した1冊です。モックなのでサラッと読めるのもよいところです。
数字のモノサシ
イラストレーターの寄藤文平さんが書いた絵本です。この本は統計学の本でもプログラミングの本でもありません。絵本です。
ですが、数量感覚を磨く上でこれ以上の本はないと思っています。例えば、1と100と10000の違いって体感的に把握できていますか?
ナンノコッチャと思いますが、数字に対して、苦手意識がある人はぜひ手にとって読んでみてください。あとイラストが箱庭感あってすごくかわいいです。
まとめ
データ分析に関するオススメの書籍18冊をまとめてみました。
今回、紹介した本を読んで手を動かして実践することで、データ分析のスキルを身につけることができると思います。
最後はとにかく実践です。
最後に少しお願いです。
ここまで読んでいただきありがとうございます。
最後にあなたに少しお願いがあります。この記事が少しでも役に立った、気付きがあったという方は、ぜひこの記事をTwitterにシェアしていただきたいです。
ぜひ、よろしくお願いいたします。 Twitterもやっています。 twitter.com
-
どんな仕事をしているかは、日経産業新聞のインタビュー記事をご覧ください。tadaken3.hatenablog.jp↩