いっちょ前に統計っぽいお勉強をしてみました
最近、仕事で必要になるかもしれないということで、Excel を使った「回帰分析」に関する技術書を購入しました。
[amazonjs asin="4274222764" locale="JP" title="7日間集中講義! Excel 回帰分析入門: ツールで拡がるデータ解析&要因分析"]
「回帰分析」ってご存じですか?
理系の人には常識だと思いますが、回帰分析というのは「数値データと数値データの間に関連性があるかどうかを調べる統計的な手法」のことで、過去のデータにひそむ関係性や規則性を分析したり、未来の出来事を予測したりするのに使われます。
たとえばいい例かどうかわかりませんが、アイスクリーム屋さんが日々の最高気温(x)とアイスの販売個数(y)の数値を記録しておいて、そこから x と y の関係式を推定したりするのが回帰分析ですね。
私は統計の素人ではありますが一応理系なので、回帰分析の一種である「最小二乗法」については知っているつもりです。でも、ビジネスで使う「回帰分析」とはどういうものなことか、どんな考え方をすればいいのか、また Excel でどういう操作をすると回帰分析ができるのかを知りたくて、この本を買いました。
プリント・レプリカ方式の書籍が良い もっと増やしてほしい!
さて、この本を Amazon.co.jp で買うにあたって、2つ選択肢がありました。
Kindle版(電子書籍)を買うか、紙の書籍を買うか、です。
私は技術書のように、何度も行ったり戻ったりしながら読むような本は、紙の本がいいと思ってます。ただこのときは「今日・明日ですぐ読んで全体的な内容を頭に入れたい!」というふうに思っていたので、Kindle版を購入しました。
ところで Kindle の電子書籍では、雑誌やムック本、技術書など、図表が多かったりレイアウトが重要だったりする書籍の場合、基本的に紙用にレイアウトしたページをそのまま画像として保存したような内容の本になっています。
このため、小説や文庫・新書のような文字中心の電子書籍と比べて、次のような制約があるんですよ。
- Kindle アプリの、文字サイズを変更する機能が使えない。細かい文字を拡大したいときは、(携帯やタブレットの場合)ピンチアウト(指で画面をつまんで拡大)しないといけない。
- 本によっては解像度が悪く、文字をピンチアウトして拡大しても、にじんだ表示になってしまう。
- 気になった部分にラインを引く「ハイライト機能」が使えない
- 同様に、書籍の中にメモを残す機能も使えない
個人的には、ハイライト機能が使えないのが特に不満です。
私は電子書籍の中で重要だと思う場所や印象に残ったところを、どんどんハイライトを付けながら読んでいます。ハイライトした場所は、あとからリストとしてまとめて確認できるので、その本の要点を手早く確認したり、ブログに引用するためにコピー&ペーストするのに非常に便利です。
ところが画像化された電子書籍だとこれができない。とても残念!です。
ところが Amazon の「Excel回帰分析入門」の 商品ぺージを見ると、こんなことが書かれています。
※このKindle本はプリント・レプリカ形式で、Kindle Paperwhiteなどの電子書籍リーダーおよびKindle Cloud Readerではご利用いただけません。Fireなどの大きいディスプレイを備えたタブレット端末や、Kindle無料アプリ (Kindle for iOS、Kindle for Android、Kindle for PC、Kindle for Mac) でのみご利用可能です。また、文字列のハイライト、検索、辞書の参照、引用については、一部機能しない場合があります。文字だけを拡大することはできません。
そう、この書籍は図表の多いムック本でありながら、画像データではないんですよ。この手の Kindle 本を購入したのは、これが初めてです。
実際に本を読んでみると、まずハイライト機能が普通に使えました。いやあ、すばらしい! これだけでハイライトマニアの私は思わず踊っちゃうほどうれしいです(笑)
さらに見えにくいところを指でつまんで拡大しても、字がブルブルにじまない! 多分、文字は画像ではなく文字情報として認識されているので、拡大したらそれにあわせたサイズで文字を改めて表示し直しているんだと思われます。
それに付随してか、ファイルサイズも全ページ画像になっている同じくらいのページ数の電子書籍と比べ、少し軽めに抑えられています(雑誌ダヴィンチ2月号が 231ページで 176MBなのに対し、この本は290ページで32MB。書籍の内容や用途が違うので一概には比較できませんが・・・)
要するに、pdfと似たようなデータ形式を採用しているんでしょうね。凝ったレイアウトではあるが文字情報が重要だという書籍に、適していると思います。
単純に画像化するのに比べると電子書籍の制作は大変になりそうですが、ぜひこのようなプリント・レプリカ形式の電子書籍を今後もどんどん増やしていってほしいと思います。
ビジネス指向の割り切った説明が◎ 数学・Excelが苦手という人にも
長々と本の体裁のことを書いちゃいましたが、肝心の内容についても少しだけ触れておきます(少しだけか!)
この本のいいところは「ビジネスへの応用を強く意識した内容になっていること」だと思います。
いまやビジネスのあらゆる場面にデータの分析・解釈が求められる時代。統計の知識は、統計学やAIの専門家だけのためのものではありません。
一般の営業や総務、購買などの人が、手元のデータを少し調べてみようとか、誰かの分析結果の要点がつかめる程度にはなっておこう、という場面を考えると、数学的な基礎を理解してから応用しようということでは日が暮れてしまいます。
なのでこの本では、回帰分析とは何か、データとは何かという基礎的な考え方からはじまって、基本的に数学や Excel の知識がほとんど無くても大丈夫なように丁寧に解説がされていきます。たとえば数学面では「絶対値とは・・・」なんていう超基本なところまでコメントしつつ説明されていますし、Excelの操作手順も省略せずに細かく書かれています。
ここまでやさしく詳しくステップ・バイ・ステップで書かれている類書は、あまり無いような気がします。
示されているサンプルデータも、さきほどの「最高気温とアイスの売り上げ」だとか、「ある日の天候と顧客の属性に対して、その顧客が来店したかどうか」など、きわめて具体的でわかりやすい例が並んでいて、ビジネスへの応用がイメージしやすくなっています。
専門家ではないが、身近なデータ間の相関関係を分析にしてみたい、という人にはとても良い本になっていると思います。
ちなみに、説明の厳密性や網羅性を思い切って犠牲にしているわりには、けっこう高度な内容もぽつぽつ含まれます。
たとえば「無相関の検定」の部分なんかは、さらりと書いてあるためわかりにくく、個人的にモヤモヤが残りました(肝ではないので飛ばして読んでも差し支えないです)。確率分布や検定の話をちゃんと理解したい場合は、別の本やWebをあわせて読む必要があります。
ちなみに私が学生時代に、統計学の授業のために買った教科書はコレでした。読むのに時間はかかるけれど、統計学の思想から手法まで、ごまかしなく丁寧に書かれてるので私は好きです。ただ、味気のないオールドスタイルな大学の教科書なので、今の人には受けないかも??
[amazonjs asin="4130420658" locale="JP" title="統計学入門 (基礎統計学Ⅰ)"]