仕事・ビジネス 最近読んだ本

【Book】『ビッグデータの衝撃』・・・はやりの言葉、「ビッグデータ」って何?

ここ2年くらいの間に、IT関連のビジネスの世界で話題になっている言葉に 「ビッグデータ」というものがあります。

私はネットのニュースや新聞でもしばしばこの言葉を見てはいたんですが、いったい何を意味しているのかが、いまいちよくわかりませんでした。

そりゃもちろん、「大量のデータをあらわす言葉なんだろうな」ということくらいは私にだって想像がつきます(笑)

でも、このインターネット全盛の時代、世の中で扱われるデータ量が年々「ビッグ」になってきているのは当然ですよね。

だから、それに対してことさら言葉をつける必要も無いんじゃないか、と思っていたわけです。

それで、「ビッグデータ」の意味と今後の展開に関して、一度ちゃんとした解説を読んでみようと思って、この本を手に取りました。

 

『ビッグデータの衝撃』
著者: 城田真琴
出版: 東洋経済新報社

 

ちょっと大きい本屋に寄ってみたんですが、「ビッグデータ」に関する解説書が5~6冊平積みになっているのには驚きました。そんなにはやっているのか、と。

どれを読もうか迷いましたが、厳正なる立ち読み審査の結果、この本がいちばん冷静に現状を説明してくれているように見受けられました(実際最後まで読んでみての感想も同じです)

著者の城田氏は野村総研のIT業界アナリストで、今やすっかり一般的になったクラウドコンピューティングを紹介した前著『クラウドの衝撃』(私は未読)でも高い評価を受けた方です。

以下、さわりの部分を紹介しましょう(ご存じの方は、退屈だと思うので読まないでください^^)

著者の城田氏によると、ビッグデータというのは狭い意味でいうと「既存の一般的な技術では管理するのが困難な大量のデータ群」のことを意味します。

最近までは、大量のデータの管理・分析というのは、技術的に難しいものでした。

その理由は、ビッグデータが持つ3つの性質によります。つまり、「Volume(量)」「Vriety(多様性)」「Velocity(発生頻度、更新頻度)」という「3V」です。

「Volume」「Velocity」は、要するにデジタルデータの発生量が莫大で処理が追いつかないという意味でわかりやすいのですが、「Variety(多様性)」の意味については少し補足が必要かもしれません。

今では、インターネット誕生当初には存在しなかった、またはさほど普及していなかった、多様な情報が発生しています。

検索エンジンの検索キーワードや閲覧ページ情報、ブログ、TwitterやFacebookなどの「ソーシャルメディア」における発信情報、オンライン決済情報、スマートホンのアプリ使用履歴など、人のあらゆるネット上のアクションに付随してデータが発生しています(ふだん「自分はデータを生み出している」と意識していなくても)。

さらに人の行動に伴う情報だけでなく、スマホやカーナビが発信するGPS位置情報、家電製品や建物などに設置されたセンサー類や監視カメラが記録するデータなど、モノが自動的に記録・発生する情報も存在します。

このように、発生するデータの内容は、ホームページの情報やオンライン決済のデータだけではなく、非常に幅が広いのです。これが「Variety」の意味です。

さて、日々発生する大量のデータの中には、一見すると大部分が役にたたない情報のように思えまるものも多いです。そういったデータは、ビッグデータを扱う技術が未成熟だった時代には、発生するそばから捨てられていました。

しかし、数年前に登場したHadoop、Nosql という技術が、この状況に変革をもたらしました。

これらはいずれもフリーで提供されているソフトウェアで、それまではスーパーコンピュータでないと(またはスパコンですら)困難であった、大量のデータの保存・管理・更新・分析を、比較的安価なマシン上で高速行うことができます。昨今の「ビッグデータ・ブーム」の直接のきっかけは、このHadoopなどのフリーのソフトウェアの誕生による部分が大きいとされます。

こうした技術によって大量なデータの扱いが可能になってくると、単体ではさほど価値を生まないデータであっても、大量に集めて適切な切り口で分析・加工することで、ものすごく大きい価値を生み出す可能性が開かれてくるのです。

たとえば、本書の中ではこんな面白い事例が紹介されています。

(いま手元に本が無いので、今週中に例を追記予定)

というわけで、ビッグデータがいまなぜ話題かというと、大量のデータを整理・分析する技術が最近になって確立してきた結果、それらのデータから今までにない付加価値を生み出すことが可能になったからです。

ビッグデータの活用において重要なのは、大量のデータを扱う技術そのものというより、、そこからいかにビジネスなどの問題解決に役立つ知識を抽出するかというアイデアです。

そのため、狭い意味のIT技術ではなくて統計分析・データ解釈について熟知し、なおかつビジネスセンスも兼ね備えた専門家 = データ・サイエンティスト が、いま世界各地で引っ張りだこなのだそうです。

私の聞きかじりの解説はこのへんにしておきましょうか。

この本は、現時点でのビッグデータ・ビジネスに関連するあらゆる論点をカバーしていて、素人にも全体像をわかりやすく示してくれていると思います。

また、いい面だけを挙げてブームをあおったりはせず、個人情報保護などの注意すべき点についてもきちんと目配りしており、丁寧かつ客観的な記述がされています。

ビッグデータのいまを知りたい方にお勧めします。あと2、3年もすると書いてある情報が古びちゃうだろうから、もし読むならお早めに^^

 

PR

-仕事・ビジネス, 最近読んだ本