2015年08月19日

ビッグデータ


海部美知『ビッグデータの覇者たち』を読む。

ダウンロード (24).jpg


著者は,シリコンバレーに10年以上住んでいるが,エンジニアではない。むしろ,

「技術の話になると,実はエンジニアの話についていくだけで必死」

なのだという。その著者が,

「ビックデータという現象が,企業経営や消費者の日常生活にどのような影響を与えるのかという点から非常に興味を持っており,この本もその観点から書き進めていきたい」

と「はじめに」で述べる。ある意味在米体験を通して,利用者の目線で追っている,と言っていい。

で,著者は,ビックデータを,大まかに,

「人間の頭脳で扱える範囲を超えた膨大なデータを,処理・分析して活用する仕組み」
「『予測』『絞り込み』『見える化』がピッデータの得意技…集計や分析をくわえて何らかの意味を引き出す」

と説明する。いまのところ,「膨大なデータ」とは,

「数十テラバイト(テラ=2の40乗倍)からペタバイト(ペタ=2の50乗倍)といった単位のデータ量」

を想定するらしい。これは時々刻々膨れ上がっていくに違いない。われわれは,天気予報,グーグル,クレジットカードの不正防止,アマゾン等々で日々その恩恵を受けている。

そして,データは(ビックデータ業界では),

新しい石油,

に喩えられる。つまり,

「次世代の産業のコメになるかもしれない」

というわけである。2011年と,少し前だが,マッキンゼーのレポートでは,世界の地域ごとのデータ蓄積量が比較されている。それによると,

「2011年の推計新規データ蓄積量(累積ではなく,1年間に新たに蓄積される量)はアメリカが3500ペタバイト,ヨーロッパが,2000ペタバイト」

と,他の地域を圧倒している。日本は,世界で3番目ながら,400ペタバイトと,250ペタバイトの中国より少し大きい程度。著者は言う。

「ネットの自由度が低い中国と比べてもこの程度しか多くないのかと少々驚きました。」

考えてみれば,もちろん無機的データもさることながら,ツイッターのつぶやきやフェイスブックへの投稿有機的データでも,欧米に圧倒されているのである。これが,

「原料となる資源」

次世代産業のコメということを考えると,情報に対する,日本の為政者,企業経営者の感度の鈍さは,致命的ではないのだろうか(平気で公文書を廃棄し,改竄し,隠蔽する人々だからなぁ)。

「有機的データを使ったビックデータの手法は,…『従来の何かの代替』ではなく,『ネットでしかできないこと』をユーザーに提供する,新しいネット産業のサービスの屋台骨であり,激烈な競争を勝ち抜くための大きな差別化要因となっています。」

しかし,有機的データには,「プライバシー侵害」という陥穽がある。しかしネット企業は,敢えて火中の栗を拾おうとする。なぜか。著者は,その理由を,

「究極的には,『ビッグテータの活用がユーザーのためになる』,さらにそれゆえに『コストを下げ,利益を上げることができる』からです。」

と説明する。さらに,

「シリコンバレーの人々は,『世界を良くする』としいうスローガンをさらりと口にしますが,ビッグデータの分野でも,これをどう役立てるかという『志』は常に底流として持っています。」

という。目的意識と言い換えてもいい。それに比べて,日本の企業には『グローバル化』というお題目はあっても,

「根底に多くの人が共感するような志を持っていなければ,各国のユーザーや業界コミュニティに賛同してもらえません。」

と,日本の企業の志の無さに,巻末で危惧を述べている。そう言えば,たとえば,かつてソニーが会社設立趣意書で,

一、真面目なる技術者の技能を、最高度に発揮せしむべき自由闊達にして愉快なる理想工場の建設
一、日本再建、文化向上に対する技術面、生産面よりの活発なる活動
一、戦時中、各方面に非常に進歩したる技術の国民生活内への即事応用
一、諸大学、研究所等の研究成果のうち、最も国民生活に応用価値を有する優秀なるものの迅速なる製品、商品化

と述べていたように,かつて製造業にはあった気がする。

閑話休題。

グーグル,アマゾン,フェイスブックといったウエブ企業を中心に,ビックデータの活用例を紹介しているが,いずれも,

「ビックデータ技術の力を自前でもっていなければ,ネットの世界ではもはや大きく成功はできないといってしまってもいいのかもしれません。」

というが,その展開は,ヒッグス粒子の発見といった科学の分野でもビックデータの活用は不可欠で,たとえば,

http://ppnetwork.seesaa.net/article/421758173.html

で取り上げた,東京大学宇宙線研究所の低バックグラウンド多目的宇宙素粒子検出器XMASS(Xenon detector for weakly interacting MASSive particles)実験のプロジェクトが,

「闇黒物質に蹴飛ばされたキセノンの原子核は,周囲のキセノンを電離させるなどの影響を与えながらエネルギーを放出して,最終的に止まります。蹴飛ばされたキセノンからエネルギーを得た,周りのキセノンは,紫外線を出して蛍光が発生します。その光が,642本の光電子増倍管が捕まえる信号」を,「長い時間をかけてデータを蓄積し,それを精密に解析することによって,初めて『発見』となるのです。」

と言っていたのも,また同じ例であるようだ。

ビックデータというのは,どこかにあるのではなく,日々の投稿,ツイッターをはじめとした個々のデータそのものが,資源になっていく。たとえば,2013年,アメリカ議会図書館で,ツイッター上の公開ツイートがアーカイブ化され,すべて閲覧できるようになった,という。

「06年の創業以来,これまでのツイートというと,その数1700億本,データ量にして133テラバイトだそうです。」

あほらしいようなツィートも,罵詈雑言も,すべて議会図書館に収蔵されたのである。この姿勢が,そもそも違う。これからは,こういう有機的データをどう使うかの時代になっている。著者は言う。

「もしかとたらビッグデータの技術は,今のグーグル検索やアメリカ議会図書館のツイッター・アーカイブのような形で,社会科学的な『知のプラットフォーム』を作る,という役割までで止まるかもしれません。(中略)それでも先進国で『モノを作る過程でマージンを生みだす』という富の創出の仕組みが終わった現在,『サービス業で富を生みだす』『社会的な難問を解決する』という次の反映を切り開くには,ビッグデータ技術などを使って,『知識を集めて増幅させる』という仕組み以外に,有効なやり方を私は知りません。」

人文科学系を潰そうとし,平気で文書を廃棄するわが国は,ひょっとすると戦後レジームの前へと先祖返りしようとしている分,既に世界の最先端から,遠く置いてきぼりを食っているような,気がしてならない。ツイッターをアーカイブにする,それが次世代の産業のコメという発想は,今の経団連のトップ経営者はおろか,わが国の為政者のどこにも無いに違いないのだから。

参考文献;
海部美知『ビッグデータの覇者たち』 (講談社現代新書)







今日のアイデア;
http://www.d1.dion.ne.jp/~ppnet/idea00.htm
posted by Toshi at 05:28
"ビッグデータ"へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: