レポート

データは未来に何を伝えるのか?
日本放送協会 報道局遊軍プロジェクト ディレクター 阿部 博史氏
東京大学大学院情報学環総合防災情報研究センター 客員准教授

印刷用

 NHK報道局の遊軍プロジェクトでは、震災ビッグデータや医療データ、災害、婚活ビッグデータ、MARS等感染症の広がり等も取り上げている。データを使った報道事例をもとに、データの可能性等についてご紹介したい。

データって何?情報って何?

 データと一口に言っても、数値になっているものから人の見た目から判断するようなものまである。私が制作した12月4日のNHKスペシャル「NHKスペシャル戦艦武蔵の最期」では、100時間分の動画をパラパラ漫画のように画像に分解して再構成することで、どこに機銃がありどこに被弾したかなどが明らかになった。ただ動画を見ていても、深海に沈むパーツがどの部分なのか、実際はどういう形だったのかを知ることはできないが、空間情報も含めデータとして再構築することで全体像から沈没の原因まで検証することができた。

個の情報→全貌把握

 個に迫るだけでは社会課題の解決にはならない。一人に100時間聞いても全貌は把握できない。私はNHKのディレクターとして、個々の現象をビジネスではなく社会課題につなげていくために技術を活用している。例えば、NHKニュースでハロウィーンの様子を放映したが、大勢の人が繰り出している様子(全貌把握)と個人個人が楽しんでいる姿を両方映し出すことで、ムーブメントになっていることを伝えることができる。
 社会課題について一番初めに取り組んだのが、2011年の東日本大震災。一人一人の話をドキュメンタリーとして伝えることはしてきたが、それだけでは全貌把握はできない。このため、「震災ビッグデータ-命の記録を未来に」という番組を立ち上げた。この中で、未曽有の震災から私たちは何を学び、次の命を救うために何を伝えなければならないかを議論したいと考え、スマホによる人の行動記録やカーナビやタクシー、トラック等の走行記録、購買記録(POSデータ)、支援物資、自衛隊の出動記録(延べ1058万人の出動記録)、SNS(1億7900万ツイート)、報道記録(NHKは何を伝えているのか)、放射性物質拡散情報、企業情報(取引記録等)等を集めて調査を行った。
 スマホの位置情報は個人に紐づいているように感じられるかもしれないが、250mメッシュで何人いるかという情報を表示させている。このデータはNHKが独自で収集しているものではなく、ゼンリンデータコムが毎日Webで公開しているデータから作成している。

 活用の仕方としては、これらの位置情報をもとに、NHKでは津波が迫っているときに、人が多い地域を優先的に呼びかけていく必要がある。また、タクシーの稼働状況や渋滞情報を組み合わせることで、避難状況の全体把握もできる。さらに、震災当時は帰宅困難者がどの程度いたのか把握することはできなかったが、現在はリアルタイムで把握することができる。人によって見方は異なると思うが、こういった活用では個人を見ているわけではなく、あくまでも全貌把握のために活用している事例となる。
 タクシー1万台のデータからは、都心付近を回遊していたタクシーが、震災後は都心から外に向かって一斉に移動していく姿を把握することができる。タクシーのデータは誤差が大きいものであるが、それでもどのような現象が起きていたのか大きな動きを見て取ることができ、さらにそこから見る人によって避難状況の確認や、救助に向かうルート選択へと活用することができる。
また、全国には約6000万の建物があるが、それと国勢調査のデータを用いることでどの建物に高齢者がいるかを推定するという研究では、統計データから個にまで落としていく手法がとられている。これは、高齢者救助の助けとなる。

津波からの避難行動の実際

 収集したデータをISO解析(In-Stay-Out analysis)すると、震災時の実際の避難行動(避難する人、沿岸に向かう人、とどまる人)の状況が把握できた。
 東日本浸水域全域で「津波発生」の警告後、避難した人(Out 34%)よりも避難地域に向かった人(In 41%)が多かった結果は関係者に大きな衝撃を与えた。特に、宮城県名取市は58%と高く、これは勤務先である仙台から近く、車で自宅の家族を迎えに行った人が多いためと考えられる。また、岩手県陸前高田市では避難しても結局は津波の範囲内だったこともあり留まった人(Stay 78%)であった。一方、気仙沼では津波に対する警戒教育も行き届いており、Out48%、Stay23%、In29%と避難した人が多かったが、ここで発生したのは大渋滞であった。また、いつ避難したかについてもデータと避難した人へのアンケートは異なっており、データによる事実を次につなげていく必要を強く感じる。

ビッグデータの膨大さと粒度によって到達できる真実がある。

 人は、ただ満開の桜を見て「きれい」と思うだけでなく、桜の木の下に落ちた1枚1枚の花びらの美しさも知った上で全体の美しさに感動する。個別のデータをわかっていないと全体もわからない。
通常テレビでは見せるためのCGを作っておしまいになるが、私はその場限りのものではなく、様々な角度からデータを検討できるツールを制作している。例えば、POSの購買データ400万項目をまとめてグラフ化することで、インスタント袋麺は震災を契機に400%を超えた、水は売り上げが極端に上がっているがその周辺の中国茶等の飲料も高い値となっており震災直後では水が枯渇したのではなく飲料が枯渇したこと等がわかる。さらに水に関しては3月23日以降にもう一度、震災直後より長い山がくるが、これは水道水から放射性物質が出たので赤ちゃんに飲ませないでくださいという報道があったタイミングである。報道内容は1日で取り消されたが、その後も高い数値が続いた。3月14日以降にはスマホ充電器や、食品の贈答品が備蓄用として1300%購入されたりシリアル類の売り上げが急激に伸びた。これらの現象は、防災関係者にとっても想定外で新鮮な気づきであった。これらは全国から集めた店舗ごとのPOSデータと実際の震度計の動きを重ね合わせたことで得られた知見であり、ブレイクスルーした情報になる好例ではないだろうか。
 様々な情報を幾重にも重ね合わせることで有益な情報が提供できるが、個人情報等、その前段階の個々の情報について「使えるのか?使えないのか?」という議論に終始してしまうと、なかなかこういう領域にはたどり着けないと感じる。

情報ミルフィーユ

 私は、番組を作る際に「情報ミルフィーユ」という考え方を取っている。情報を重ね合わせることで初めておいしいケーキになるということである。
 阪神淡路大震災の際にNHKで使用した地図では、写真、航空地図、建物分布、等に死亡記録、火災データ、映像記録等を重ね合わせることで実際の状況が見えてくる。
 通電と出火地点のデータを重ね合わせることで、地震後に通電することで火災が発生していることが見て取れる。このデータはどちらも同じ研究者から提供されたものだが、重ね合わせたことで、初めて専門家が関連に気付いた。個々の情報を正しく集計して正しく描画をすると、初めて情報が引き出されてくる。
 個人の情報を使わなければ何のリスクも負わないが、命を救う可能性をもつぶしてしまう。きちんと活用事例を具現化して、それをもとに議論と解決策の検討を行っていく必要があると感じている。

 

本内容は、2016年12月6日に開催されたJIPDECシンポジウム「第4次産業革命と情報連携-これからの情報活用とプライバシーを考える-」での講演内容を取りまとめたものです。