デジタル空間の膨大なデータから、世界の今と未来を可視化する


インターネットに繋がった個人やセンサーから発信される情報はデジタル空間にあふれており、その時々の世界について様々なことを教えてくれます。それらは現実社会を映し出す鏡のようなものであり、その膨大なデジタルデータには、社会の出来事を分析・可視化したり、未来を予測したりを可能にする手がかりが含まれています。そうした考えに基づいて、デジタル空間に日々蓄えられるデータを活用する方法を研究しているのが、東京大学 生産技術研究所の豊田 正史 教授です。教授はこれまで、SNS上のデータなどから、新型コロナウィルスの陽性者数や各種イベントの来場者数などを推定したり、データ分析の結果を可視化したりする方法を提案してきました。そのような推定はいかにして可能になるのか。各種データを可視化することはどのように社会に活かせるのか。豊田教授に聞きました。


人々のつぶやきからコロナ禍の実情を可視化する

図1 Xのポストから推定した新型コロナウィルスの新規陽性者数と、医療機関での定点把握による実測値との比較。2023年5月は、新型コロナウィルス感染症の分類が「5類」に移行した時期(5月8日に移行)。それを境に陽性者の全数把握が終了し、一部医療機関での定点把握による集計が週1回のみ行われるようになった。検査(PCR、抗原検査、キットを用いた自己検査を含む)で陽性になったことを報告するポストを、簡易な言語パターンを用いて抽出し、新規陽性者数にフィッティング(=数字の規模を合わせること)している。
提供:豊田 正史 研究室

図1の折れ線グラフは、X(前Twitter)の日本語ポスト(=投稿)から推定した新型コロナウイルス感染症の新規陽性者数です(期間は2023年5月から2024年1月)。棒グラフは、同期間の指定医療機関での定点把握の実測値で、全陽性者数(橙色)、20歳未満陽性者数(青色)ともに、両者の数値がよく一致していることが確認できます。推定を行った豊田教授は話します。

「すべての日本語ポストから、検査で陽性になったことを報告するポストを抽出し、統計的に処理することでこのような推定結果が得られました。ポストの抽出は、特定のパターンの表現を探し出すいわゆるパターンマッチングで行っていますが、その際、単に『陽性』などのキーワードで検索するのではなく、『検査して陽性になった』ことを示す様々な言語表現のパターンを見出すことが重要になります」

豊田教授は、インフルエンザや溶連菌といった感染症でも同様な分析を試みています。指定医療機関での定点把握の場合、集計に時間がかかるため、調査から公表までに一週間以上の遅延が生じます。一方、ポストの分析による推定は、毎日出すことも可能であり、迅速に陽性者数の傾向を知るためには有用だと考えられます。

新規陽性者数の推定の他にも豊田教授は、コロナ禍の様々な状況の分析を行ってきました。感染拡大下で人々がどんな行動を取る傾向があったかをXのポストから可視化したり(新規陽性者数の増加・減少に応じて飲み会などのリスク行動が減少・増加するなど)、携帯電話の位置情報と新規陽性者数のデータから、感染リスクが高い場所がどう変化したかを推定したり(世田谷区民の場合、第3波から第5波にかけて、高リスク地が都心の主要繁華街から区内に移動)、さらには、”親ワクチン“の人と”反ワクチン“の人が、SNS上のどのような投稿にシンパシーを抱き、また、どのように考えが変化していったか(医療従事者による投稿が影響力を持った)、といった分析も行っています。

イベントの集客力を予測し、それを見越したサービスを提案

感染症に関連した上記のような推定は、日々膨大に生み出される個人のつぶやきなどのデータが、社会の事象の分析や予測に有用であることを示しています。豊田教授は、様々な対象について、そのようにビッグデータを活用する方法を探ってきましたが、そのもう1つの例が、イベントに集まる人の数の予測です。すなわち、各地で開催されるイベント(スポーツの試合やコンサート、展示会など)へ、いつどのくらいの規模の人が集まるかをXのポストなどから予測する方法の開発を進めてきました。

「『明日、東京ドームで巨人戦を見に行きます』『何月何日に、どこどこで展示会があります』といったポストがXなどには多数あります。それらの投稿と、過去のイベントにおける人口変動データ(=何時にどれだけの人がいたかの実測値)から、イベントの来場者数を予測するニューラルネットワークのモデルを作りました。するとそのモデルによって、未来の各種イベントに、何時にどのくらいの規模の人が集まるかを高い精度で予測できることがわかりました」

図2 各日付において、東京ドームの各時間帯の人口をモデルによって予測したグラフ。9月4日~20日までの各グラフは、実測値(青)と、最大一週間前からの予測値が重ねて描かれている。21日以降は予測値のみ。スポーツの試合など、過去に例のあるイベントについては約10%程度の誤差で予測可能(イレギュラーなイベントの規模や時間帯は間違いやすい)。このデータを利用すると、周辺エリアや交通機関の混雑具合も事前に予測できる。 提供:豊田 正史 研究室

図2は、東京ドームの来場者数の実測値とモデルによる予測値を、ある時期の約1カ月間について比較したものです。イベントの現場における時系列の人口の動きが、比較的精度よく予測できています。そして、このような予測は、周辺エリアの混雑緩和に活かせるのではないかと考え、豊田教授は現在、交通シミュレーション事業者及び東北大学の研究者と共同で、「スマート定期券」とでも呼べそうな新しい定期券のあり方の検討と実証実験を進めています。

「イベントが盛況であれば、最寄駅やその電車の路線も混雑します。そこで、イベントに多くの人が集まることが予測される日には、追加料金を払わずとも迂回路が使える新しい定期券を作り、電車や駅の混雑緩和に寄与できないかと考えています。パネル調査的な実験をしたところ、迂回路を使う人は多くいたので、このような定期券があれば有用かもしれません」

同様の手法によって、観光地における混雑具合を予測して、空いているスポットを勧めるような仕組みも作れそうです。また、広告分野への活用も考えられます。イベントの種類によって集まる人の年齢層や属性が変わるので、その予測に合わせて周辺エリアの広告を、デジタルサイネージの技術によって変えるという方法です。豊田教授は、そうした方法の検討にも着手しているとのことです。

“トランプ関税”の影響も可視化できる?

豊田教授が開発するこれらの技術は、多くの分野で応用できる可能性があります。その大きな可能性を社会全体に役立てるために、2023年に東京大学に設立されたのが「デジタルオブザーバトリ研究推進機構」です。この機構は、世界の様々な社会・経済活動を、デジタルデータによって「観測」(オブザーバトリ=観測所)し、得られた分析や知見を、国や企業が利活用できるようにすることを目的として設立されました。現在、その最初の取り組みとして、世界のサプライチェーンのレジリエンス向上に向けた研究が進められています。豊田教授はその中で、「多様な社会活動を観測可能にする基盤技術の構築」を目指すチームのリーダーを務め、世界における物やサービスの流れを可視化する仕組みの構築を進めています。

図3 「産業連関表」のデータを可視化したもの。上図の円はそれぞれ、国を表し、青い線は物とサービスの移動を表す(太い方から細い方に移動)。中図はアメリカ(上図の「US」)を拡大したもの。国内の各種産業のつながりが描かれている。下図は、アメリカの鉄鋼産業に着目した図。アメリカの鉄鋼産業がどの国にどのくらい依存してるかが、各国の円の大きさで表現されている。また、アメリカが、カナダ(CA)にだけ鉄鋼の関税を50%とした結果カナダからの輸入がストップすると想定した場合、アメリカがカナダ以外の国に依存せざるを得なくなる度合が、黄色系の色の濃さで表されている。ロシア(RU)、ブラジル(BR)、メキシコ(MX)といった国の色が濃くなっている。提供:豊田 正史 研究室

図3 「産業連関表」のデータを可視化したもの。上図の円はそれぞれ、国を表し、青い線は物とサービスの移動を表す(太い方から細い方に移動)。中図はアメリカ(上図の「US」)を拡大したもの。国内の各種産業のつながりが描かれている。下図は、アメリカの鉄鋼産業に着目した図。アメリカの鉄鋼産業がどの国にどのくらい依存してるかが、各国の円の大きさで表現されている。また、アメリカが、カナダ(CA)にだけ鉄鋼の関税を50%とした結果カナダからの輸入がストップすると想定した場合、アメリカがカナダ以外の国に依存せざるを得なくなる度合が、黄色系の色の濃さで表されている。ロシア(RU)、ブラジル(BR)、メキシコ(MX)といった国の色が濃くなっている。
提供:豊田 正史 研究室

「産業ごとに、どの産業からどれだけ原材料等を入手し、製品やサービスをどの産業へどれだけ販売しているかを示すデータを『産業連関表』と言います。私たちは、世界規模の産業連関表を可視化しインタラクティブに分析する仕組みを作りました。<図3上>の各円は、国を表し、その間をつなぐ青い線が物やサービスの移動を示しています。一例として、アメリカ(US)を拡大したのが<図3中>です。国内に様々な産業のセクターがあって、それぞれがどう連関し、物やサービスがどのように移動しているかが可視化されています」

現在、アメリカの関税の問題が世界を揺るがせていますが、<図3下>は、トランプ大統領の2025年3月の発言に従ってアメリカが、カナダにだけ鉄鋼の関税を50%とした場合に各国の生産量がどのように変化するかをシミュレーションしたものです。ここでは単純にカナダからアメリカへの鉄鋼の輸出が完全にストップする状況を想定していますが、アメリカ(左下の大きな円)は、カナダ(CA、中央下)からの輸入がなくなる分、他国への依存度が高くなると予想され、その依存度合が、黄色系の色の濃さで表されています。

「実際の政策決定に活用する場合には、さらに詳細な条件やデータを各分野の専門家に組み込んでもらうことになりますが、私の仕事は、そうした可視化や分析の基礎となる技術を構築していくことです。あらゆることがデジタルの世界に記録されるようになった今、こうした技術の重要性がとても増していると感じます」

データ可視化の先にある、人間とコンピュータの良き未来

豊田教授は、情報を可視化する研究に学生時代から取り組んできました。そして現在、自身の専門分野を「インタラクティブデータ解析」と記します。それは、データを分析・可視化し、そこで得られた結果をもとにさらに次の分析を行うということを、ループのように繰り返していく、まさにインタラクティブな解析のことです。先の産業連関表を可視化する技術は、まさにその好例と言えます。では、そのような解析技術の先には、どのような未来が見えるのか。豊田教授はこう話します。

「AIの急速な発達によって今、AIが提示する結果を、根拠がわからないまま利用せざるを得ない機会が増えています。そうした中で、私が重要だと感じるのは、様々なデータやその分析結果を、人間が理解できる形で可視化して、なぜそうなるのか、そこから何がわかるのかを、私たちが論理的に追えるようにしていくことです。そのためにも私は、これからも可視化の方法を追求していきたいです。その先にこそ、人間とコンピュータがよりよい形で共存できる未来があるのではないかと思っています」

関連リンク≫ デジタルオブザーバトリ研究推進機構

関連リンク≫ 豊田正史 | 内閣感染症危機管理統括庁ホームページ

関連リンク≫ COVID-19 AI・シミュレーションプロジェクト | 内閣感染症危機管理統括庁ホームページ

記事執筆:近藤 雄生(ノンフィクションライター、理系ライター集団「チーム・パスカル」)

2025年5月30日(金)、31日(土)に実施される「東京大学駒場リサーチキャンパス公開」の「生研講演会」にて、豊田教授が講演します。

日 時:2025年5月30日(金)13:00〜13:50(本企画に対する事前予約は不要です)
場 所:東京大学駒場リサーチキャンパス An棟2階コンベンションホール
テーマ:実世界ビッグデータの分析・可視化と社会活用
概 要:実世界に関するビッグデータをAIなどを用いて分析し可視化する技術は様々な社会活用が可能です。ソーシャルメディアや携帯の位置情報などを用いた新型コロナパンデミックに関する分析や、交通・人流データを用いた需要予測など、多様な事例を紹介します。
東大駒場リサーチキャンパス公開ウェブサイト

ぜひ足をお運びください!

みんなのコメント

コメントはまだありません。

投票&コメントで参加

この記事が描く「もしかする未来」をどのように感じましたか?あなたの期待度を投票してください!

投票いただきありがとうございます!この研究についての、あなたの意見をお聞かせください。いただいたコメントは、承認されると「みんなのコメント」に掲載されます。コメントが盛り上がれば、研究者本人が登場することも・・・?!

最大2000文字

コメントを残す

もっと詳しい研究内容を知りたい方、疑問や質問がある方は、研究室のウェブサイトをご覧ください。

前の記事