Geo-Business BLOG

建設コンサルタントの「ビッグデータ」活用・分析手法を大公開!

2023年9月13日(水)、建設コンサルタントの方向けに株式会社アルメックの内山様・小島様と共同セミナーを開催。近年内閣府主導で進めているEBPMに基づいた交通計画やまちづくりにおけるデータの活用方法のポイントや分析手法についてご紹介いただきました。

==========お話いただいた方==========

株式会社アルメック
執行役員
内山 征 様

株式会社アルメック
国内事業部
小島 桃子 様

==================================

今回のセミナーのポイント

  •  データを活用することで、「わかる」だけではなく「次はこうしていこう」という計画の策定にまでつなげていくことができる
  • 特別なツールは使わずともビッグデータの分析は可能
  • 過去のデータでは良い街づくりはできない

データを活用することで、「わかる」だけではなく「次はこうしていこう」という計画の策定にまでつなげていくことができる

テークホルダーが多い案件ではビッグデータ活用が武器になる

今回の案件における2019年と2022年前後(コロナ前後)の人流の比較データ

小野
今日お話しするのが神奈川県のとある市のお話なのですが、 改めて案件の概要について内山さんからご説明いただこうと思います。

内山
はい。よろしくお願いします。
今回の案件は、神奈川県の某市の駅周辺地区の活性化を目指し20年後のビジョンを作る、という取り組みになるのですが、現状を捉えたり、実際の計画を進める上でブログウォッチャーさんのビッグデータを活用させていただいています。
本案件に関わらず、ビジョン策定という大きな案件はステークホルダーが多様です。だからこそ、全員が納得感を持って進められるように、ビッグデータのような客観性のあるデータが非常に重要になりました。

小野
ありがとうございます。どんなデータを活用して、どんなアウトプットを作られたのでしょうか。

内山
ブログウォッチャーさんからは、「1ヶ月単位」・「緯度経度」を持った移動データ(許諾を得たユーザのスマートフォンから取得されたデータ)を提供していただきましたので、125m×125mをメッシュの単位にした上で、今回の該当のエリア間の移動量や集中量、発生量などをデータとして整備しました。
その上で、市町村単位でどこから人が集まってきてるのか、何時ぐらいに駅周辺に人が集中しているか、などを分析し、どういった人をターゲットに都市の再生をすればいいかを検討してきました。 

データから見えた交通計画へのヒント

「バス停あり」の方が数値が高いことが判明

内山
また、印象的だったのはバス停の有無による人流の変化です。
駅周辺に集まる人を分析したのですが、バス停があるメッシュとないメッシュについての比較を行ったところ、バス停周辺のところからの方が、駅への集まる人の割合が高いというようなことがわかりましたので、今後も街の活性化のためには、バス網を生かしていく必要があるということが分かりました。
他にも、駅周辺に焦点を当てて分析したところ、どこにどれぐらいの人が多く集中しているのか、どのくらいの人が移動しているのか、といったことも見えてきたので、それらのデータをもとに、未来の都市に必要な要素を検討していくことができました。

小野
ありがとうございます。実際お客様の反応はどうでしたか?

内山
広い中心市街地の中でもどこに集中すればいいのか判断することができた、エリアごとの人の移動が把握できたので、ウォーカブルな空間を作ればいいことがわかった、などのお声をいただいています。
やはり、ただ単に「わかった」ということで終わるのではなく、「次はこうしていこう」という計画策定の根拠として使ってもらっているところが、我々としても嬉しいなと思っています。

スマートシティ推進の上で未来のデータベンダーに求められるこ

小野
我々としても本望です。もっとこうなればいいな、などはありましたか。

内山
125mメッシュよりさらに小さい単位で見れるようになれば、建物単位での移動や集中している人の特性が分析でき、さらにより良い都市開発につながっていくなとは思っています。
他にも、現在のようなスマートデバイスの位置情報だけではなく、交通ICカードなどのビッグデータと組み合わせて、さらに細かい交通実態を捉えられるようになることを期待しています。リアルタイムで有益な情報をカスタマーに提供できる世界は、まさにスマートシティのビジョンでもあります。

小野
まさに僕たちもそういった未来に向け取り組んでおりますので、実現できるように頑張ります。

特別なツールは使わずともビッグデータの分析は可能

Pythonは独学で3ヶ月。無料ツールをフル活用し分析を実施

今回の分析で小島様が使用したツール

小野
ではここからは、実際のデータ分析環境について小島さんから話していただこうと思います。

小島
はい。よろしくお願いします。
今回分析に使ったソフトはこちらの3つです。まず、いただいたビッグデータをプログラミング言語「Python」で一次集計し、Excelで詳細集計をした後にQGISでマッピングしています。有料だったソースは、125mメッシュの人口くらいで、その他は基本的に無料で利用できるツールで分析しています。

小野
勇気が出るご意見ですね。ちなみにPythonはどのぐらいやられているのでしょうか。

小島
独学で始めて当時3ヶ月経ったころです。
もとは計画やデザイン関係の人間なので、プログラミングとかは全然やったことがなかったのですが、本やネットの情報を頼りに学んでいきました。

膨大な量のデータ処理もPythonで解決。「こんなに簡単でいいんだ」と感動

小島様が実際に書いたPython(右図)。実際にやってみて「こんなに簡単でいいんだ」と感動したとのこと

小野
とはいえデータ処理は大変だったのでは…と思うのですが、処理工程や大変だったことについて教えていただけますでしょうか。

小島
今回ブログウォッチャーさんからいただいたデータ量はCSVファイルで20個ほど。
1ファイルに300万行ぐらい トリップが入ってます。まさにビッグデータですね。エクセルで扱えるのはもちろん104万行までなので、当然Excelでは開けなくて、これはまいったぞ…というところがスタートです。
そこで今回活用したのがプログラミング言語「Python」です。 具体的な作業としては、まずは全てのCSVファイルを連結してPythonに読み込ませた後、集計で使わない列を削除したり、データ名を整えたり新たに作成し作業しやすくしました。また、AからBへ行くトリップとBからAへ行くトリップは別々に集計したかったので、それぞれに判定列をつける作業をPythonの中でやりました。そして、必要なメッシュだけ集計してくださいという指示をPythonに出した上で、最終的にそれをCSVとして書き出すという作業をしています。

小野
すごいですね…。お話を聞いていると忘れそうですが、勉強期間3ヶ月ですもんね。それでこのレベルの処理ができるんですね。あまりデータを触ったことがない人からすると、すごく勇気がもらえる話だと思います。

小島
そうですね。私の話を聞いて、「これでいいんだ」って思ってくれる方が少しでもいらっしゃると嬉しいです。

処理を進める中でデータのズレが発生。苦戦するも軌道修正しついに完成

データのズレの修正方法

小島
ただ、やはりいろんな壁がありまして…。
125mメッシュデータは通常公表されていませんので、まずこれをPythonで自作しました。そうしたら今度は、作成した125mメッシュコードにズレがあったことが後からわかったのです。マップに表示させた分析結果が、どうも通常あり得ない区間を移動していたので、原因を色々調べた結果、公表されている250mメッシュのデータと私が今回作った125mメッシュのコードの番号がずれてたことが判明し…。結局最後は力技で直しましたが、気づいた時は絶望しましたね(笑)。
125mメッシュのコードというのは、250mメッシュを4分割し、左下から枝番号を1,2,3,4と番号を振る形で設定されています。今回私が作成した125mメッシュでは、その250mメッシュの番号部分が間違っていたものの、最後の右一桁の枝番は合っていました。そこで、公表されている250mコードから正しい10桁とり、私が作った125mメッシュコードの最後1桁(右1桁)の枝番号をくっつける…といった処理をExcelやQGISを駆使して修正しました。色々苦戦しましたが、そういった作業を経て確からしいコードが完成し、可視化してみても問題なかったので最終的には安心することができました。

小野
なるほど…それは焦りましたね。
実はこの辺りのデータの使いやすさも今後取り組む予定ではあるので、ぜひお待ちいただければと思います。 
ただ、もともと分析したことがなかったというキャリアから、ここまでのデータ処理・分析ができるという小島さんのお話自体は、やはりいろんな方にとって勇気が出る話だったかと思います。詳しく教えていただいてありがとうございます。 

過去のデータでは良い街づくりはできない

街づくりの現場でのデータ活用に対する違和感から始まったプロダクト開発

「非集計ODデータ」資料全体はこちら

小野
最後に、ブログウォッチャーのデータについて改めてご紹介できればと思います。セミナーの中でも触れていましたが、弊社データは月間3000万台のスマートフォンからのデータを取得できており、GPSベンダーとしては国内最大規のデータ量を保有しています。そして、それらを武器に道路や街づくり、防災、観光といったところでデータを活用いただいています。従来のパーソントリップ調査等の比較でいくと、 徒歩は0.9、自動車0.85、電車も0.79との相関は取れておりますので、 パーソントリップ調査のような調査が、より安価に、簡単にできるような形になっています。
なぜこういったデータを作ろうかと思ったかというと、以前自治体の方と話したことがきっかけです。お話ししてる中で、「平成27年のパーソントリップ調査を活用している」というのを聞いて、「それって何年前だっけ?」という感覚があり…。その間にコロナもあったし、世の中が変わってる中で、過去のデータをもとに街を作っていいんだっけ、という疑問がありました。そこで、弊社の中でデータ開発に取り組み、今回のアルメック様のような案件につながっています。 

小野
最後になりますが、アルメックのお2人、今日は本当にありがとうございました。僕自身も、弊社のデータは役に立っているということがよりリアルにわかってよかったです。ぜひセミナーを見てくれた方にとっても、何か良い機会となっていれば光栄です。

内山
どうもありがとうございました。ビッグデータを活用し、より良い都市計画をしていくことができれば、きっと業界全体ももっと良くなると思っておりますので、今後ともよろしくお願いします。

小島
ありがとうございました。私もあまりPythonとかは詳しくない範囲でデータを作業しておりましたが、それでもやはり結果が出たので、チャレンジして良かったなと思っています。どうも今日はありがとうございました。


ブログウォッチャーのセミナーについてはこちらを確認ください。