KDL BLOG

AI学習データ収集/沖縄の伊是名村役場にカメラを設置してきた

まずは場所探し

設置場所を移動しよう、ということになったものの、つてがありません。とりあえず目ぼしい島で、1軒ずつ「屋上貸してください」と頭を下げて回ろうかと考えていたIoT班の中西。

屋上を貸してもらうだけなら、割といけるんじゃない?と思ったけど、いろいろ条件があるようです。

「ついでに電源も貸してつかぁさい!」

「台風きたら、しまってつかぁさい!」

「時々、再起動もお願いするので、やってつかぁさい!」

それは、、我が家に頼みに来たら断りたいなあ・・

「(できれば)全部無料で」

ちょ・・ハードル高い・・

と思っていた矢先に、淡路島で開催された「Hardening 2017 Fes」で内閣府沖縄総合事務局の方にお会いして、「屋上設置をお願いして頭を下げにいきますので、どこかいい感じの設置場所をご紹介いただけませんでしょうか?(それがだめならお願いしているとき後ろに立っていてくださるだけでも)」とお伝えしたところ、設置場所を当たってみましょう、と快諾していただきました(涙)。

雲の発生は離島がいいですよねえ、といろいろ調べてくださって、ご紹介いただいたのが伊是名村村役場。

なぜ沖縄?

ちなみに、なんで沖縄で画像を撮影するの?という質問を受けたので回答します。

雲は、海などの水が蒸発した水蒸気が、上空で冷えて小さい水滴となって集まったものです。つまり、水を蒸発させるために温かい地域が適しています。そして、沖縄は高い山がないために水蒸気を含んだ空気が上空にあがりやすい、ということで、沖縄の離島がよいわけです。

サンタがやって来た!驚きの神対応、伊是名島

というわけで、12月23日~12月25日に、阿嘉島でカメラを回収して伊是名村に設置するという強行スケジュールを組んで参りました。

ちなみに、事前に伊是名村村役場のご担当から、設置する機器のサイズを聞かれたのでお伝えしたところ、同じサイズのダンボールを準備して設置場所をシミュレーションして画像を送ってくださいました。神様ですか・・。
cloud_izena_003.jpg

阿嘉島で無事カメラを回収し、翌朝伊是名島へ。どっちも離島なので本島を経由してフェリー移動です。(1行で済ませるけど6時間かかってます)

cloud_izena_009.png

伊是名島、伊是名村役場でご対応いただいたのは、村役場建設環境課の平田様。一級土木施工管理技士保持者です。クリスマスイブの日曜日にも関わらず、にこやかに対応してくださいました。

設置場所に行くと、既に電源を引いてあり台の準備なども万端。神様というかもうサンタクロースでしょ。。

cloud_izena_004.jpg

<平田様(右)とこのプロジェクトのPMを務めるバニヤン・パートナーズの稲村(左)>

何より驚いたのは、平田様の設置の手際のよさ。固定するワイヤーを持ったと思ったら、ものの数十秒でしっかり固定してくださいました。

cloud_izena_006.jpg

さすが一級土木施工管理技士・・・IT企業には絶対できないプロの技です。

IoTの時代、ITできます、だけじゃなかなか難しくなってきましたからね。それぞれの分野のプロの方と一緒に協力することが重要です

実証実験に積極的に協力。その理由は・・

なぜ伊是名村役場がここまで丁寧に対応してくださるのか、それは、離島振興のための取り組みとも関わりがあるそうです。内閣府が取り組む沖縄振興策でも、離島振興を支援する「沖縄離島活性化推進事業」など対策が進められています。

伊是名村では、振興策の一環として、離島という条件を活かして実証実験への参加、協力などに積極的に取り組んでいるそうです。日経BP様が進めておられるリアル解体ラボなどにも参加するなど、産業に貢献することを通じて島をPRし、振興につなげていこうとされています。

しかし、この対応の丁寧さ、お人柄にとても心を奪われた出来事でした。

建物もほとんど入りません。キレイに撮影できています。

cloud_izena_007.jpg機械学習の学習用のデータをたくさん集めて分類するのって、なかなか大変なんですよね。今回みたいに、全天球カメラで雲の画像をたくさん撮影して、しかも分類されたものなんてほとんどないと思います。撮影画像自体が価値を持つことになるはず。この苦労は何倍も報われるはず・・・!

ちょっと真面目に機械学習の話

余談ですが、ここで機械学習について問題です。学習させる上で学習データと学習回数は多ければ多いほどいいのでしょうか?

学習データについては、「良質」なデータであれば多ければ多いほど、精度は増します。良質というのは、例えばこれは巻雲(すじ雲)だ、とか高積雲(ひつじ雲)だ、とか雲の種類に人間がラベルをつけて分類できる画像を指します。これは、雲の種類ごとの特徴を学習するためです。ただし、例え良質なデータが多くても、高積雲(ひつじ雲)の画像だけやけに多い、など各種類の雲のデータ数に偏りがあっても判別の精度に影響を与えます。

学習回数も学習データ量も、多ければ多いほどよいというわけではありません。どちらも多すぎてしまうと学習結果がデータに特化してしまい、判定の精度が下がってしまう、つまり誤った判定をすることが多くなってしまうからです。
人間が間違って分類しそうなデータも、敢えて学習データに入れていく必要があります。機械学習は万能じゃありません。精度を上げるには地道な努力は必要ですね。

今回は、内閣府の方との偶然の出会いから、ここまでスムーズに進めることができたことに本当に感謝です。つながりって本当に大事だなとつくづく思いますよね。

前回のカメラ設置はこちら

松丸

筆者:松丸恵子

広報室