KDL BLOG
AIプロジェクトPoCの進め方
AIによる成功事例がメディアによって頻繁に報道される一方で、「AI導入が進まない」という話題も近年たびたび耳にするようになりました。AIの導入で欠かせないのがPoCですが、このPoCが進まなかったりPoCを繰り返すものの導入に至らない例も多いようです。
今回は、これからAIを導入、またはAI導入を進めている企業様向けに、KDLのこれまでの経験をもとにAIのPoCの進め方や注意すべき点についてご紹介します。
AI(人工知能)にできること
AIの定義は非常に広く曖昧です。AIそのものも、AI技術を利用したサービス自体もAIと表現されたり、AIとひとことで言ってもそれが何なのかを言い表せる言葉がありません。
そもそもAIには何ができるのか、という観点で整理すると、以下の図ように分けられます。
図の左ふたつ「推論」と「意思決定」は、以前から統計などの数学的な計算で実現されているものですが、近年AIと表され話題になるものは、主に右の「認識」「習熟」「理解」の3つが多いようです。これらはディープラーニングと呼ばれる技術で実装され、近年飛躍的に成熟しています。
今回の解説では、「認識」の領域で画像認識のAI(教師あり)プロジェクトを例にご紹介します。画像認識は、画像から特徴をつかみ、対象物を識別するAIの1つです。例えば同一人物の特定や自動運転の衝突防止など、画像認識はとても広く使われています。
<画像認識(物体検出)の例>
AIプロジェクトの流れ
さて、PoCの進め方の前に、まずPoCはAIプロジェクトのどの段階で実施するのかを解説します。AIプロジェクトの流れは以下のように進むのが一般的です。
アイデアデザインでは、AIを使って何がしたいのかを確定させます。ここで大切なのは、課題をしっかり設定すること。その課題を解決した場合に、本当に自社にとって有効な結果が得られるのかを軸に考えることです。
次のビジネスデザインでは、AIで何をしてどうビジネスにするのかに落とし込みます。AIを使うことを目的にしてしまうケースもたびたび見かけますが、ここで、どうビジネスとして利益を出すのか検討して費用対効果を試算します。ここまでは主に現場の方が主体となって考えるのが望ましいでしょう。
ここまでが決まれば、システムデザインで、実現可能な方法を検討します。ここからはもっぱらITエンジニアの領域になります。PoC後「これでイケる!」となれば製品化・実用化という流れになります。
AI導入のPoCのワークフロー
ここからは、先ほどの図のPoCの部分を説明します。PoCの基本的なワークフローは以下の図のとおりです。
データの取得
機械学習で使うデータを検討します。たびたび起こるのは、AIで使う前提でこれまで取得していたデータが使えないケース。AIの質は学習させるデータの質によるため、取得方法は慎重に検討する必要があります。画像の場合は撮影方法や解像度などが命運を分ける場合もあります。
データの蓄積
予め、どのくらいのデータが必要かを検討しておく必要があります。データを集める場合、その保管ストレージも必要です。収集してみたところ解像度を上げる必要が出てきて、予想以上にデータが大きくストレージが耐えきれないというケースもあります。想定外の予算が必要になるとプロジェクトがストップしてしまう場合も。こうならないためには、必要なデータ数や容量をあらかじめ定義しておきます。
また、大量のデータを保管した場合、どのデータを使うかを選別することを想定して、検索性にも気を遣う必要があります。PoCでは教師データを変えて細かくチューニングするようなフローが発生するからです。
データの確認
収集したデータは機械学習で使えるデータになっているかどうかに気を付ける必要があります。
教師データにするデータには、特徴を捉えるために一定の条件が必要です。アノテーションを含めて、効率的に収集する必要があります。
- ※アノテーション データひとつひとつにラベルを付与すること
現在のAI開発では、アノテーションは手作業がほとんどです。このアノテーションは、質のよい教師データをそろえるために非常に重要な部分です。近年ではアノテーションだけを請け負う業者もあるほど。
しかし、例えば医療系の画像などのように専門性の高い画像課題によっては、アノテーションにかなりの時間が必要になることがあります。そういう場合は現場の方にひとつずつ確認してつけてもらう必要があります。その時間がとれなくて、断念するケースもあるようです。
モデル設計
モデルとは、入力したデータを出力データに変換するものです。
例えば、入力した画像から距離を推定するAIであれば、入力値は画像、出力データは距離、というようなイメージです。このモデルで検討しなくてはいけないのは、機械学習の環境とモデル構造です。
機械学習の環境では、機械学習のプラットフォームやAPIなどのクラウドサービスを利用する場合が増えて参りました。しかし企業のポリシーによってはクラウドがNGという場合は、学習環境を用意することもあります。
モデルの構造の検討では、すでに研究開発された様々なAIのオープンソースが出回っているため、課題によっては既存のモデルだけで学習することも可能です。既存のモデルだけで難しい場合には、それをカスタマイズしたり、独自でモデルを作り出すこともあります。独自でモデル構造を開発するのは難易度もコストも高いため、検証段階では既存モデルを利用する場合が多いです。
概念実証は何度も検証を繰り返す
さあここまでできたら、やっと教師データで学習です。しかし、すぐにいい結果が得られるわけではありません。
評価結果がいまひとつ場合、これまでの過程を再検討します。
教師データに調整が必要なのか、モデルの構造が課題にマッチしていないのか、データ量が少なかったのかなど、教師データ作成から評価までのフェーズを、手法やアプローチを変えて様々なパターンで検証することが必要です。
このように、PoCでは何度も検証を繰り返してよい成果が得られる条件を模索していきます。
KDLでは、AIプロジェクトのPoCの支援を行っています。AI導入のご相談などお気軽にお問い合わせください。
PoC内製化を支援するための、「AI開発内製化・ビジネス開発講座」も提供中です!
監修:本光 伸行
デジタルビジネス本部 エンジニア
筆者:松丸恵子
広報室