本記事では、近年さらなる注目を集めているAIによる画像認識についてご紹介します。AIによる画像認識とは何かという基本的な内容から始め、画像認識が注目を集めている背景や導入ステップもご紹介します。さらに、NashTechのグローバルな知見を活かした実際の導入事例も合わせてご紹介します。

人工知能(AI)による画像認識技とは?

AIを用いた画像認識とは、機械に画像を読み込ませ、機械が自律的に画像から特徴を抽出し対象物を識別するというパターン認識技術の一つです。AIによる画像認識の基本的なモチベーションは、「人間が普段から無意識的に行っていることを機械にやらせよう」ということになります。

どういうことかというと、人間にとって写真などの画像を見て、どのような場所に何が写っているか判断することは通常あまり困難なことではありません。しかし、非常に多くの写真をすべて人間の眼で確認して、どこに何があるか識別するとなると話は変わってきます。このように、人間にとって実行することは困難ではないが、素早く大量の情報に対して実行することが困難であるような問題を解決する手段としてAIが用いられるのです。

AIを用いた画像認識では、大量の画像データを機械に読み込ませるだけで、AIが自律的に画像の中の重要な特徴を抽出し、対象物を識別することができるようになります。つまり、人間に手で行うことは画像を集めて機械に与えるだけということです。

人工知能(AI)による画像認識が注目されている背景とは?

近年、AIを用いた画像認識技術が以前にも増して注目を集めています。注目を集めている背景には「ディープラーニング」と呼ばれる技術の台頭にあります。ディープラーニングが発達する前は、AIによる画像認識はあまり良い精度で物体を識別することができない、あるいは多くの情報を処理することが困難であるというような課題が存在しました。しかし、ディープラーニングを用いれば精度と物量に対する課題の両方を解決することができるのです。それでは、ディープラーニングとはどのような技術なのでしょうか?以下でディープラーニングのかんたんな紹介をします。

ディープラーニング(機械学習)とは?

ディープラーニング(機械学習)とは、人間の脳を模したニューラルネットワークという複数の「層」から成るネットワーク構造を用いて、簡単な概念から複雑な概念を抽出するという機械学習に対するアプローチの1つです。つまり、画像や数値データなどの単純な情報から、因果関係が複雑な特徴や法則など、より高次の概念を抽出するということです。

ディープラーニングは比較的新しい概念で、概念が提唱されたのは2006年のことです。提唱された当初は知名度もあまり高くなく、注目もされていませんでした。注目されたきっかけは、2012年に行われたILSVRCという大規模な画像認識コンテストにてトロント大学のチームが圧勝ことにあります。以降、高い精度で画像認識が可能なディープラーニングの分野の研究開発が盛んに行われるようになり、それに伴ってAIによる画像認識が産業へ導入されるようになったのです。

AIによる画像認識を導入する3つのステップ

本節では、ここまでご紹介してきAIによる画像認識技術を実際に導入するために必要な3つのステップをご紹介します。

ステップ1:目的と精度の決定

第1ステップとして、画像認識を行う対象を決定する必要があります。対象が決まらないと収集する画像を決定することができないからです。対象を決定する際に検討すべきことは画像認識を行う目的と、認識モデルの精度になります。例えば、「Amazon Go」のようなサービスを実現するために画像認識技術の導入検討をしているとしましょう。その際の目的はサービスの実現なので、画像認識を行う対象は人間と物の大局的な識別、物の識別では具体的に何の商品なのかまで識別しなければなりません。したがって、物の認識精度は高い水準が求められる一方で、人の識別に対する精度はあまり重要ではないと判断することができます。

ステップ2:画像収集と学習

目的と精度が決まったら次は画像の収集と学習の実行です。ここでは、カテゴリー分けされた画像をとにかく大量に集めることです。引き続きAmazon Goの例を考えると、りんごを販売するなら様々な角度・距離からりんごを識別するために複数のパターンのりんごにカテゴリーされた画像を集めるということです。そして、集めた画像を機械に読み込ませることで学習を進めていきます。学習を行うための簡易的なアプリケーションは今日ではネットでかんたんに見つけることができます。

ステップ3:性能評価・改善

学習を行ったら最後のステップとして、性能を評価しましょう。ステップ1で決定した精度の基準と比較して、基準を満たしていなければ学習に用いたデータセットの数やパターンを増やす、あるいは学習アルゴリズムを変更するなどして性能を改善していきます。

【最新】AIによる画像認識の導入事例4選

以下では、画像認識技術が実際に産業導入されている事例をご紹介します。

Alibabaの事例

Eコマースの世界的大手である中国のAlibabaでは、ECサイトに画像認識技術を導入しています。AlibabaグループのECサイト上のフォームに欲しい商品の写真をアップロードすると、サイトに掲載されている膨大な商品の中から類似の商品を見つけ出すことができるのです。

Alibabaによると、Eコマースプラットフォームに関するユーザーのクレームは大きく2つに集約されるといいます。1つ目は「欲しいアイテムを見つけるのが困難」、2つ目は「アイテムが豊富すぎて混乱する」というものです。自分の欲しい商品写真をアップロードするだけで類似商品を探し出す画像検索は、こうしたユーザーのクレームを解決する手段となるでしょう。

Deep Formsの事例

DeepFormsは、AIによる画像解析技術を用いて帳票の画像から枠や線、入力項目などの情報を自動認識し、帳票を電子化し出力するサービスです。AIを用いた画像解析技術で80%以上の認識率を実現しており、顧客の業務に適用可能な精度を実現しています。

Sharepoの事例

Sharepoは現場作業員の点検・検針・巡回業務にタブレット端末を活用する設備点検支援サービスです。Sharepoでは、タブレット端末のカメラで電気、ガス、水道メーターを撮影することでAIが自動で数値を読み取り、数値とメーターの写真を同時に検針帳票へ記録・集計することが可能となります。この能力によって、施設の設備点検・検針業務を軽減し、作業ミスや人手不足解消に貢献しているのです。

アサヒビールの事例

アサヒビールでは、輸入ワインの検査に対して画像認識技術を導入しています。これまで輸入ワインの検査作業は、検査員の目視で行われてきました。瓶を光に透かし、液体に微細な異物が混入していないかをラベルの隙間からチェックするという、繊細かつ熟練した作業が求められます。そのため、現在の輸入ワインの販売数量を検査するのに1ラインあたり10人ほどの検査員が必要とされるといいます。

同検査機では、画像認識システムのほか、赤外光照明やカメラも用いて検査を行います。ワインを検査機にかけると、約10秒間瓶が傾斜・旋回します。すると液体に緩やかな渦流が発生し、ラベルに隠れて見えなかったわずかな異物も発見できるというものです。ワイン瓶のさまざまな形状や、赤ワイン・白ワインなどの液色の違いのデータをあらかじめ登録しておくことで、最適な検査パターンを適用できるのです。

AIによる画像認識の展望とは?

画像認識技術はディープラーニングの台頭とともに大きく発展しています。AIによる画像認識は今では人間と同等かそれ以上の精度を示し、すでに各産業界で実用化が進められています。さらに、センサー技術の発達によるIoTの発展やビックデータの活用によって、さらに画像認識技術の活用の幅は広がっていくでしょう。また、ディープラーニングに関する研究も各学問分野で盛んに行われていることもあり、ディープラーニング自体の実用性が向上することも十分考えられます。

他にも、顔認識の精度向上や感情認識技術の確立などのさらなる画像認識技術的な進歩とは別の技術発展との掛け合わせも考えられるでしょう。例えば、動画データや音声データ、言語翻訳などにおけるAI技術と掛け合わせた技術の研究開発も進んでおり、画像認識技術に対するさらなる盛り上がりが期待されます。

まとめ:画像認識技術のビジネスへの応用へのさらなる期待

いかがでしたでしょうか?本記事がAiによる画像認識の理解を深める一助になれば幸いです。様々な技術が発達している今、画像認識技術の導入方法は千差万別で様々なビジネス上の課題に対して有効なソリューションとなるでしょう。あなたの企業でも画像認識技術の導入を検討してみてはいかがでしょうか?

また、NashTechではグローバルで得た知見を元に多くのお客様の技術導入をサポートしてきました。本記事を読んで少しでも弊社にご興味をお持ちいただけましたら、こちらまでお気軽にお問い合わせください。