*本原稿は、2019年6月20日に「マイナビニュース」で 掲載された記事「 日本メーカーが大苦戦!マシンビジョンの世界で何が起きているのか?(14)」を一部加工し、転載しています。

マシンビジョン業界におけるディープラーニング活用動向

マシンビジョン用途でディープラーニングを活用するため、各企業は様々なアプローチを試みてきた。本稿ではその方向性を紹介し、今後、どのような観点でディープラーニング技術に取り組むべきかを解説する。

マシンビジョンにディープラーニングを活用する製造業企業は、保有するAI技術レベルに応じて、大きく3つの層に分類できる。AI技術を社内で育て上げようとしている「HIGH」層、汎用AIパッケージ製品を活用してニーズに応じたアプリを自社で構築しようとしている「MIDDLE」層、社外リソースを活用して課題を解決しようとしている「LOW」層である。

「LOW」層の企業は、ディープラーニングに詳しいAIコンサルティング企業(以下、AIコンサル)に投資するという活動を行ってきた。この活動により市場が活性化し、新たなAIコンサルも数多く出現した。

しかし、マシンビジョンのニーズは、現在のディープラーニング技術単体で満たせるものではなく、現場のノウハウがないAIコンサルでは、最終成果までに至らないことが多かった。また、仮に成果が得られたとしても、そのノウハウは自社に蓄積できなかった。

また、コストも膨大であった。AIコンサルに画像を渡して結果を提供してもらうまで、数百~数千万の費用が発生する。日本の製造業は少量多品種が多いため、分類に当てはまらないものが追加されれば、投資を繰り返すことになる。LOW層の企業はこのエンドレスにも見える出費を一度ならず経験しており、同じことを繰り返そうと考える企業は減ってきている。

一方、「HIGH」層の企業は、ディープラーニングという技術自体への投資意欲が旺盛で、AI技術を社内で育て上げようとしている。AI専任技術者を雇い入れたり、研究開発部門に専門部隊を作ったりして、様々なフレームワークを駆使して、自社アプリケーションに最適なネットワークを独自で作成しようとしている。

しかし、ディープラーニング自体の進化が一段落した現在、社内で高コストなAI専任技術者を保有する意義は薄れてきている。ディープラーニングの実用性を世に示した有名な画像認識コンテストであるILSVRC(ImageNet)も、認識性能が飽和状態に達していることから、2017年、その歴史に幕を下ろした。ディープラーニングは現場で活用される確立した技術となり、さらなる進化の場は、企業から研究組織へ一旦戻ったように見受けられる。

2015年から2018年にかけて、マシンビジョン業界の製造業の企業は、ディープラーニングの性能と限界を一通り経験した。投資の繰り返しに疲弊した企業はこのピラミッドから一旦離脱したが、引き続き投資意欲がある企業は徐々にMIDDLE層に集中し始めている。これはなぜだろうか。

「MIDDLE」層の強みは、パッケージ製品を用いることで、ディープラーニングの効果を自社で簡単に検証できることにある。自社でやりたいこととディープラーニングができることを容易に把握できるため、データのクオリティ向上、ネットワークの熟成も柔軟に行える。ディープラーニング機能を部品として活用することで、自社アプリケーションにディープラーニングを迅速に組み込むことができている。

汎用パッケージ製品を用いて、検証と改善を社内でスピーディに回すことで、ディープラーニングを本来の目的である自動化・品質向上・性能向上に活用できたことが、マシンビジョン企業がMIDDLE層に集中してきている理由だと考える。

ディープラーニングツール選定のポイント

今後、ますます多くの企業が、ディープラーニング機能を持った汎用パッケージ製品を活用していくことになる。幅広い層に受け入れられるパッケージ製品が、これからのスタンダードになっていくであろう。では、マシンビジョン分野の幅広い層に受け入れられるパッケージ製品とは、どのようなものだろうか。

自身のアプリケーションに組み込み易いかどうか

まず、ユーザが扱いやすい開発環境が整っていることが重要である。現在、製造業のマシンビジョンアプリケーションはほぼすべてVisual StudioのC言語または.NET環境で開発されている。ディープラーニング機能を同一環境下で運用できるかどうかは、重要なポイントとなる。

市場に存在するディープラーニングツールには、それ自体で完結したツールとなっているものも多く存在する。単体ツールとして検証には利用しやすいが、いざアプリケーションに組み込む段階で問題になりやすいので、注意が必要である。

クラウドサービスか、オンプレミスか

大手企業が提供しているディープラーニングツールの多くは、クラウドサービス型である。ディープラーニングネットワークをトレーニングする際も、実際に画像の分類や検査を行う際にも、画像データをクラウドにアップする必要があるため、高速性を求められるマシンビジョンアプリケーションでは転送時間がボトルネックとなる。

また、自社製品の画像や、装置を納めた先で集められたエンドユーザの部品の画像をネットにアップすることが、コンプライアンス上問題になることもある。トレーニングも分類・検査もオンプレミスで動作するツールの方が、マシンビジョン業界との親和性が高いといえる。

トレーニング支援機能が充実しているか

ディープラーニングのメリットとして、アルゴリズム開発工数を削減できることが挙げられるが、その代わりに、画像を集め、パラメータを調整し、精度を検証する、というループを繰り返す必要がある。この検証ループを繰り返して性能を改善する作業がやり易くなるような工夫がなされているツールが良いツールである。

例えば、画像上に存在する特定の物品を抽出するオブジェクト認識を行うためには、事前に、画像上のどこに何が存在するかを指定した上でトレーニングを行う必要がある。この、画像上のどこに何があるかを指定する作業は「アノテーション」と呼ばれるが、例えば1000枚の画像に対してアノテーションを行うのは非常に大きな工数となる。このアノテーションを効率的に行えるような機能が揃っているか、というのは、非常に重要である。また、ネットワーク生成過程での性能を確認できたり、結果を簡単に確認できたり、といった機能も重要である。

このような支援機能が充実しているかどうかが、ディープラーニングツールの出来不出来を決める要素になる。

マシンビジョンアプリケーション本来の目的を達成できるか

本稿は、マシンビジョンに取り組んでいる方々を対象としているが、マシンビジョン業界の企業の目的は、ディープラーニングを導入することではなく、ディープラーニングを用いて、マシンビジョンアプリケーションの性能を向上させ、自動化・品質向上・性能向上を実現することにある。マシンビジョンアプリケーションを実現するのであれば、マッチング・計測・読取といったルールベースの画像処理機能と、ディープラーニング機能を簡単にシームレスに統合できるツールであることが望ましい。

マシンビジョン業界で、AI導入自体が目的である時代は終わりを迎えた。これからは、自動化・品質向上・性能向上、という本来の目的に対して、どのようにディープラーニングを活用していくかを考える必要がある。汎用パッケージ製品を用いて、ディープラーニングを部品として活用することで、我々の本来の目的を達成していくことは、マシンビジョン業界の企業にとって有効な選択肢だと考える。