Case Study
ドキュメント画像認識
画像や動画の一部から特徴量を抽出・解析して画像の意味するところを高い精度で推定する画像認識は、物体や人間の認識・検出など多岐に渡る分野で応用されています。ドキュメント内の文字や数字・記号などを認識して文字コードに変換するOCRや機械学習と組み合わせたAI-OCRも広まっています。
ドキュメント画像認識の用途
ドキュメント内から誤ったロゴマークや偽物のキャラクターイメージなどの識別・検出することはAI画像認識ツールでも容易ではありません。私たちは、この難しい課題の解決に成功しました。
-
ルールに合っているか、人の目で判断 ⇒ AI技術で判断作業を自動化
-
効果:精度の向上・ばらつきの回避・作業負担の軽減・人件費の削減
開発具体例
各種ドキュメント内のロゴマーク判定
受託までの経緯
現在、会社のブランド(ロゴマーク、社名)が不正利用される問題が多発しており、その対応として社内の各部署だけでなく、他社でこの会社のロゴを使用する場合にも、厳しくロゴ使用規定を施している会社が多くなっています。
しかし使用されたロゴが本当に規定に沿っているかどうか、チェックする人件費もかなりのコストが発生します。
某大手通信企業の広報部門において、この会社の社員が社外向けに展開するドキュメントに含まれるロゴや社名などが正しく使用出来ているか確認する作業があり、今までは担当者の目検のみで行っていましたが、年々増加傾向にあったブランドチェックの申請件数に対する作業効率化と精度向上のため、システムを開発しての自動化を計画しました。
はじめはある海外大手開発会社へ依頼し開発しましたが、ロジックをどうやって駆使してもロゴマークの特定の精度は上がらず、ある大手メーカーのAI画像認識製品を使ってシステムの再構築を実施しました。
この製品の機械学習機能で多くのトレーニング実施したことで、ある程度の精度改善は出来ましたが、やはり特定率は80%に満たず、現場での利用に至りませんでした。
その後、このシステムの精度を改善出来るか弊社に相談されました。
課題
大手メーカーのAI画像認識製品を使ってもロゴ特定の精度が目標に達成しない。現場で使用するには95%以上の精度を出さないと使えない。なんとか精度を上げて現場の作業効率を上げたい。
解決策
この案件を含め、人の行っている作業は決して汎用的なものではなく、言ってみればかなりファジーな部分が含まれます。また熟練された人の判断はより複雑なものとなっています。
つまり単純に機械学習(モデリング)技術を使ったAI画像認識処理だけでは、おそらく満足できないのが現状です。
例えば、ある画像をあらゆるドキュメントから探し出すというだけならメーカーなどが販売している機械学習AI製品を活用し、トレーニングすれば、十分とは言えないまでもそれなりに成果は有るかも知れません。
しかし、ある画像の正確さまでをチェックしようとした場合、まず正確でない画像も特定し、その画像を正確な画像と比較した違いを指摘しなければなりません。
このように一般に業務上で人がやる作業は単純な認識処理だけではなく、業務に求められるいくつかの複合的な要求が混ざることが非常に多く、機械学習AIソフトだけでは満たされないという現場の声をよく聞きます。
上記の処理をAIの持つ機械学習トレーニング機能を使って解決することは出来るかもしれませんが、それには、その画像の不完全となるあらゆる要素を学習させる必要があり、そのための学習サンプル画像は大量に必要となります。さらに完全にそれらを網羅することは不可能に近いと言えます。
正しい画像を探すだけ ⇒ 機械学習AI機能でもある程度満たせる
正しくない画像も探す ⇒ 機械学習AI機能だけでは要求は満たされない
ではどうすれば良いでしょう?
まず全てをロジック化することは出来ません。見つけたい画像のあらゆる特徴点をロジックにして、それらのルールと画像を比較するということは、まず現実的ではありません。
やはり、AIを使った画像認識技術は必要となります。
今回のお客様のチェック要求内容は下記の様な内容でした。
どの規定違反の場合もまずは、その様なロゴを特定出来なければなりません。
我々はまず現状分析のため、お客様の要求しているあらゆる規定に合わないロゴサンプルをテストし、機械学習機能を使ってトレーニングした上で、どこまで特定出来るかを分析しました。
AI画像認識製品にはいろいろなパラメータの閾値設定があり、その閾値の値を変えることで認識する範囲が変わります。今まで認識しなかった画像を特定するようになったり、逆に特定してほしくない画像や文字が特定されてしまったりします。
やはり状況に合った各パラメータに対する閾値の正しい設定が必要になります。
我々はあらゆる閾値の値を検証して最適値に設定しました。
それらの試行・分析をした上で、機械学習トレーニングをしてもさらに特定しにくい現象がいくつかありました。
・ロゴマークの解像度が悪くぼやけている現象
・特定したいロゴマークに別のオブジェクトが重なって、ロゴの一部しか見えない現象
これらの現象を解決した方法は以下をご参照ください。
更に考慮しなければならないもう一つの事象は、人とシステムのチェックの判断による違いが発生することです。
お客様の要望である上記チェック規定の中で、例えばロゴの縦横比や最小サイズといったもの、または、色のチェックといったものが規定集にあります。
今までチェックしていた人は規定値と比べて判断している訳ではなく、過去の経験から判断しています。それは微妙に規定された数字とも違ってきていますので、システムがそのまま規定通りにチェックしてしまうと、今までOKだったものがNGとなったり、その逆も発生してしまいます。
お客様の要望は今まで、検査の人がやっていたチェックになるたけ同じになることが希望でしたので、それに合わせた誤差値を設定しなければなりませんでした。
以下に弊社が取った対応を参考に記載します。
上記は一つの例ですが、出て来た現象をまず解析し、対策を取ることで解決させる必要があります。
つまり各現場で抱えている要求は機械学習AI機能に、その現場特有のアルゴリズムを加えることで目標に達することが可能となります。
各現場作業の自動化 = 機械学習AI機能 + 現場特有の要求解決アルゴリズム
我々は、AI画像認識製品の学習トレーニングに加え、新たなアルゴリズムを追加することでかなり高い精度に達成しました。
以下に現場特有のアルゴリズムを追加する概要図を示します。
効果
それまで特定出来なかった不完全ロゴを特定し、全体では99.8%のロゴを特定することが出来ました。それによって、実際にチェック現場で活用し、ブランドチェック業務全体コストの51%を削減することが出来ました。
サマリー
ロゴマークの利用チェックを自動化
全体で99.8%の不完全なロゴを特定
お客様は、チェック作業全体で、51%のコスト削減