画像鮮明化技術とは?敵対的ネットワーク生成による原理と活用事例
現代では様々な場面で品質の高い画像が要求されます。しかし、常に要求を満たす完全なオリジナル画像を取得することは難しいでしょう。例えば、以下のような不完全なデータしか得られなかったものの、最終的な成果物にはそれらを元にして高品質な画像を準備する必要があるということが起こり得ます。
- ピントのあっていないぼやけた画像データ
- 画質の低い粗い画像データ
- 歴史的資料としての白黒写真のみしか存在しない状況
- ラフスケッチしか存在しない状況
上記のような場合、専門的で工数のかかる画像加工や、イラストから撮影コンセプトを固めて実際に写真を撮影する等、品質の高い画像データを準備することは困難で、時間とコストがかかる場合が多かったのですが、近年のAIの発展に伴い、上記のようなデータからでも容易に品質の高い画像を作り出すことができる手法が編み出され、様々な場面で利用されるようになってきました。
もし、AIによる画像鮮明化技術に関して、
- 自動化、省人化してコストダウンしたい
- 処理後の画像品質を向上させて品質価値を高めたい
というご希望がございましたら、お気軽に画処ラボまでお問い合わせください。ルール型画像処理からAIによる画像処理まで、ご希望に対して幅広い対応が可能です。
業界最大級の画像処理検証施設を開設!
「画処ラボ」ではルールベースやAIの画像処理を専門エンジニアが検証。ご相談から装置制作まで一貫対応します。
Youtubeチャンネルでも解説中!
目次
1.画像鮮明化処理の原理
(1)敵対的ネットワーク生成(GAN: Generative Adversarial Networks)
(引用・Deep Learning for Computer Vision: Generative models and adversarial training (UPC 2016))
①原理
敵対的ネットワーク生成(GAN:Generative Adversarial Networks)とは、GeneratorとDiscriminatorの2つのニューラルネットワークで構成されています。
Generatorは、ある意味で偽物と言えるデータをランダムなノイズから作り出すという役割を果たします。それに対しDiscriminatorはGeneratorで生成された偽物データと本物データを比較して本物か偽物かを判定するという役割を果たします。
Generatorで偽物データを生成し、Discriminatorで判定するというプロセスを大量に繰り返しつつ、Generator, Discriminator双方の精度を高めていくことで、結果として対象の特徴を自然に反映させた(ある意味で偽物の)データを自動的に生成することができるGeneratorを生み出すことができます。
また、この過程で、対象の特徴を定量化することが可能であり、あるデータに対して別の特徴を付与したデータを自動的に生成することも可能となります。
②メリット
データから特徴を学習し、実在しないそれらしいデータをランダムに自動生成したり、あるデータをそのデータの特徴を残しつつ別の特徴を付与するといったことがあらゆる対象画像に対して可能であることがこの手法の大きな特徴です。
技術的なメリットとしては、GeneratorとDiscriminatorという2個の競合するネットワーク双方を最適化することによって、従来の手法と比べてより最適化されたデータを生み出すことができ、結果として鮮明な画像の生成が可能であることが挙げられます。
また、必要なリソースについて、GANは教師なし(ラベルなし)学習を基本とするため、教師データを作成する手間を省くことができる場合があることも強みです。
③注意点
ただし、GANを扱う場合、以下の点に注意する必要があります。
1点目は、学習の不安定さです。これは、Mode Collapseと呼ばれる現象で、GANの原理の構成の複雑さから、生成されるデータに偏りが生じてしまうことがあります。これがどのように発生するか予測することは困難で、この問題を避けるためには、ひたすら試行錯誤を重ねて、パラメータやネットワーク構成を見直すという地道な作業を繰り返す必要があります。
2点目は、生成されたデータの評価が難しいということです。何かを分類したり、将来の値を予測したりするということであれば、その評価結果が良好であったかどうかを定量的に判断することは容易です。
しかし、新たに生成された何らかの類似データが、本当に適切な類似データか否かを判断することは困難です。そのような判断を下すには、対象のデータに精通した人が実際に生成された画像を見て判断する必要があり、適切な判断が難しかったり、多くのリソースが必要になってしまう可能性があります。
2.GANの種類と画像鮮明化処理での応用事例
(引用・Image-to-Image Demo)
(1)SRGAN
①概要
SRGAN(Generative Adversarial Network for Super-Resolution)とは、低解像度の画像を高解像度に復元する手法です。従来手法ではぼやけた画像になりやすかったのですが、SRGANではGANの技術的特性を利用することで、低解像度の画像からぼやけの少ない高解像度の画像を復元することが可能となります。
②応用事例 解像度の低い画像の高解像化
以下は衛星画像の低解像度の画像からぼやけの少ない高解像度の画像を復元した事例です。左側の画像の不自然さが右側の画像では除去されており、より自然な高解像度の画像が復元されていることがわかります。
(引用・Quadruple image resolution with Super-resolution)
(2)Pix2Pix
①概要
シンプルなGANでは、Discriminatorが本物と偽物を単純に見分ける能力を向上させることを目指すようにシステムが設計されます。この場合、Generatorが作り出す(偽物)画像とDiscriminatorが参照する(本物)画像それ自体が一致しているわけではありません。
しかし画像から画像への変換でGANを活用する場合、本物らしさだけでなく、入力画像と出力画像の一致具合を評価する指標が別途必要となります。元画像の特徴を最大限残した上で、出力画像に別の特徴を加えるという変換が必要となるためです。そのように追加的な条件が加えられたGANの手法をPix2Pix(Image-to-Image Translation with Conditional Adversarial Networks)と呼び、広義のCGAN(Conditional GAN)のひとつとみなすことができます。
このPix2Pixという手法を用いることで、以下のように元画像の特徴を維持した上で別の特徴を付与した出力画像データを自動的に生成することが可能となります。
②応用事例 白黒輪郭ラフスケッチのカラー写真化
左側の白黒輪郭ラフスケッチの画像を入力データとして、Pix2Pixの手法を適用することで、自動的に右側のカラー写真のような画像を出力データとして得ることができます。
右側のデータは、実際にそのような鞄があったわけではなく、左側のラフスケッチの特徴をできるだけ残した上で、鞄のカラー画像としての特徴を加えることで自動的に生成されたということがポイントです。
(引用・Image-to-Image Translation with Conditional Adversarial Networks)
③応用事例 日中写真の夜景化
こちらの事例では、左側の日中の写真から、同じ場所の夜景のような画像が自動的に生成されています。単純に画像を暗くしただけでなく、夜になると明かりが灯されるといった、夜景としての特徴までもが、左側の画像の特徴を維持した上で再現されていることがポイントです。
(引用・Image-to-Image Translation with Conditional Adversarial Networks)
④応用事例 領域指定データを元に類似画像生成
こちらの事例では、左側の「建物の窓、入口、ひさし、壁等」に色分けされた「ラベル付けされた」画像を元に、それらしい建物のカラー写真が自動的に生成されています。単に部品を切り貼りしているのではなく、建物の窓、入口、ひさし、壁等の特徴を自然に再現した、世の中のどこにも無いが、建物として自然なカラー写真のような画像データが生成されていることがポイントです。
(引用・Image-to-Image Translation with Conditional Adversarial Networks)
3.製造業における画像鮮明化の導入事例
(1)事例紹介
①株式会社横浜ファーム
http://robo-navi.com/webroot/document/2018RobotHandBook.pdf (P24)
- 課題
- 養鶏場における作業員の目視による死亡鶏監視業務が膨大だった
- 検査環境が特殊で、作業員への環境面での負担が大きかった
- 検査環境の照度不足と埃等の環境により高品質な元画像の取得が困難だった
- 導入による効果
- AIによる画像処理によって、照度不足・埃等の悪環境下の低画質画像からでも検査に十分な画質の画像を復元することが可能となり、ロボットでの自動化を達成できた
- 作業工数を半減させることができた
- 作業員への環境面での負担も大幅に改善することができた
4.画像処理・検査装置に強いおすすめSIer3選
(1)画処ラボ(ガショラボ)
【所在地】
〒105-0004 東京都港区新橋5丁目35−10 新橋アネックス 2階
TEL:050-3733-3774
WEB問合せ:https://gasho-labo.jp/#contact
https://gasho-labo.jp/
【特徴】
検査の自動化に伴って画像処理装置の導入する際には、複数のセンサーメーカーと複数の画像処理機器メーカーを選択し、それぞれ検査対象によって個別対応する必要があります。
画処ラボは、メーカー横断での機器選定から判断プログラムの選定及び装置の設置構想までを⼀括で提案し、設置からサポートまで⼀元管理。
さまざまなメーカーから、照明は50種類、カメラ・レンズは30種類をとりそろえており、機器や画像処理プログラムの選定だけでなく、装置の構想・設置、サポートまで、ワンストップで相談が可能です。
業界最大級の画像処理検証施設を開設!
「画処ラボ」ではルールベースやAIの画像処理を専門エンジニアが検証。ご相談から装置制作まで一貫対応します。
(2)カゴヤ・ジャパン株式会社
【特徴】
カゴヤ・ジャパン株式会社は、データセンター事業を中心としたアプリケーションサービスプロバイダです。画像鮮明化ソリューションも手がけており、専用ハードウェアに依存しないソフトウェア処理による柔軟なソリューションが可能であることが強みです。
【所在地】
京都市中京区三条通烏丸西入御倉町85-1 KDX烏丸ビル 8F
TEL:075-252-9355
FAX:075-252-9356
https://www.kagoya.jp/solution/iot/lynxeye/
(3)株式会社 ロジック・アンド・デザイン
【特徴】
株式会社 ロジック・アンド・デザインでは、LISrという汎用性の高い画像鮮明化ソリューションが提供されています。さらに、AIによる画像鮮明化技術を活用した「AI復元超解像度化技術」が2020年夏頃より展開開始される予定で、リアルタイムで自動的に低画質の画像の画像鮮明化処理を行うことができるようになることが期待されています。
【所在地】
東京都新宿区新宿1-36-2 新宿第七葉山ビル 3階
TEL:03-4500-7755
FAX:03-4500-7755
https://www.lad.co.jp/technology/ai-restoration/
5.画像鮮明化のご相談は画処ラボへ
このように、従来技術では困難だった画像鮮明化についても、AIによる画像鮮明化技術を活用することで、実現可能性が高まりつつあります。
ただし、AIによる画像鮮明化は現在まさに実用化が進みつつある新しい技術であり、これらの技術の活用には高い専門性が必要となります。そこで、自社の課題に対して共に取り組んでくれる、確かな技術を持ったパートナーを選ぶことが大切となります。
画処ラボでは、さまざまなメーカーとの協力のもと、最適なメーカーの選定から実装までワンストップで対応しています。画像鮮明化ソリューションをご検討されている方は、ぜひお気軽にご相談ください。
関東最大級のロボットシステムインテグレーター 画像処理の検証から装置化ならお任せください
050-1743-0310 営業時間:平日9:00-18:00