株式会社 日立製作所は、既存の物体検知AIの検知結果を後付けで補正するAI技術を開発しました。
追加の処理時間は画像1枚あたり0.1秒程度で、精度向上と処理効率を両立する設計です。
日立の物体検知AIが抱える誤検知と見逃しの課題
製造現場での製品検査や設備保守、インフラ監視、空撮画像解析など幅広い分野で、物体検知AIの活用が広がっています。これらの現場では品質保証や安全確保、安定稼働への影響が大きく、検知結果には高い信頼性が必要です。
一方で、未知の物体や外観が類似した物体が多数存在する環境、込み入った背景、時間経過による環境変化などにより、誤検知や見逃しが発生するリスクがあります。従来の補正手法では、画像全体の情報と検知領域ごとの詳細な情報の相互関係を捉えた高精度な補正が難しい状況でした。既存の物体検知AIの再学習や改修が必要となるケースもありました。
日立が開発した特徴統合モジュールによる高精度な後付け補正技術
株式会社 日立製作所が開発した本技術は、画像全体の特徴と細かい領域ごとの特徴を統合的に分析し、検知結果を高精度に補正します。まず特徴抽出モジュールが、画像全体の情報と領域別の詳細情報をそれぞれ取得します。次に特徴統合モジュールが両者の関係性を分析し、全体の予測と検知領域ごとの予測の両方を出力します。これらを元の物体検知結果と組み合わせることで、より正確な補正を実現する設計です。
本技術の主な特長は以下の通りです。
- 画像全体と検知領域の情報を同時活用した誤検知抑制・見逃し低減
- AIモデルの内部構造に依存しないモデル非依存型の設計
- API経由で利用するブラックボックス型AIへの適用が可能
- 再学習・改修なしに既存の物体検知AIへ後付け適用が可能
入力情報として必要なのは、画像と物体検知AIの出力結果(予測されたラベル情報と検知領域の座標情報)のみです。AIモデルの内部構造や学習済みパラメータに依存しないため、コードが公開されている通常の物体検知AIだけではなく、API(Application Programming Interface)経由で利用するブラックボックス型AIを含む多様な物体検知AIに後付け適用できます。
日立の新技術がCOCO・LVIS・Pascal VOCなど複数ベンチマークで効果を確認
本技術をCOCO、LVIS、ODinW13、Pascal VOCなど複数の公開ベンチマークで検証しました。Grounding DINOやLLMDetなどさまざまな最新の物体検知モデルで一貫した精度向上が確認され、元の物体検知モデルに対して最大50%以上の検知精度の改善を達成しています。
また、一般向けPC環境(CPU:Intel® Core i9、GPU:RTX 2080 Ti)における性能測定では、本技術を適用した場合の追加の処理時間が画像1枚あたり0.1秒程度でした。未知の物体や複雑な環境において安定した検知精度を維持し、さまざまな実運用環境への適用が可能です。
なお、本成果の一部は2026年6月3日~7日に開催されるCVPR 2026(The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026)のFindings Trackで発表予定です。論文タイトルは「DetRefiner: Model-Agnostic Detection Refinement with Feature Fusion Transformer」で、Soichiro Okazaki氏、Tatsuya Sasaki氏、Hiroki Ohashi氏による発表予定です。
株式会社日立製作所の物体検知AI補正技術概要
| 項目 | 詳細 |
|---|---|
| 開発元 | 株式会社 日立製作所 |
| 技術名称 | 既存の物体検知AIの検知結果を後付けで補正するAI技術 |
| 検知精度改善 | 最大50%以上(複数の公開ベンチマーク検証結果) |
| 追加処理時間 | 画像1枚あたり0.1秒程度 |
| 検証ベンチマーク | COCO、LVIS、ODinW13、Pascal VOC |
| 対応モデル例 | Grounding DINO、LLMDet |
| 適用対象 | 通常の物体検知AIおよびブラックボックス型AI(API経由含む) |
| 再学習・改修 | 不要 |
| 学会発表予定 | CVPR 2026 Findings Track(2026年6月3日~7日) |
| 位置づけ | Lumada 3.0を支える技術の一つ |
trends編集部の一言
最大50%以上の検知精度の改善という数値は、画像認識技術の導入フェーズにおける一つの転換点として位置づけられます。AIの精度改善といえば「モデルを作り直す」「大量のデータで再学習する」というアプローチが主流とされてきた中で、既存の出力結果のみを入力として補正を行うモデル非依存型の設計は、業界全体の導入コスト構造を変える可能性を持つアプローチです。
マーケティング業界の文脈に置き換えると、コンテンツ認識や広告クリエイティブ解析など画像認識を組み込む領域でも「既存のAIをどこまで流用できるか」という問いは共通の課題です。業界全体としては、再学習コストを前提とせずに後付けで精度を引き上げられるアーキテクチャへの関心が高まる傾向にあり、API経由のブラックボックス型AIにも適用できるモデル非依存型アプローチの需要は今後さらに広がると見られます。
References
- ^ PR TIMES. 「既存の物体検知AIの検知結果をAIの再学習や改修なしで高精度に補正するAI技術を開発 | 株式会社 日立製作所のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000065.000152541.html, (参照 26-06-05).
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
【Git】remote設定を変更する方法
【VBA】コメントアウトを設定する方法
マークダウンで改行する方法
【CSS】notで複数の件を除外する方法
x86とx64の違いを分かりやすく解説
GitLabとGitHubの違いを解説
パソコンのメモリの目安を用途別に選ぶ方法
Linuxで環境変数を確認する方法
CapsLockキーを解除する方法
UbuntuのIPアドレスを確認する方法
ITやプログラミングに関するニュース
株式会社Y'sが生成AI研修サービス「Edtech Training」を提供開始、業務活用から自動化まで実践的に学習
AiLENS V1とYYSystemの連携商品が販売開始、視線を外さない音声文字化環境を株式会社アイシンが提供
KANA-L HOLDINGSが「AI studio MiYaGi」を本格始動、十億円規模の投資・資本提携を段階的に検討
Zenportが「サプライチェーンAIエージェント」を提供開始、グローバル供給網のリアルタイム意思決定を支援
株式会社アカツキAIテクノロジーズが「フィジカルAIソリューション」を提供開始、ロボット選定から実装まで一気通貫支援
MetelixがエンタープライズAI基盤「RiN Family」を正式リリース、DLコンテンツ制作数が最大4倍に拡大
ソニーネットワークコミュニケーションズが「RenaX」を展開、リハビリ業界向け生成AI書類支援やシフト最適化を追加
作業記録+生成AI「カカナイ」が製造現場の日報作成を効率化、マウンテンゴリラがカカナイLITE新機能としてリリース
Liquid AIが「LFM2.5-1.2B-JP」と音声モデルを公開、オンデバイスAI実用化を支援
株式会社 日立製作所が物体検知AI向け後付け補正技術を開発、AI再学習なしで最大50%以上の検知精度改善を実現
