GenOCRが「辞書変換(類似度)」機能を追加、表記ゆれを吸収しマスタデータと自動マッチング

GenOCRが「辞書変換(類似度)」機能を追加、表記ゆれを吸収しマスタデータと自動マッチング

公開: 更新:
CodeCampが提供するDX人材育成が可能なプログラミングやITが学べる公開講座

ジンベイ株式会社は、生成AIAI-OCR「GenOCR」の新機能「辞書変換(類似度)」をリリースしました。読み取った文字列を類似度ベースでマスタデータと照合し、最も一致度の高い値に自動変換する機能です。表記ゆれを吸収したマスタとのマッチング精度向上が期待され、名寄せ・突合作業の工数削減につながります。



GenOCRが解決する表記ゆれとデータ照合の課題

帳票から読み取ったデータを基幹システムや管理台帳に取り込む際、読み取り結果と自社マスタ上の正式名称が完全に一致しないケースは少なくありません。取引先名が「(株)〇〇商事」と「株式会社〇〇商事」のように表記が異なる場合、システム上は別の値として扱われます。

商品名の略称やスペース・全角半角の違いも同様です。こうした表記ゆれを揃えるために担当者が手作業で名称を突き合わせて修正する作業が、データ活用の地味なボトルネックとなっていました。


Python研修一覧はこちら

目的に合うPython研修を一覧形式から探したい方は、ぜひご利用ください。

Python研修を比較する

Java研修一覧はこちら

目的に合うJava研修を一覧形式から探したい方は、ぜひご利用ください。

Java研修を比較する

PHP研修一覧はこちら

目的に合うPHP研修を一覧形式から探したい方は、ぜひご利用ください。

PHP研修を比較する

新入社員研修

目的に合う新入社員研修を一覧形式から探したい方は、ぜひご利用ください。

新入社員研修を比較する

全ての研修からも探したい方はこちら

GenOCRの「辞書変換(類似度)」機能が解消する照合の手間

新機能「辞書変換(類似度)」では、データ加工の選択肢にあらかじめ登録したマスタデータと読み取り結果を類似度ベースで照合する仕組みを追加しました。完全一致でなくても最も一致度の高い値に自動で変換するため、従来の完全一致変換では拾いきれなかった表記ゆれや軽微な誤認識も、類似する正式名称へ寄せられます。

既存の読み取りフローに組み込める点も特徴です。主な効果は次の4点です。

  • 名寄せ・突合作業の削減:表記ゆれの手修正が不要になりマスタ照合の工数を削減
  • データ品質の向上:表記が統一された状態で出力され後続システムでの集計・分析がスムーズに
  • 取り込みエラーの低減:マスタに沿った正式値へ変換されシステムインポート時のエラーや弾かれを抑制
  • 既存フローへの組み込みやすさ:データ加工の一機能として既存の読み取りフローの中でそのまま利用可能

活用シーンは、幅広く想定されています。取引先名・企業名の「(株)」「株式会社」といった表記ゆれの吸収、商品名・型番の名寄せ、勘定科目・部門名などの分類、住所・拠点名の標準化などのユースケースに対応します。

ジンベイ GenOCRの概要

項目 詳細
提供企業 ジンベイ株式会社
サービス名 ジンベイ GenOCR
カテゴリ 生成AI型AI-OCR
読み取り精度 99%(*)以上
最低価格 月額2.5万円
主な特徴 手書き文字・非定型フォーマット対応
事前設定がほぼ不要
無償トライアルあり(クラウド版のみ)
代表者 代表取締役 上田 英介
所在地 神奈川県横浜市西区北幸一丁目5番10号 JPR横浜ビル 8階
設立 2024年5月24日
GenOCRの詳細はこちら
Python基礎・実践(Django)

企業・法人向けのPython研修では、基礎から応用まで体系的に学べます。

Python研修の詳細

DX社員研修

企業・法人向けのDX研修では、実務に繋がるリスキリングでITレベルを向上させます。

DX研修の詳細

Javaエンジニア育成研修

企業・法人向けのJavaエンジニア育成研修では、Javaの基礎から応用まで確実に習得できます。

Java研修の詳細

新卒・新入社員向け研修

企業・法人に新入社員・新卒社員に向けたプログラミング研修を提供しています。

新入社員研修の詳細

コードキャンプのIT研修を全て見る

trends編集部の一言

読み取り精度99%(*)以上を実現しながら、その後のマスタ照合でつまずくという課題は、データ活用の現場では根強く残っていました。「高精度に読む」だけでは業務フローに組み込みきれないという現実への、地に足の着いた応答です。業界全体として、AI-OCRの精度競争から「後工程との接続性」へ関心が移り始めている流れと読み取れます。

完全一致に頼らず、類似度で吸収するアプローチは、マーケティング文脈でいえば名寄せや顧客データ統合の課題とも重なります。月額2.5万円という価格帯と既存フローへの組み込みやすさを踏まえると、現場主導でのデータ整備を進める企業において、導入の選択肢が広がる動きと言えそうです。

References

  1. ^ PR TIMES. 「生成AI型AI-OCR「GenOCR」、類似度によるマスタ補完機能リリース | ジンベイ株式会社のプレスリリース」. https://prtimes.jp/main/html/rd/p/000000121.000143568.html, (参照 26-06-19).

※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。

ITやプログラミングに関するコラム


ITやプログラミングに関するニュース

ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。

企業・法人向けのIT・プログラミング・生成AI研修を探す、比較する - IT・プログラミングを知って学べるコネクトメディア CodeCampが提供するDX人材育成が可能なプログラミングやITが学べる公開講座 - IT・プログラミングを知って学べるコネクトメディア コードキャンプが提供する無料で学べるプログラミングスクール講座 - IT・プログラミングを知って学べるコネクトメディア コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア 配属3ヶ月で30%の生産性向上を実現するいよぎんコンピュータサービスの新人研修に迫る - IT・プログラミングを知って学べるコネクトメディア 金融業界の業務効率化を加速するニッセイアセットマネジメントの生成AI×GAS活用研修事例 - IT・プログラミングを知って学べるコネクトメディア 【製造業のDX人材育成事例】デジタル人材の即戦力化を実現する、日本ガイシ株式会社の異動者向オンボーディング研修 - ITやプログラミングを知って学べるコネクトメディア フューチャーアーキテクト株式会社が実現した新入社員向けIT研修プログラムでタスクフォース制度が主体的な学びと成長を生み出す - IT・プログラミングを知って学べるコネクトメディア コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【IT新入社員研修】オンラインとオフラインの最適バランスを実現したFutureOneの導入事例 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【新入社員研修】柔軟なハイブリッド型Java研修で実現した新卒20名の成長と成果|サークレイス株式会社 - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/現場により近いところにデジタルを根付かせるDX基礎講座研修|株式会社ブリヂストン - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/業務の効率化・DX推進に向けたIT人材育成への第一歩|株式会社カナエ - ITやプログラミングを知って学べるコネクトメディア 企業・法人向けのIT・プログラミング研修 - ITやプログラミングを知って学べるコネクトメディア

新着記事

対象者別で探す

子供(小学生・中学生・高校生)向け
プログラミング教室検索する

子供(小学生・中学生・高校生)がロボットやプログラミング言語を学ぶことができるオフラインからオンラインスクールを検索、比較することが可能です。

子供(小学生・中学生・高校生)
プログラミング教室検索する

ITやプログラムなどの
最新情報を検索する

日々、新しいITやプログラミング言語の情報が流れていきますが、特定の情報を時系列でニュースやコラムを確認することができます。

ITやプログラムなどの
最新情報を検索する