OCR(Optical Character Recognition、光学文字認識)とは、画像やPDF中の文字を自動認識してテキストデータに変換する技術です。紙の書類をスキャンした画像やデジタル写真に写った文字を読み取り、編集可能なテキスト形式で出力することができます。
従来のOCRは印刷された活字の認識が主流でしたが、近年ではディープラーニングやコンピュータビジョン技術を活用したAI-OCRが登場し、手書き文字や複雑なレイアウトの帳票、歪んだ文字なども高精度で認識できるようになりました。CNN(畳み込みニューラルネットワーク)などのニューラルネットワークにより、文字の特徴を学習し認識精度を向上させています。
ビジネス現場では、請求書処理の自動化、契約書のデジタル化、名刺管理システムなど幅広く活用されています。RPAとの組み合わせにより、紙ベースの業務プロセス全体を自動化する企業も増えており、DX推進の重要な技術として注目されています。また、多言語対応や表形式データの構造化出力など、機能も高度化が進んでいます。