PDF OCR認識
スマートアルゴリズムにより、いつでもどこでも、あらゆるデバイスで通常・スキャンPDFを簡単に処理できます。
累計1万件以上のファイルを処理。
変換形式:OCR検索可能PDF (.pdf)
PDFファイルをここにドラッグ
またはクリックしてファイルを選択
ファイルを選択当前格式最大支持 80MB PDF 文件✓ 当前格式最大支持 80MB
スキャンPDFを無料でオンラインOCR認識。画像の文字を検索・コピー可能なテキスト層に変換。日中英混在テキストと手書き認識に対応。スキャン文書のデジタル化・契約書・学術論文の検索に最適。元のレイアウトを保持。登録不要、ファイルは自動削除。
ファイルの取り扱いについて(プライバシー保証)
OCR 処理は当社の処理ノード内で完結し、第三者の OCR API は呼び出しません。アップロードとダウンロードは HTTPS で暗号化され、処理完了から 1 時間後に元ファイルと検索可能 PDF は完全削除されます。
こんな場面に向いています
- 扫描合同二次检索
扫描件归档后想查找某个条款,OCR 后即可在 Acrobat、Preview 等工具内全文搜索。
- 老论文 / 旧资料数字化
图书馆扫描的旧文献加文字层之后,可被引文管理工具检索与摘录。
- 图片中的信息摘录
把发票、卡片照片转成可搜索 PDF,再用文本工具摘出金额、单号等关键字段。
機能紹介・特徴
- スキャン文書認識
スキャンPDF内の印刷文字を正確に認識。検索可能なテキスト層を生成。
- 多言語対応
デフォルトで中国語・英語に対応。一般的な文書シーンをカバー。
- 検索可能PDF
認識後、テキストはコピー・選択可能。Ctrl+Fで全文検索。
- 手書き認識
はっきりした手書き文字を認識。整った手書きメモやフォームに適しています。
- 安全・プライバシー
処理中のみ一時保存。1時間後に自動削除。一切保持しません。
- 並列処理
マルチコアOCR。複数ページPDFを効率的に処理。待ち時間短縮。
操作手順
- 1PDFをアップロード
認識したいスキャン版・画像型PDFをアップロード。最大500MB。
- 2OCR認識
各ページでテキスト認識。結果を検索可能なテキスト層としてオーバーレイ。
- 3結果をダウンロード
完全なテキスト層を含むPDFをダウンロード。元のレイアウト保持。コピー・検索可能。
ご利用上の制限と注意点
- 模糊与低分辨率扫描— DPI 低于 200 或拍照模糊的页面识别精度会下降。
- 特殊字体与花体— 艺术字、手写花体、繁复装饰字识别率有限。
- 摩尔纹与倾斜页面— 建议提前去除摩尔纹、矫正倾斜后再 OCR。
- 非中英语种暂未优化— 目前对中英文表现最佳,其他小语种识别率低于预期,可在反馈中提需求。
よくある質問
- QOCRの認識精度は?
- 高品質OCRエンジンを使用。鮮明な印刷文字は高精度。ぼやけ・傾き・手書きは精度が下がる場合があります。鮮明で正面のスキャンをアップロードしてください。
- Q対応言語は?
- デフォルト:中国語・英語。一般的なニーズをカバー。他言語はお問い合わせください。
- QOCR後、レイアウトや画像は変わりますか?
- いいえ。元のPDFページにテキスト層をオーバーレイするのみ。レイアウト・画像・色は変わりません。
- Q暗号化PDFもOCRできますか?
- 現時点では未対応。パスワードを解除してからアップロードしてください。
- Qアップロードしたファイルは保存されますか?
- いいえ。アップロードしたPDFと認識結果は一時保存のみ。1時間後に自動削除。ユーザーファイル・認識内容は一切保存しません。
- QOCR 後に PDF ファイルサイズは大きくなりますか?
- わずかに大きくなります。OCR プロセスは既存のページ画像の上に透明なテキストレイヤーを重ねます。追加されるサイズは通常わずかで、通常の使用やファイル転送には影響しません。
- Qすでにテキストレイヤーのある PDF にも OCR は必要ですか?
- PDF のテキストがすでにコピーおよび検索可能な場合、OCR は必要ありません。この機能は主にスキャン版や写真ベースの画像のみの PDF 向けです。
- Q写真から変換された PDF も認識できますか?
- はい。写真が鮮明で、テキストの向きが正しく、照明が均一であれば、OCR エンジンは効果的に認識できます。大きく傾いた、ぼやけた、または大きな影でテキストが遮られた画像は避けてください。
- QOCR 後に直接 Word や Excel に変換できますか?
- はい。まず OCR でスキャン版 PDF を検索可能な PDF に変換し、その後「PDF to Word」や「PDF to Excel」機能を使用すると、スキャン版を直接変換するよりもはるかに良い結果が得られます。
- Q縦書きのテキストは認識できますか?
- システムは主に横書きテキスト向けに最適化されています。縦書きの中国語や日本語にもある程度の認識能力がありますが、精度は横書きより低い場合があります。アップロード前にページを通常の読み取り方向に回転させることをお勧めします。
- Q認識結果に誤字がある場合はどうすればよいですか?
- OCR 認識は 100% の精度を保証できません。特にぼやけたテキストや特殊なフォントの場合は誤認識が発生します。ダウンロード後に PDF リーダーやエディタで重要な内容を手動で校正・修正することをお勧めします。
- Q多段組みレイアウトのドキュメントは正しく認識できますか?
- システムは一般的な2段組み・3段組みレイアウトを適切に処理し、左から右、上から下の読み取り順序でテキストを整理します。極端に複雑な多段組みレイアウトでは、わずかなずれが生じる場合があります。
OCR 完成后再做二次转换
扫描件先 OCR 之后,再去做 PDF 转 Word、PDF 转 Excel 等二次转换,效果会显著优于直接转换。