海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする
現在の場所図頭 " AIアンサー

OCRmyPDFを使って多言語を含むPDF文書を処理するには?

2025-08-14 170

多言語のPDF文書を扱う場合は-lパラメーターは言語コードの組み合わせを指定する:

  • 基本的なコマンドの形式:
    ocrmypdf -l 语言代码1+语言代码2 input.pdf output.pdf
  • 例えば、中国語と英語が混在した文書の処理:
    ocrmypdf -l eng+chi_sim input.pdf output.pdf

警告だ:

  1. 対応するTesseract言語パックを事前にインストールしておく必要があります。tesseract-ocr-chi-sim
  2. 言語コードはTesseractのドキュメントに記載されています。
  3. 推奨用途--verbose 2パラメータ検証識別結果
  4. 複雑なレイアウト文書の場合は、パラメータを調整したり、プラグインを使用したりする必要があるかもしれません。

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

トップに戻る

ja日本語