AIプロフェッショナル・ツール

 ウェブサイトを投稿する

dots.ocr: 多言語文書レイアウト解析のための統一された視覚言語モデル
dots.ocrは、1.7Bパラメータの視覚言語モデル(VLM)をベースとした、レイアウト検出とコンテンツ認識の両方が可能な強力な多言語文書解析ツールです。OmniDocBenchなどのベンチマークで最先端の性能を発揮し、特にテキスト、表、読み順の構文解析に優れています。.
9.5 Kをとおして0表彰される
0ブックマークに登録
SnippAI：AIを使ってスクリーンショットの内容を認識・分析するツール
SnippaiはAIベースのスクリーンショットツールで、高度なAIアルゴリズムによってスクリーンショット体験を向上させるように設計されています。画面の内容をキャプチャするだけでなく、スクリーンショット内の数式、テキスト、表、画像などをインテリジェントに分析・変換します。ユーザーは、Snippaiを使用して、複雑な視覚情報をLaTeX数式などの編集可能な形式に変換することができます...
3.9 Kをとおして0表彰される
0ブックマークに登録
AI Fast Station：ワンクリックでOCRモデルを比較できる文書解析ツール
AI Fast Stationは、文書や画像のインテリジェントな解析に焦点を当てた、無料のオープンソースOCRモデルアリーナです。ユーザーはPDFや画像ファイルをアップロードし、ワンクリックで7つの主流OCRモデルを比較することで、素早く適切な解析ソリューションを見つけることができます。AI Fast Stationは、高精度認識、高速処理、セキュリティを提供します。.
3.5 Kをとおして0表彰される
0ブックマークに登録
OCRmyPDF: スキャンしたPDFをオープンソースツールの検索可能なテキストへ
OCRmyPDFは、スキャンしたPDFファイルに光学式文字認識（OCR）テキストレイヤーを追加し、検索可能で再現可能なドキュメントにそれらを回すように設計されたオープンソースのコマンドラインツールです。これは、Pythonの開発に基づいており、Tesseract OCRエンジンを使用して、正確に画像内のテキストを識別し、PDFに埋め込むことができます。.
1.2 Wをとおして0表彰される
0ブックマークに登録
Docstrange: ドキュメントや画像からデータを抽出し、複数のフォーマットに変換するツール。
Docstrangeは、複数のフォーマットの文書や画像からデータを抽出し、Markdown、JSON、CSV、HTMLなどのフォーマットに変換することに重点を置いたオープンソースの文書処理ツールです。人工知能と高度なOCR技術を使用し、PDF、Word文書、Exce...
5.6 Kをとおして0表彰される
0ブックマークに登録
Guava Intelligent Document Recognition: オフライン文書・フォームのインテリジェント認識ツール
Guavaインテリジェント文書認識（intelligent_document_recognition）は、開発者のjiangnanboyによって開発されたオープンソースのデスクトップソフトウェアで、GitHubでホストされています。このソフトウェアは、光学式文字認識（OCR）とフォームジャンクションを統合しています...
2.9 Kをとおして0表彰される
0ブックマークに登録
OCRFlux: PDFや画像をMarkdownに変換する軽量ツール
OCRFluxは、PDFファイルや画像をクリアなMarkdownフォーマットに変換することに特化した、オープンソースの軽量ツールです。ChatDOCチームによって開発され、3Bのパラメータを持つ大規模なマルチモーダルモデル上に構築され、GTX 3090のような一般的なハードウェア上で実行することができます。このツールは、複雑なドキュメント・レイアウトの扱いに優れています。
4.1 Kをとおして0表彰される
0ブックマークに登録
VOP: 複雑な図や数式を抽出するOCRツール
Versatile OCR Programは、複雑な学術・教育文書を処理するために設計されたオープンソースの光学式文字認識（OCR）ツールです。PDF、画像、その他の文書からテキスト、表、数式、図、回路図を抽出し、機械学習の学習に適した構造化データを生成することができます。英語、中国語、韓国語を含む多言語をサポートします。.
4.1 Kをとおして0表彰される
0ブックマークに登録
PDFコンテンツを自動的に解析し、オープンソースサービスのテキストとテーブルを抽出します。
それは自動的にPDF文書のレイアウトを分析し、ページ内のテキスト、タイトル、画像、表、数式やその他の要素を識別し、それらの正しい順序を決定します。このツールはOCR機能をサポートしており、スキャンしたPDFを検索可能なテキストに変換することができます。Docker上で動作し、2つのモデルを提供します：ビジュアルモデル（Vision Grid Transfor...
4.6 Kをとおして0表彰される
0ブックマークに登録
ボブ
BobはmacOSプラットフォーム用に設計された翻訳・OCR（光学式文字認識）ソフトウェアです。Bobは、Volcano、Tencent、Ali、Baidu、Youdao、Apple、Google、Microsoft、...など、さまざまな翻訳サービスに対応しており、あらゆるアプリケーションで翻訳とOCR操作を行うことができます。
4.5 Kをとおして0表彰される
0ブックマークに登録
Ollama OCR: Ollamaの視覚モデルを使った画像からのテキスト抽出
Ollama OCRは、Ollamaプラットフォームが提供する最先端の視覚言語モデルを利用して画像からテキストを抽出する、強力な光学式文字認識（OCR）ツールキットです。このプロジェクトはPythonパッケージとして提供されており、またユーザーフレンドリーなStreamlitウェブアプリケーションインターフェースを提供しています。Ollamaは、以下のような幅広い視覚モデルをサポートしています。.
8.3 Kをとおして0表彰される
0ブックマークに登録
Doc2X
Doc2Xは、強力な文書画像数式認識・変換ツールで、効率的でインテリジェントな文書処理ソリューションを提供することに専念しています。学術研究論文、教科書、企業文書、財務報告書など、Doc2Xは、PDF内のフォームや数式を正確に識別し、Word、LaTeX、HTML、...に変換することができます。.
4.2 Kをとおして0表彰される
0ブックマークに登録
STranslate
STranslateは、WPFによって開発されたすぐに使用できる翻訳とOCRツールです。このツールは、幅広い言語とテキストタイプに対して、効率的で便利な翻訳と光学式文字認識（OCR）機能を提供するように設計されています。STranslateはオープンソースプロジェクトで、ユーザーが無料でダウンロードして使用できるほか、カスタム開発も受け付けています。.
3.9 Kをとおして0表彰される
0ブックマークに登録
Llama OCR: 3行のコードで画像をMarkdownに変換するOCRライブラリ。
Llama OCRは、Llama 3.2 VisionをベースにしたOCR（光学式文字認識）ライブラリで、文書をMarkdown形式に変換します。このライブラリーはNutlopeによって開発され、Together AIがグラフ用に提供する無料のLlama 3.2インターフェースを使用しています。
4.4 Kをとおして0表彰される
0ブックマークに登録
Easydict
Easydictは、macOSユーザーのために設計されたシンプルでエレガントな辞書翻訳アプリです。複数の翻訳サービスとオフラインOCR認識のサポートにより、単語の検索やテキストの翻訳を簡単かつエレガントに行うことができます。Easydictは箱から出してすぐに動作し、入力翻訳、ストローク翻訳、スクリーンショット翻訳をサポートし、便利な多言語翻訳を体験できます。 ...
4.8 Kをとおして0表彰される
0ブックマークに登録
Datalab：専用のOCR認識AIモデル、PDF to Markdown（オープンソース/API）
Datalabは、OCR、レイアウト分析、PDFからMarkdownへの変換などに焦点を当てた高度なAIモデルを幅広く提供しています。これらのモデルは高性能であるだけでなく、使いやすくオープンソースです。プラットフォーム上のMarkerモデルは、表や数式を含むPDFを素早く正確にMarkdownに変換することができます。
5.4 Kをとおして0表彰される
0ブックマークに登録
TTime
TTimeは、InkTimeRecordがGitHubで公開しているプロジェクトで、シンプルで効率的な翻訳ソフトウェアです。TTimeはシンプルで効率的な翻訳ソフトウェアです。主に入力、スクリーンショット、ストローク、ホバーボールの翻訳機能を提供し、複数の翻訳ソースとテキスト認識サービスをサポートしているので、ユーザーは言語変換とテキスト認識を素早く行うことができます。さらに、TTime には...
3.9 Kをとおして0表彰される
0ブックマークに登録

AIプロフェッショナル・ツール

クイック照会ステーションAIツール