
dots.ocr: um modelo visual-linguístico unificado para análise de layout de documentos multilíngues
dots.ocr 是一个强大的多语言文档解析工具,基于 1.7B 参数的视觉-语言模型(VLM),能够同时进行布局检测和内容识别。它在 OmniDocBench 等基准测试中展现了最先进的性能,特别是在文本、表格和阅读顺序解析方面表现出色。...

SnippAI: uma ferramenta para reconhecer e analisar o conteúdo de capturas de tela usando IA
Snippai 是一个基于人工智能的截图工具,旨在通过先进的AI算法提升截图体验。它不仅能捕捉屏幕内容,还能对截图中的公式、文本、表格、图像等进行智能分析和转换。用户可以通过Snippai将复杂的视觉信息转化为可编辑的格式,如LaTeX公式...

AI Fast Station: uma ferramenta de análise de documentos para comparar modelos de OCR com um clique
AI快站是一个免费的开源OCR模型竞技场,专注于文档和图片的智能解析。用户可以上传PDF或图片文件,通过一键对比七大主流OCR模型,快速找到适合的解析方案。网站支持多种格式文件,操作简单,无需复杂安装。AI快站提供高精度识别、快速处理和安全...

OCRmyPDF: PDF digitalizado em texto pesquisável da ferramenta de código aberto
OCRmyPDF 是一个开源的命令行工具,专门用于为扫描的PDF文件添加光学字符识别(OCR)文本层,使其变为可搜索、可复制的文档。它基于Python开发,使用Tesseract OCR引擎,能准确识别图像中的文字,并将其嵌入PDF中,保持...

Docstrange: uma ferramenta para extrair dados de documentos e imagens e convertê-los em vários formatos
O Docstrange é uma ferramenta de processamento de documentos de código aberto que se concentra em extrair dados de documentos e imagens em vários formatos e convertê-los em formatos como Markdown, JSON, CSV ou HTML. Ele usa inteligência artificial e tecnologia OCR avançada, suporte para processamento de documentos PDF, Word, Exce...

Guava Intelligent Document Recognition: Ferramenta de reconhecimento inteligente para documentos e formulários off-line
O Guava Intelligent Document Recognition (intelligent_document_recognition) é um software de desktop de código aberto desenvolvido pelo desenvolvedor jiangnanboy, hospedado no GitHub, com foco no reconhecimento inteligente de documentos e formulários de processamento off-line. O software integra o reconhecimento óptico de caracteres (OCR) e a junção de formulários...

OCRFlux: ferramenta leve para conversão de PDFs e imagens em Markdown
O OCRFlux é uma ferramenta leve e de código aberto voltada para a conversão de arquivos PDF e imagens em um formato Markdown claro. Ela foi desenvolvida pela equipe do ChatDOC, com base em um grande modelo multimodal com 3B parâmetros, e pode ser executada em hardware comum, como a GTX 3090. A ferramenta é excelente para lidar com layouts de documentos complexos,...

VOP: ferramenta de OCR para extração de diagramas complexos e fórmulas matemáticas
Versatile OCR Program 是一个开源的光学字符识别(OCR)工具,专门为处理复杂的学术和教育文档设计。它能从PDF、图像等文件中提取文本、表格、数学公式、图表和示意图,并生成适合机器学习训练的结构化数据。支持多语言,包括英...

Analise automaticamente o conteúdo do PDF e extraia texto e tabelas de serviços de código aberto
它能自动分析PDF文档的布局,识别页面中的文字、标题、图片、表格、公式等元素,并判断它们的正确顺序。工具支持OCR功能,可以把扫描PDF转为可搜索文本。它基于Docker运行,提供两种模型:视觉模型(Vision Grid Transfor...

Bob.
O Bob é um software de tradução e OCR (Optical Character Recognition, reconhecimento óptico de caracteres) desenvolvido para a plataforma macOS. Os usuários podem usar o Bob para operações de tradução e OCR em qualquer aplicativo, com suporte a uma ampla variedade de serviços de tradução, incluindo Volcano, Tencent, Ali, Baidu, Youdao, Apple, Google, Microsoft,...

Ollama OCR: extração de texto de imagens usando modelos visuais no Ollama
Ollama OCR是一个强大的光学字符识别(OCR)工具包,它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用,也提供了用户友好的Streamlit网页应用程序界面。它支持多种视觉模型,包括...

Doc2X
Doc2X 是一款功能强大的文档图片公式识别与转换工具,致力于提供高效智能的文档处理解决方案。无论是学术科研论文、教辅书籍、企业文档还是财报研报,Doc2X 都能精准识别 PDF 中的表格和公式,并一键转换为 Word、LaTeX、HTML...

STranslate
STranslate 是一个由 WPF 开发的即用即走的翻译和 OCR 工具。该工具旨在提供高效、便捷的翻译和光学字符识别(OCR)功能,适用于各种语言和文本类型。STranslate 是开源项目,用户可以自由下载和使用,同时也接受定制开发...

Llama OCR: biblioteca de OCR que converte imagens em Markdown em três linhas de código usando a interface Llama 3.2 Vision gratuita
O Llama OCR é uma biblioteca de OCR (reconhecimento óptico de caracteres) baseada no Llama 3.2 Vision que converte documentos para o formato Markdown. A biblioteca foi desenvolvida pela Nutlope e usa a interface gratuita do Llama 3.2 fornecida pela Together AI para gráficos...

Easydict
Easydict 是一个专为 macOS 用户设计的简洁优雅的词典翻译应用。它支持多种翻译服务和离线 OCR 识别,能够轻松优雅地查找单词或翻译文本。Easydict 开箱即用,支持输入翻译、划词翻译和截图翻译,提供便捷的多语言翻译体验。 ...

Datalab: modelo de IA de reconhecimento de OCR dedicado, PDF para Markdown (código aberto/API)
O Datalab oferece uma variedade de modelos avançados de IA com foco em OCR, análise de layout, PDF para Markdown e muito mais. Esses modelos não são apenas de alto desempenho, mas também fáceis de usar e de código aberto. Os modelos Marker da plataforma podem converter PDF em Markdown com rapidez e precisão, incluindo tabelas e fórmulas.

Tempo
TTime 是由 InkTimeRecord 发布在 GitHub 上的项目,是一款简洁高效的翻译软件。它主要提供输入、截图、划词及悬浮球翻译等功能,支持多种翻译源和文字识别服务,让用户能够快速进行语言转换和文字识别。此外,TTime 也具...
voltar ao topo