Notes: https://colab.research.google.com/github/run-llama/llama_index/blob/main/docs/docs/examples/multi_modal/gpt4v_multi_modal_ retrieval.ipynb
Notes: https://colab.research.google.com/github/run-llama/llama_index/blob/main/docs/docs/examples/multi_modal/gpt4v_multi_modal_ retrieval.ipynb

Claude Code 是迄今为止最令人愉悦的 AI Agent 工作流之一。它不仅让代码的定向编辑和即兴工具开发变得不再恼人,其使用体验本身甚至称得上是一种享受。它拥有足够的自主性来完成有趣的任务,同时又不会像其他工具那样,让开发者产生突...

在构建基于检索增强生成(RAG)的知识库应用时,文档的预处理和切片(Chunking)是决定最终检索效果的关键一步。开源 RAG 引擎 RAGFlow 提供了多种切片策略,但其官方文档在方法细节和具体案例上缺乏清晰说明,给开发者带来诸多困惑...

在构建检索增强生成(RAG)系统时,开发者常常会遇到以下令人困惑的场景: 跨页表格的表头被遗留在上一页,导致数据失去关联。 模型面对模糊的扫描件,自信地给出完全错误的内容。 数学公式中的求和符号“Σ”被错误地识别为字母“E”。 文档中的水印...

让我们从一个简单的任务开始:安排一次会议。 当用户说:“嘿,看看明天能不能快速同步一下?” 一个仅依赖提示工程(Prompt Engineering)的AI可能会回复:“好的,明天可以。请问您希望安排在几点?” 这个回答虽然正确,但却机械且...

摘要 大型语言模型(LLMs)的出现开启了一种新的搜索引擎范式,这些搜索引擎利用生成模型来收集和总结信息以回答用户查询。我们将这种新兴技术统一在生成引擎(GE)的框架下,它可以生成准确且个性化的响应,迅速取代传统的搜索引擎,如Google和...

在 Manus 项目的初期,团队面临一个关键抉择:是基于开源模型训练一个端到端的代理模型,还是利用前沿模型强大的“上下文学习”能力来构建代理? 时间倒回十年,在自然语言处理领域,开发者甚至没有选择的余地。在那个属于 BERT 的时代,任何模...

在构建如 RAG 或 AI 代理这类人工智能系统时,检索的质量是决定系统上限的关键。开发者通常依赖两种主流检索技术:关键词搜索和语义搜索。 关键词搜索 (例如 BM25): 速度快,擅长精确匹配。但一旦用户提问的措辞改变,召回率就会下降。 ...
与一个总忘记谈话内容的朋友交流,每次都得从头说起,这种体验无疑是低效且令人疲惫的。然而,这恰恰是当前多数人工智能系统的常态。它们很强大,但普遍缺失一个关键要素:记忆。 要构建能够真正学习、演化和协作的 AI 智能体 (Agent),记忆并非...
Just type in the keyword Accessibility Bing SearchYou can quickly find all the AI tools on this site.

Video Face Swap

PolyBuzz: a free chat and role-playing platform for interacting with AI characters

RoboNeo: AI tool for generating and editing videos and images via chat

FaceFusion: Video Face Swap Enhancement Tool | Voice Synchronized Video Mouth Moves

Cursor Trial Period Reset Tool: Solve the problem of Cursor trial period limitations, easily reset the trial period to avoid upgrading to the professional version

Unlimited AI Chat: free unlimited AI chat tool

DeepMosaics: Automatically removing mosaics from, or adding mosaics to, images and videos

Codeium (Windsurf Editor): free AI code-completion and chat tool, Windsurf writes complete project code in a conversational manner

PocketPal AI

Jan: Open Source Offline AI Assistant, ChatGPT Replacement, Run Local AI Models or Connect to Cloud AI

beanbag

Sherpa-ONNX: Offline Speech Recognition and Synthesis with ONNXRuntime












Zhipu AI Input Method: Intelligent Voice Input and Editing Tools to Boost Writing Efficiency

Automusic: An AI-powered tool that transforms text and lyrics into original songs.

Soar2 AI: An AI video generation tool supporting Sora 2 and Veo 3.1 models

SociaVault: Real-time data scraping API tool supporting 25+ major social media platforms

OllaMan: Desktop Client for Visual Management of Local Large Models

Deep Swap AI: AI Face Swap Tool for Online Videos and Images

OceanBase SeekDB: A Distributed Database Engine with Hybrid SQL and Vector Retrieval Support

Chaoji Hao Mai: AI Model Fitting and Commercial Photo Generation Tool for E-commerce Sellers

OneAIFW: A Lightweight Open Source Firewall for Protecting the Privacy of Big Model Data

Identify Rock: an encyclopedic tool for quickly identifying rocks and minerals with photos

AI ASMR: an authoring tool for generating immersive ASMR audiovisual content

The Flux 2: Professional-grade image generation and editing tools based on the FLUX.2 model
Top
WeChat Scan Code Share

