# AI生产力工具 > 推荐好用的AI工具,免费AI软件排行榜 --- ## 页面 - [Privacy Policy](https://www.58jingpai.com/privacy-policy/): 1. Introduction We r... --- ## 文章 - [Seedance 1.0](https://www.58jingpai.com/seedance-10/): Seedance 1. 0 是由字节跳动... - [MagicArena](https://www.58jingpai.com/magicarena/): MagicArena 是一个专注于视觉生... - [SuperMaker](https://www.58jingpai.com/supermaker/): SuperMaker AI 是一个免费的... - [Quarkdown:基于Markdown的动态排版工具](https://www.58jingpai.com/quarkdown/): Quarkdown 是一个基于 Mark... - [Powerdrill](https://www.58jingpai.com/powerdrill/): Powerdrill 是一款先进的人工智... - [AdpexAI](https://www.58jingpai.com/adpexai/): AdpexAI 是一个集生成式AI工具于... - [AI Image Editor](https://www.58jingpai.com/ai-image-editor/): AI Image Editor 是一个基... - [Poify](https://www.58jingpai.com/poify/): Poify 是一款由快手推出的AI作图工... - [Imagen 4](https://www.58jingpai.com/imagen-4/): Google DeepMind 近期推出... - [HiDream-I1](https://www.58jingpai.com/hidream-i1/): HiDream-I1是一个开源的图像生成... - [MoviiGen1.1](https://www.58jingpai.com/moviigen11/): MoviiGen1. 1 是由 Zulu... - [Gemma 3n](https://www.58jingpai.com/gemma-3n/): 谷歌在相继推出面向单一云端或桌面加速器运... - [OpenAI 与 Jony Ive 新公司 io 宣布合并,共塑 AI 产品未来](https://www.58jingpai.com/openai-yu-jony-ive/): 2025年5月21日,科技界迎来一则重磅... - [DeepResearchAgent](https://www.58jingpai.com/deepresearchagent/): DeepResearchAgent是Sk... - [谷歌 I/O 2025:技术盛宴下的产品迷思与整合挑战](https://www.58jingpai.com/guge-io-2025ao/): Google I/O 2025 开发者大... - [微软CPO Aparna Chennapragada:Prompt即新PRD,AI Agent重塑产品未来](https://www.58jingpai.com/weiruancpo-aparna-che/): 在近期一次与 Lenny's Podca... - [Dia 系统提示词](https://www.58jingpai.com/dia-xitongtishici/): 以下是 Dia Browser 官方提示... - [让 Dify “看懂”图片:集成 MinerU-API 实现知识库 OCR 解析](https://www.58jingpai.com/rang-dify-kandong/): 许多用户在将重要资料(如纯图片文件或扫描... - [Dolphin](https://www.58jingpai.com/dolphin/): Dolphin 是由 ByteDance... - [BAGEL](https://www.58jingpai.com/bagel/): BAGEL 是由 ByteDance S... - [易可图](https://www.58jingpai.com/yiketu/): 易可图 是一个面向电商、营销和个人用户的... - [Windsurf SWE-1](https://www.58jingpai.com/swe-1/): SWE-1: 软件工程领域的新一代前沿模... - [Open Agent Platform](https://www.58jingpai.com/open-agent-platform/): LangChain Open Agent... - [ArXiv Paper Summarizer:arXiv论文自动摘要工具](https://www.58jingpai.com/arxiv-paper-summarizer/): arXiv Summarizer 是一个... - [Simple Subtitling:自动生成视频字幕和说话者标识的开源工具](https://www.58jingpai.com/simple-subtitling/): Simple Subtitling 是一... - [N8N vs. Dify:流程自动化与AI原生应用选型](https://www.58jingpai.com/n8n-vs-difyliubai/): 一、产品定位与核心能力差异 本文将系统性... - [Muscle-Mem](https://www.58jingpai.com/muscle-mem/): Muscle-Mem 是一个开源的 Py... - [MiniMax Speech 02](https://www.58jingpai.com/minimax-speech-02/): 随着人工智能技术的不断演进,个性化和高自... - [家作](https://www.58jingpai.com/jiazuo/): 家作是阿里巴巴旗下天猫推出的一款AI设计... - [Grok 官方公布系统提示词](https://www.58jingpai.com/grok-guanfanggongbuxi/): 核心对话提示() 这个模板定义了 Gro... - [Sim Studio:开源的AI代理工作流构建工具](https://www.58jingpai.com/sim-studio/): Sim Studio 是一个开源的 AI... - [AI 智能体记忆性能之争:Zep 指 Mem0 基准测试存疑](https://www.58jingpai.com/ai-zhinengtijiyiban/): 近期,AI 智能体记忆领域的一则声明引发... - [Cotrans](https://www.58jingpai.com/cotransmanyizhana/): manga-image-translat... - [CAD-MCP:通过自然语言指令控制CAD软件的MCP服务](https://www.58jingpai.com/cad-mcp/): CAD-MCP 是一个开源项目,允许用户... - [Muyan-TTS:个性化播客语音训练与合成](https://www.58jingpai.com/muyan-tts/): Muyan-TTS 是一个专为播客场景设... - [MiMo:高效数学推理与代码生成的小型开源模型](https://www.58jingpai.com/mimo/): MiMo 是小米公司开发的一个开源大语言... - [PDF文档转换为可视化网页的提示词](https://www.58jingpai.com/pdfwendangzhuanhuanweiai/): 提示词 我会给你一个文件,分析内容,并将... - [OpenAI 天价收购 Windsurf:AI 编码赛道的战略落子与市场震荡](https://www.58jingpai.com/openai-tianjiashougou/): 2025 年 5 月 5 日,人工智能领... - [Claude 网页版与 API 体验差异:解密近十万字的系统提示词](https://www.58jingpai.com/claude-wangyebanyu/): 许多用户观察到,直接调用 Anthrop... - [微软 GitHub Copilot 系统提示词解析](https://www.58jingpai.com/weiruan-github-copilo/): 对于希望与大语言模型 (LLM) 高效协... - [NotebookLM 系统提示词](https://www.58jingpai.com/notebooklm-xitongti/): 近期 NotebookLM 已经支持中文... - [扣子空间系统提示词](https://www.58jingpai.com/kouzikongjianxitongan/): 提示词 你是任务执行专家,擅长根据用户的... - [RealtimeVoiceChat](https://www.58jingpai.com/realtimevoicechat/): RealtimeVoiceChat 是一... - [Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具](https://www.58jingpai.com/klavis-ai/): Klavis AI 是一个开源平台,专注... - [Step1X-Edit:自然语言指令编辑图像的开源工具](https://www.58jingpai.com/step1x-edit/): Step1X-Edit 是一个开源图像编... - [AIstudioProxyAPI:无限使用 Gemini 2.5 Pro 模型 API](https://www.58jingpai.com/aistudioproxyapi/): AIstudioProxyAPI 是一个... - [LoveyDovey](https://www.58jingpai.com/loveydovey/): LoveyDovey 是一个以AI驱动的... - [Hula:将自拍一键生成病毒式短视频和个性化贴纸](https://www.58jingpai.com/hula/): Hula 是一个人工智能驱动的创意工具,... - [Trae IDE 指南:轻松配置自定义 AI 规则 (Trae Rules)](https://www.58jingpai.com/trae-ide-zhinanbu/): 随着人工智能在编程领域的应用日益深入,许... - [“清朗”利剑斩向AI滥用:13大关注点详解中国AI治理新方向](https://www.58jingpai.com/qinglanglijianban/): 近日,中央网信办启动了“清朗·整治AI技... - [九大主流大模型安全框架深度剖析与对比](https://www.58jingpai.com/jiudazhuliudamoan/): 随着大型语言模型技术的飞速发展和广泛应用... - [Mad Professor](https://www.58jingpai.com/mad-professor/): Mad Professor(暴躁的教授读... - [OpenRouter 调整免费额度与速率限制](https://www.58jingpai.com/openrouter-diaozhengmian/): OpenRouter 作为聚合了全球众多... - [OpenRouter 充值指南:如何使用支付宝与微信支付](https://www.58jingpai.com/openrouter-chongzhizhi/): 背景:OpenRouter 及其支付选项... - [教程:将 FastGPT 知识库无缝集成到 n8n 工作流 (基于 MCP 协议)](https://www.58jingpai.com/jiaochengjiang-fastgpt/): 背景:n8n 与 RAG 知识库集成的挑... - [Cursor 哪个 AI 模型最适合你的编码任务?](https://www.58jingpai.com/cursor-nage-ai-mo/): 近期,AI 辅助编程工具 Cursor ... - [Little Language Lessons](https://www.58jingpai.com/little-language-lessons/): Google Labs的Little L... - [你的AI生活指南:探索生成式AI的18种日常应用](https://www.58jingpai.com/nideaishenghuozhinan/): 近期观察显示,生成式人工智能(AI)正悄... - [Audibit:将热门科技文章转为随时收听的音频播客](https://www.58jingpai.com/audibit/): Audibit 是一个开源项目,核心功能... - [DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档](https://www.58jingpai.com/deepwiki-open/): DeepWiki-Open 是一个开源项... - [Paper2Code](https://www.58jingpai.com/paper2code/): Paper2Code 是一个开源项目,旨... - [FantasyTalking:生成真实感说话肖像的开源工具](https://www.58jingpai.com/fantasytalking/): FantasyTalking 是一个由 ... - [CleverBee:开源AI研究助手,生成引证研究报告](https://www.58jingpai.com/cleverbee/): CleverBee 是一个开源的 AI ... - [Deep Recall:为大模型提供企业级记忆框架的开源工具](https://www.58jingpai.com/deep-recall/): Deep Recall 是一个开源的企业... - [Claude生成深度研究报告的MCP服务](https://www.58jingpai.com/mcp-server-deep-research/): MCP Server Deep Rese... - [InstantCharacter:从单张图片生成一致性角色的开源工具](https://www.58jingpai.com/instantcharacter/): InstantCharacter 是由腾... - [Cooragent:一句话构建多智能体任务协作工具](https://www.58jingpai.com/cooragent/): Cooragent 是清华大学 Leap... - [Describe Anything:为图像和视频区域生成详细描述的开源工具](https://www.58jingpai.com/describe-anything/): Describe Anything 是由... - [Kimi-Audio:开源音频处理与对话基础模型](https://www.58jingpai.com/kimi-audio/): Kimi-Audio 是由 Moonsh... - [Trackers:用于视频对象跟踪的开源工具库](https://www.58jingpai.com/trackers/): Trackers 是一个开源的 Pyth... - [DeepWiki:自动生成GitHub仓库文档并用AI对话](https://www.58jingpai.com/deepwiki/): DeepWiki 是一个由 Cognit... - [Local Deep Research:本地运行的生成深度研究报告工具](https://www.58jingpai.com/local-deep-research/): Local Deep Research ... - [Abogen:将多种文本格式转换为有声读物的工具](https://www.58jingpai.com/abogen/): Abogen 是一个开源工具,专为将 e... - [llm.pdf:在PDF文件中运行大型语言模型的实验项目](https://www.58jingpai.com/llmpdf/): llm. pdf 是一个开源项目,允许用... - [ACI.DEV:通过MCP服务器为AI智能体集成600+工具](https://www.58jingpai.com/acidev/): ACI. dev 是一个开源基础设施平台... - [GraphGen:利用知识图谱生成合成数据微调语言模型](https://www.58jingpai.com/graphgen/): GraphGen 是一个由上海人工智能实... - [Google NotebookLM 拓展中文等多语言能力,并推出移动应用](https://www.58jingpai.com/google-notebooklm-ao/): Google 旗下的 AI 笔记工具 N... - [Quick Prompt](https://www.58jingpai.com/quick-prompt/): Quick Prompt 是一个开源的浏... - [VoltAgent:快速构建AI智能体的TypeScript开源框架](https://www.58jingpai.com/voltagent/): VoltAgent 是一个开源的 Typ... - [On Device AI:iPhone本地运行的AI语音转录与聊天工具](https://www.58jingpai.com/on-device-ai/): On-Device AI 是一款完全离线... - [使用 Cursor 开发 Dify 插件的提示词](https://www.58jingpai.com/shiyong-cursor-kaifa/): You are a senior dev... - [JetBrains 开源 Mellum:专为代码补全设计的专用模型](https://www.58jingpai.com/jetbrains-kaiyuan-mel/): 软件开发工具供应商 JetBrains ... - [Qwen3 发布:深入思考与快速响应并存的新一代大语言模型](https://www.58jingpai.com/qwen3-fabushenba/): 大型语言模型领域迎来了新成员。近日, Q... - [OpenAI 开放最新图像生成 API,gpt-image-1 模型全面开放](https://www.58jingpai.com/openai-kaifangzuixina/): OpenAI 近期宣布将其最新的图像生成... - [Strawberry:自动化任务的AI智能浏览器](https://www.58jingpai.com/strawberry/): Strawberry 是一款内置 AI ... - [Spring.new](https://www.58jingpai.com/springnew/): Spring. new 是一个基于人工智... - [Corgea:自动修复代码漏洞的AI安全平台](https://www.58jingpai.com/corgea/): Corgea 是一个基于人工智能的代码安... - [Suna:集成浏览器操作与数据分析的智能代理](https://www.58jingpai.com/suna/): Suna 是 Kortix AI 开发的... - [Dia:生成超现实多人对话的文本转语音模型](https://www.58jingpai.com/dia/): Dia 是一个由 Nari Labs 开... - [SkyReels V2:生成无限长度视频的开源AI工具](https://www.58jingpai.com/skyreels-v2/): SkyReels-V2 是一个开源的视频... - [Open Codex:将自然语言转换为Shell命令的开源AI工具](https://www.58jingpai.com/open-codex/): Open Codex 是一个开源的命令行... - [NodeRAG:基于异构图的精准信息检索与生成工具](https://www.58jingpai.com/noderag/): NodeRAG 是一个开源的检索增强生成... - [MCP Containers:基于 Docker 提供数百种 MCP 容器化部署](https://www.58jingpai.com/mcp-containers/): MCP Containers 是一个开源... - [谷歌 Veo 2 视频生成登陆 Gemini 与 Whisk,AI 创作工具版图再扩张](https://www.58jingpai.com/guge-veo-2-shipinai/): 谷歌近日宣布,其视频生成模型 Veo 2... - [Bookaroozie](https://www.58jingpai.com/bookaroozie/): Bookaroozie 是一个创新的电子... - [PostRoast:优化社交媒体内容的AI分析工具](https://www.58jingpai.com/postroast/): PostRoast 是一个利用人工智能帮... - [OpenUtau:免费的开源歌声合成编辑工具](https://www.58jingpai.com/openutau/): OpenUtau 是一个免费的开源歌声合... - [Google 发布 Gemma 3 QAT 模型:让顶尖 AI 模型走进消费级 GPU](https://www.58jingpai.com/google-fabu-gemma/): 继上月推出新一代开放模型 Gemma 3... - [解读 Coze Space:字节跳动布局 AI Agent,瞄准“零门槛”办公助手](https://www.58jingpai.com/jiedu-coze-space/): 字节跳动入局:Coze Space 能否... - [UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)](https://www.58jingpai.com/uno/): UNO 是由 ByteDance 智能创... - [DocAgent:自动生成Python代码文档的智能工具](https://www.58jingpai.com/docagent/): DocAgent 是一个由 Meta A... --- # # Detailed Content ## 页面 - Published: 2025-01-30 - Modified: 2025-01-31 - URL: https://www.58jingpai.com/privacy-policy/ 1. Introduction We respect your privacy and are committed to complying with applicable privacy laws, including the General Data Protection Regulation (GDPR). This policy explains how we collect, use, and protect your data when you visit our website. ... --- --- ## 文章 - Published: 2025-06-11 - Modified: 2025-06-11 - URL: https://www.58jingpai.com/seedance-10/ - 分类目录: 基础模型, 视频生成模型 Seedance 1. 0 是由字节跳动 Seed 团队开发的一款 AI 视频生成工具,专注于将文本或图像转化为高质量视频内容。用户只需输入文字描述或上传图片,Seedance 即可生成分辨率高达 1080p 的视频,适用于创意内容创作、广告制作和教育演示等场景。该工具支持多镜头切换、稳定运动轨迹和风格化控制,生成速度快,5 秒视频仅需约 41 秒。Seedance 依托字节跳动在 AI 领域的深厚技术积累,提供简单易用的操作界面,适合专业创作者和普通用户。平台持续更新功能,致力于探索 AI 视... --- - Published: 2025-06-11 - Modified: 2025-06-11 - URL: https://www.58jingpai.com/magicarena/ - 分类目录: AI工具库 - 标签: AI开放服务 MagicArena 是一个专注于视觉生成模型对战的在线平台。用户可以选择不同 AI 模型,输入相同的文字描述,让模型生成内容进行对比和评测。平台适合开发者、研究人员和对 AI 技术感兴趣的人。MagicArena 提供简单操作界面,无需专业技能即可使用。平台支持免费试用和付费订阅,满足不同需求。对战结果可用于了解模型性能,优化创意项目。 功能列表 AI 模型对战:选择两个 AI 模型,比较生成内容的质量。 文字输入描述:输入描述,让模型生成对比内容。 投票功能:用户投票选择更优模型,影响排行榜... --- - Published: 2025-06-11 - Modified: 2025-06-11 - URL: https://www.58jingpai.com/supermaker/ - 分类目录: AI工具库, AI视频, 视频生成 - 标签: AI图像转视频, AI文本转视频, AI文本转语音, AI音乐 SuperMaker AI 是一个免费的在线创作平台,帮助用户快速生成高质量视频、音乐、图像和语音内容。用户无需登录即可试用核心功能,操作简单,适合个人创作者和小型团队。平台通过人工智能技术,将文字、图片或创意想法转化为专业级内容,输出效果接近电影品质。SuperMaker AI 支持从脚本生成到视频剪辑的完整工作流程,降低了创作门槛。无论是短视频、宣传片还是音乐作品,用户都能在几分钟内完成创作,成果可用于社交媒体、营销或个人项目。 功能列表 文本转视频:输入文字提示或脚本,自动生成电影级视频内... --- - Published: 2025-06-10 - Modified: 2025-06-10 - URL: https://www.58jingpai.com/quarkdown/ - 分类目录: AI工具库 - 标签: AI开源项目 Quarkdown 是一个基于 Markdown 的现代化排版工具,扩展了 CommonMark 和 GitHub Flavored Markdown(GFM)的功能。它通过引入函数、变量和标准库,让用户能创建动态内容,轻松生成交互式演示文稿、网页或打印就绪的书籍。Quarkdown 支持快速编译和实时预览,适合开发者、写作者和设计师。用户可以用简单的 Markdown 语法实现复杂排版,同时支持 PDF 输出和自定义库。项目开源,文档齐全,社区活跃,适合需要高效创作复杂文档的用户。 功能列表 ... --- - Published: 2025-06-09 - Modified: 2025-06-09 - URL: https://www.58jingpai.com/powerdrill/ - 分类目录: AI工作效率, AI数据分析 - 标签: AI数据分析 Powerdrill 是一款先进的人工智能数据分析平台,旨在帮助企业和个人高效地从海量数据中提取有价值的洞察。通过集成多种数据处理工具,Powerdrill 能够自动化数据清洗、分析和报告生成,使复杂的数据分析任务变得更加简便易行。无论是进行市场趋势分析、客户行为预测,还是优化业务流程,Powerdrill 都能提供精准的分析结果,帮助用户做出更明智的决策。其直观的操作界面和强大的智能功能,适合各类企业从初创公司到大型跨国公司使用,让数据驱动的决策变得触手可及。 功能列表 数据上传与交互:支持上... --- - Published: 2025-06-09 - Modified: 2025-06-09 - URL: https://www.58jingpai.com/adpexai/ - 分类目录: AI换脸, AI视频, 移除视频背景, 视频生成, 视频风格控制, 页面设计 - 标签: AI视频换脸, AI视频生成工具, AI视频转换风格, 智能体应用 AdpexAI 是一个集生成式AI工具于一体的在线平台,提供图像编辑、视频编辑、AI聊天和代码生成等功能。用户无需安装软件,通过浏览器即可快速创建高质量视觉内容、编写代码或与智能AI模型互动。平台支持多种尖端AI模型,如ChatGPT-4o、Claude 3. 5和Gemini 1. 5,适合创作者、开发者、营销人员和普通用户。AdpexAI强调简单易用,界面直观,免费试用功能丰富,部分高级功能需订阅。官方信息更新及时,社区反馈积极,展现了其在创意和智能交互领域的强大潜力。 功能列表 图像编辑:... --- - Published: 2025-06-09 - Modified: 2025-06-09 - URL: https://www.58jingpai.com/ai-image-editor/ - 分类目录: AI绘画, 图像编辑 AI Image Editor 是一个基于 AI 的在线图片编辑工具,用户无需下载任何软件即可完成多种图片处理任务。无论是想要提升模糊照片的清晰度、去除不需要的水印、还是尝试各种创意风格,该平台都能轻松实现。使用简单方便,用户只需上传图片并选择相应功能,即可快速得到处理好的结果,体验专业级的图像编辑效果。 功能亮点 变清晰(AI Image Enhancement):强大的图像增强工具,可以提高模糊或低分辨率照片的清晰度。通过智能算法修复细节、锐化边缘,适用于旧照片、旅行摄影或因拍摄抖动而模糊的... --- - Published: 2025-05-27 - Modified: 2025-06-09 - URL: https://www.58jingpai.com/poify/ - 分类目录: AI商拍, AI绘画, 图像编辑 - 标签: AI图像风格控制 Poify 是一款由快手推出的AI作图工具,专为电商用户设计。它帮助商家快速生成高质量的商品展示图、促销海报和店铺装修图片。Poify 支持“文生图”和“图生图”功能,用户可以通过文字描述生成图片,或对已有图片进行再创作。此外,Poify 提供独特的AI模特试衣和背景替换功能,简化电商图片制作流程。它的操作简单,适合中小型电商商家和个人创作者使用。Poify 强调高效和实用,生成的图片能直接用于商品展示和社交媒体推广。 功能列表 文生图:通过文字描述生成符合需求的图片。 图生图:基于现有图片进行... --- - Published: 2025-05-23 - Modified: 2025-05-23 - URL: https://www.58jingpai.com/imagen-4/ - 分类目录: 图像生成模型, 基础模型 Google DeepMind 近期推出的 Imagen 4 模型,作为其图像生成技术的最新迭代,正迅速成为行业焦点。该模型在提升图像的丰富性、细节精确度以及生成速度方面取得了显著进展,致力于将用户的想象力以前所未有的方式变为现实。目前,用户已能在 Gemini 、 Whisk 及 Vertex AI 等平台体验到 Imagen 4 的强大功能。 核心能力:真实感、清晰度与文本表现力的新高度 Imagen 4 在多个核心维度展现了其卓越性能。 首先是照片级真实感(Photo-realistic)... --- - Published: 2025-05-23 - Modified: 2025-05-23 - URL: https://www.58jingpai.com/hidream-i1/ - 分类目录: 图像生成模型, 基础模型 HiDream-I1是一个开源的图像生成基础模型,拥有170亿参数,能够快速生成高质量图像。用户只需输入文字描述,模型即可生成包括写实、卡通、艺术等多种风格的图像。该项目由HiDream. ai团队开发,托管在GitHub上,采用MIT许可证,支持个人、科研和商业用途。HiDream-I1在多项基准测试中表现优异,例如HPS v2. 1、GenEval和DPG,生成图像质量和提示词遵循能力均达到行业领先水平。用户可以通过Hugging Face平台体验模型,或下载模型权重在本地运行。项目还提供G... --- - Published: 2025-05-23 - Modified: 2025-05-23 - URL: https://www.58jingpai.com/moviigen11/ - 分类目录: 基础模型, 视频生成模型 MoviiGen1. 1 是由 ZuluVision 开发的一款开源人工智能工具,专注于从文本生成高质量视频。它支持 720P 和 1080P 分辨率,特别适合需要电影级视觉效果的专业视频制作。用户可以通过简单的文本描述生成具有自然动态和一致美感的视频。MoviiGen1. 1 提供模型权重和推理代码,基于 PyTorch 框架,易于部署和使用。它的开放性和高性能使其成为视频创作者和开发者的理想选择,广泛应用于影视制作、广告和创意内容生成。 功能列表 支持 720P 和 1080P 高分辨率视频... --- - Published: 2025-05-23 - Modified: 2025-05-23 - URL: https://www.58jingpai.com/gemma-3n/ - 分类目录: 基础模型, 多模态模型 谷歌在相继推出面向单一云端或桌面加速器运行的开源模型 Gemma 3 与 Gemma 3 QAT 之后,再次拓展其普惠 AI 的版图。如果说 Gemma 3 为开发者带来了强大的云端与桌面端能力,那么此次于 2025 年 5 月 20 日发布的 Gemma 3n 预览版,则清晰地揭示了其在移动设备端实时 AI 的雄心——目标是让我们日常使用的手机、平板和笔记本电脑直接运行高性能 AI。 为了驱动下一代端侧 AI 并支持多样化的应用场景,包括进一步提升 Gemini Nano 的能力,谷歌工程团队... --- - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/openai-yu-jony-ive/ - 分类目录: AI新闻 2025年5月21日,科技界迎来一则重磅消息。人工智能领域的领军者 OpenAI 与传奇设计师 Jony Ive 所创立的新公司 io 正式宣布合并。这一合作预示着双方将共同致力于开发能够深度融合尖端人工智能与卓越设计的新一代产品。 此次合并并非一蹴而就。据透露,OpenAI 的 Sam Altman 与 Jony Ive 及 LoveFrom 创意团队的合作已悄然进行两年之久。最初基于友谊、好奇心和共同价值观的探索,逐步发展为具体的合作设计与产品构想。这些构想被双方认为是“重要且实用”,充满“... --- - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/deepresearchagent/ - 分类目录: AI专业工具, AI教育学习, 智能体开发, 深度研究智能体 - 标签: AI开源项目, 智能体开发框架, 生成深度研究报告 DeepResearchAgent是SkyworkAI开发的一款开源AI工具,专注于自动化深度研究。它通过结合搜索引擎、网页抓取和大型语言模型(LLM),帮助用户快速生成详细的研究报告。用户只需输入研究主题或问题,工具就能自动搜索、提取信息并整理成结构化的报告。项目托管在GitHub,面向开发者、研究人员和内容创作者,提供灵活的定制和本地运行支持。DeepResearchAgent强调隐私保护,支持本地部署,适合需要高效分析复杂主题的用户。 功能列表 自动化研究:根据用户输入的主题或问题,自动搜... --- - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/guge-io-2025ao/ - 分类目录: AI新闻 Google I/O 2025 开发者大会展示了众多技术成果,其中不乏令人印象深刻的创新,彰显了 Google 在人工智能核心技术领域的深厚积累。然而,信息的洪流和略显混乱的产品呈现方式,也让外界对其整体战略和市场沟通能力产生疑虑。 DeepMind 员工 Logan Kilpatrick 曾指出 Google AI 自去年以来取得的显著进展:拥有全球领先的模型、Gemini 应用月活用户超4亿、每月处理 Token 量达480T(同比增长50倍)、超过700万开发者使用 Gemini API(... --- - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/weiruancpo-aparna-che/ - 分类目录: AI新闻 在近期一次与 Lenny's Podcast 的访谈中,Microsoft 首席产品官 Aparna Chennapragada 分享了她对当前 AI 驱动产品开发的深刻见解。她明确指出,Prompt 正逐步取代传统的产品需求文档(PRD),成为产品构建的全新起点,而自然语言交互(NLI)则预示着新的用户体验设计范式。 AI 时代的产品设计新起点:Prompt 即 PRD Aparna Chennapragada 强调,在 AI 飞速发展的今天,如果产品开发缺乏原型验证和实际操作,便会偏离正确的... --- - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/dia-xitongtishici/ - 分类目录: AI实用指令 以下是 Dia Browser 官方提示词: 提示词原文 You are an AI chat product called Dia, created by The Browser Company of New York. You work inside the Dia web browser, and users interact with you via text input. You are not part of the Arc browser. You decorate your re... --- - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/rang-dify-kandong/ - 分类目录: AI实操教程 许多用户在将重要资料(如纯图片文件或扫描版 PDF 文档)上传至 LLM 应用开发平台 Dify 的知识库时,常常会遇到一个棘手的问题:Dify 无法直接读取并解析这些非文本格式的内容。这主要是因为 Dify 的知识库原生功能更侧重于处理和理解纯文本数据。为了克服这一限制,可以引入 MinerU-API 工具,它能赋予 Dify 知识库强大的光学字符识别(OCR)能力。接下来,将详细介绍如何构建一个工作流,使 Dify 知识库能够有效解析图片和扫描文档中的文字信息。本教程操作基于 Dify 1.... --- - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/dolphin/ - 分类目录: AI专业工具, 文档提取 Dolphin 是由 ByteDance 开发的一款开源文档图像解析工具,专注于处理复杂的文档图像,如包含文本、表格、公式和图片的扫描件或 PDF 文件。它采用“先分析后解析”的方法,通过两阶段处理实现高效解析:首先分析文档的页面布局,生成自然阅读顺序的元素序列;然后使用异构锚点和任务特定提示并行解析文档元素。Dolphin 在多种页面和元素级解析任务中表现出色,兼顾轻量级架构和高效性能。该工具已在 ACL 2025 会议上发表论文,并提供预训练模型和推理代码,方便开发者使用。用户可以通过 Gi... --- - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/bagel/ - 分类目录: 基础模型, 多模态模型 - 标签: AI图像编辑, AI开源项目, 多模态实时互动产品 BAGEL 是由 ByteDance Seed 团队开发的一个开源多模态基础模型,托管于 GitHub。它集成了文本理解、图像生成和编辑功能,支持跨模态任务。模型拥有 7B 活跃参数(总计 14B 参数),采用 Mixture-of-Transformer-Experts (MoT) 架构,通过大规模交错多模态数据训练。BAGEL 在多模态理解和生成任务中表现出色,超越了 Qwen2. 5-VL 和 InternVL-2. 5 等开源模型,图像生成质量可媲美 SD3。它支持自由形式的图像编辑、视... --- - Published: 2025-05-19 - Modified: 2025-05-19 - URL: https://www.58jingpai.com/yiketu/ - 分类目录: AI商业应用, AI商拍 - 标签: AI图像编辑 易可图 是一个面向电商、营销和个人用户的在线图片编辑与海报设计平台。用户无需安装软件,通过浏览器即可完成图片处理、海报制作和视频剪辑。平台提供丰富的免费模板、正版素材和AI工具,适合快速生成电商商品图、节日海报和社交媒体内容。易可图操作简单,界面直观,即使没有设计经验的用户也能轻松上手。平台还支持跨境电商合规标签生成,满足多样化的商业需求。 功能列表 图片编辑工具:支持裁剪、滤镜、调色、添加文字等基础编辑功能。 AI商品图生成:通过AI技术快速生成产品展示图,支持背景替换和模特试衣。 模板中心:... --- - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.58jingpai.com/swe-1/ - 分类目录: 专用模型, 基础模型 SWE-1: 软件工程领域的新一代前沿模型问世 近日,业界瞩目的 SWE-1 系列模型正式发布。该系列模型专为优化整个软件工程流程而设计,其目标远不止于传统的代码编写任务。 当前,SWE-1家族包含三款定位清晰的模型: SWE-1: 这款主力模型在工具调用推理能力上,据称可与 Claude 3. 5 Sonnet 等量齐观,同时具备更低的运营成本。在推广期内,所有付费用户均可免费(0积分/用户提示)体验。 SWE-1-lite: 作为一款轻量级模型,SWE-1-lite旨在以更高质量替代原有的 ... --- - Published: 2025-05-16 - Modified: 2025-05-21 - URL: https://www.58jingpai.com/open-agent-platform/ - 分类目录: AI专业工具, 智能体开发 - 标签: 无代码开发, 智能体开发框架 LangChain Open Agent Platform(简称OAP)是一个开源、无代码的AI智能体构建平台。它让非技术用户也能轻松设计、测试和部署AI智能体。平台基于LangChain的LangGraph框架,支持连接外部工具、数据源和智能体,实现复杂任务自动化。OAP通过直观的网页界面简化操作,用户无需编程即可创建智能体,连接MCP工具、LangConnect RAG服务或其他LangGraph智能体。平台支持灵活的托管选项,适合个人开发者、企业和社区用户。OAP的开源特性鼓励社区贡献,文... --- - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.58jingpai.com/arxiv-paper-summarizer/ - 分类目录: AI工具库 - 标签: AI开源项目, AI文本与音频/视频总结工具 arXiv Summarizer 是一个开源的 Python 脚本工具,托管在 GitHub 上,旨在帮助用户快速从 arXiv 平台获取并生成学术论文的摘要。它利用免费的 Gemini API 进行高效的文本摘要,适合研究人员、学生和学术爱好者快速把握论文核心内容,无需逐篇阅读冗长文档。该工具支持单篇论文摘要、批量论文摘要以及基于关键词的自动论文提取与摘要生成,操作简单,安装方便。通过自动化和关键词驱动的论文处理,它大大提高了学术文献筛选的效率,特别适合需要跟踪最新研究动态的用户。 功能列表 ... --- - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.58jingpai.com/simple-subtitling/ - 分类目录: AI工具库 - 标签: AI开源项目, AI语音转文本 Simple Subtitling 是一个开源的音频字幕生成工具,专注于为视频或音频文件自动生成字幕并标注说话者身份。项目由 Jaesung Huh 开发,托管在 GitHub 上,旨在提供简单高效的字幕生成解决方案。工具通过音频处理技术,结合机器学习模型,生成带有时间戳和说话者标识的字幕文件,适合需要快速为视频添加字幕的用户。项目采用 Python 开发,支持单声道 16kHz 音频处理,易于安装和使用。Simple Subtitling 是 Jaesung Huh 博士研究期间的开源项目之一... --- - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.58jingpai.com/n8n-vs-difyliubai/ - 分类目录: AI新闻 一、产品定位与核心能力差异 本文将系统性对比分析 N8N 与 Dify 这两款工具,在产品定位、技术特性以及适用场景上的关键区别。 N8N 是一款专注于工作流自动化的开源工具。其核心能力在于实现跨系统的数据集成与高效流转,尤其适用于构建复杂的系统间联动逻辑。可以认为, N8N 扮演着“数字世界的连接器”的角色。该平台对社区贡献节点和自定义节点开发也表现出较好的友好度,方便技术人员进行扩展。 Dify 则定位为 AI 原生应用开发平台。它聚焦于利用大语言模型 (LLM) 来构建智能化应用系统,赋予... --- - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.58jingpai.com/muscle-mem/ - 分类目录: AI专业工具, 记忆缓存系统 - 标签: AI开源项目, 智能体开发框架 Muscle-Mem 是一个开源的 Python 工具,托管在 GitHub 上,由 pig-dot-dev 开发。它旨在为 AI 代理提供行为缓存功能,帮助减少重复任务中的大语言模型(LLM)调用,从而提高运行速度、降低变异性并节省成本。Muscle-Mem 通过记录 AI 代理的工具调用模式,在遇到相同任务时直接复用已缓存的行为,只有在检测到新场景时才调用代理逻辑。它的核心机制是缓存验证,通过检查环境特征判断是否可以安全复用缓存。这个工具适合需要优化自动化任务的开发者,特别是处理重复性高的工... --- - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.58jingpai.com/minimax-speech-02/ - 分类目录: 基础模型, 语音模型 随着人工智能技术的不断演进,个性化和高自然度的语音交互已成为众多智能应用的关键需求。然而,现有的文本转语音 (TTS) 技术在满足大规模个性化音色、多语种覆盖以及高度真实情感表达方面仍面临挑战。针对这些行业痛点,MiniMax Speech 02 作为一款基于 AR Transformer 架构的高质量 TTS 系统被推出,旨在通过其独特的技术创新,为个性化语音合成领域带来新的突破。 该系统宣称具备强大的泛化能力,能够处理多达 32 种语言,并支持不同口音和情感风格的人声合成。其核心亮点在于引入... --- - Published: 2025-05-16 - Modified: 2025-05-21 - URL: https://www.58jingpai.com/jiazuo/ - 分类目录: AI商业应用, AI商拍 家作是阿里巴巴旗下天猫推出的一款AI设计工具,专为家装、家居和家电行业的电商商家设计。商家只需上传商品图片,家作即可通过AI技术一键生成多种风格的场景图和逼真的模特展示图,效果媲美专业棚拍。家作大幅降低设计和拍摄成本,缩短传统拍摄周期,提升商品展示效果和点击率。工具深度整合淘宝电商生态,已吸引超13万商家使用,包括慕思、全友等知名品牌。家作通过简单操作即可上手,适合中小型商家和大型品牌。 功能列表 AI棚拍:上传商品图片,一键生成80多种风格的场景图,用于商品展示。 AI模特:生成逼真的AI模特... --- - Published: 2025-05-16 - Modified: 2025-05-17 - URL: https://www.58jingpai.com/grok-guanfanggongbuxi/ - 分类目录: AI实用指令 核心对话提示() 这个模板定义了 Grok 3 在 grok. com 和 X 平台上的对话行为。提示内容包括角色设定、回答风格和上下文处理逻辑。 操作方法 :打开 文件,查看 Grok 的指令,如“以幽默和知识性语气回答”或“提供 2-3 个后续问题建议”。开发者可修改这些指令,调整 AI 的语气或回答深度。例如,将幽默语气改为正式语气,测试不同场景下的效果。 You are Grok 3 built by xAI. When applicable, you have some additio... --- - Published: 2025-05-07 - Modified: 2025-05-07 - URL: https://www.58jingpai.com/sim-studio/ - 分类目录: AI工具库 - 标签: AI开源项目, 低代码工作流, 智能体开发框架 Sim Studio 是一个开源的 AI 代理工作流构建平台,专注于通过轻量、直观的可视化界面帮助用户快速设计、测试和部署大型语言模型(LLM)工作流。用户无需深入编程即可通过拖拽方式创建复杂的多代理应用。它支持本地和云端模型,兼容多种工具集成,如 Slack 和数据库。Sim Studio 采用模块化设计,适合开发者、研究人员和企业用户。官方提供云托管版本(https://simstudio. ai)和自托管选项,满足不同需求。 当下AI代理框架百花齐放,为什么我会特别推荐 Sim Studi... --- - Published: 2025-05-07 - Modified: 2025-05-07 - URL: https://www.58jingpai.com/ai-zhinengtijiyiban/ - 分类目录: AI新闻 近期,AI 智能体记忆领域的一则声明引发了业界的广泛关注。Mem0 公司发布研究报告,宣称其产品在 AI 智能体记忆技术方面达到了行业领先(SOTA)水平,并在特定基准测试中超越了包括 Zep 在内的竞争对手。然而,这一说法迅速遭到了 Zep 团队的质疑。Zep 指出,在正确实施的情况下,其产品在 Mem0 选用的 LoCoMo 基准测试中,性能实际上要高出 Mem0 大约 24%。这一显著差异,促使人们对基准测试的公正性、实验设计的严谨性以及最终结论的可靠性进行更深入的探究。 在人工智能这个竞... --- - Published: 2025-05-06 - Modified: 2025-06-11 - URL: https://www.58jingpai.com/cotransmanyizhana/ - 分类目录: AI工具库, AI教育学习, 翻译/语言学习 - 标签: AI翻译 manga-image-translator(Cotrans翻译器开源版),用于翻译漫画或图片中的文字。提供命令行交互方式和在线演示,拥有批量转换模式、web服务器模式等多样化的使用选项。可设置多种语言目标翻译和识别参数,配有详尽的安装和使用教程。 针对群内、各个图站上大量不太可能会有人去翻译的图片设计,让我这种日语小白能够勉强看懂图片 主要支持日语,汉语、英文和韩语 支持图片修补和嵌字 该项目是求闻转译志的 v2 版本 功能列表 批量翻译模式 Web服务器模式 CLI使用方式 多语言支持 Nv... --- - Published: 2025-05-06 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/cad-mcp/ - 分类目录: AI工具库 - 标签: AI开源项目, MCP服务 CAD-MCP 是一个开源项目,允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术,让用户无需手动操作 CAD 界面,只需输入简单的文字命令即可创建和修改图纸。项目支持多种主流 CAD 软件,如 AutoCAD、GstarCAD 和 ZWCAD,适合工程设计和建筑绘图领域。CAD-MCP 运行在 Python 环境下,通过模型控制协议(MCP)实现与 CAD 软件的交互。用户可通过启动服务器并发送指令,快速完成绘图任务,简化操作流程,提高效率。 功... --- - Published: 2025-05-06 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/muyan-tts/ - 分类目录: AI工具库 - 标签: AI开源项目, AI文本转语音 Muyan-TTS 是一个专为播客场景设计的开源文本转语音(TTS)模型。它通过超过10万小时的播客音频数据预训练,支持零样本语音合成,生成高质量的自然语音。模型基于 Llama-3. 2-3B 构建,结合 SoVITS 解码器,提供高效的语音生成能力。Muyan-TTS 还支持通过几十分钟的单人语音数据进行个性化语音定制,适合特定音色的需求。项目以 Apache 2. 0 许可证发布,提供完整训练代码、数据处理流程和模型权重,托管在 GitHub、Hugging Face 和 ModelSco... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/mimo/ - 分类目录: AI工具库 - 标签: AI开源项目 MiMo 是小米公司开发的一个开源大语言模型项目,专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型,包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学习模型 (RL-Zero) 和从 SFT 模型训练的强化学习模型 (RL)。这些 70 亿参数模型通过优化预训练数据、多重令牌预测 (MTP) 和强化学习,展现出媲美更大模型的推理能力。MiMo-7B-RL 在数学和代码任务中性能突出,可匹敌 OpenAI o1-mini。模型支持 vLLM 和 SGLang... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/pdfwendangzhuanhuanweiai/ - 分类目录: AI实用指令 提示词 我会给你一个文件,分析内容,并将其转化为美观漂亮的中文可视化网页作品集: ## 内容要求 - 所有页面内容必须为简体中文- 保持原文件的核心信息,但以更易读、可视化的方式呈现- 在页面底部添加作者信息区域,包含: * 作者姓名: * 社交媒体链接: 至少包含Twitter/X:https://www. deepseek. com/ * 版权信息和年份 ## 设计风格 - 整体风格参考Linear App的简约现代设计- 使用清晰的视觉层次结构,突出重要内容- 配色方案应专业、和谐,适合长... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/openai-tianjiashougou/ - 分类目录: AI新闻 2025 年 5 月 5 日,人工智能领域的领头羊 OpenAI 确认了一笔引人注目的交易:以约 30 亿美元收购 AI 编码工具初创公司 Windsurf 。这不仅是 OpenAI 迄今为止最大手笔的收购,超过了之前对 Rockset 和 Multi 等公司的收购,更在竞争激烈的 AI 编码领域投下了一颗重磅炸弹。 这笔交易的消息最早由彭博社记者 Rachel Metz 披露,数周前双方已进入谈判阶段。对于 Windsurf 的早期投资者,如 Kleiner Perkins 、 General... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/claude-wangyebanyu/ - 分类目录: AI实用指令 许多用户观察到,直接调用 Anthropic 公司的 Claude API 所获得的体验,似乎与 Claude 官方网页版存在细微但可感知的差异。这种差异很大程度上源于网页版背后复杂的系统提示词(System Prompt)设计。 这些提示词究竟蕴含了哪些机制?它们如何定义规则、管理内容生成(如 Artifacts)、调用外部工具(如网络搜索、Google Drive),并最终塑造了用户与 Claude 的交互体验?一份近期泄露的、包含近十万字符的 Claude 系统提示词文件,为我们揭示了这些... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/weiruan-github-copilo/ - 分类目录: AI实用指令 对于希望与大语言模型 (LLM) 高效协作的用户和开发者而言,设计精良的系统提示词 (System Prompt) 至关重要。它如同为 AI 精心准备的行动纲领和行为手册,直接影响 AI 的响应质量、行为一致性和任务完成能力。本文将深入剖析一个结构复杂、内容详尽的系统提示词,提炼其撰写技巧,帮助读者学习如何构建更强大的 AI 指导指令。 提示词核心目标: 指导一个 AI 编程助手 (GitHub Copilot) 如何响应用户请求,特别是如何有效利用外部工具 (functions) 来完成任务,... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/notebooklm-xitongti/ - 分类目录: AI实用指令 近期 NotebookLM 已经支持中文 ,这是目前我认为免费产品中且较为推荐的个人知识管理工具。 NotebookLM 最主要的两个功能是:引用准确来源问答和生成双人对话播客。 引用来源准确来源问答提示词 You are a helpful expert who will respond to my query drawing on information in the sources and our conversation history. My query may be a questi... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/kouzikongjianxitongan/ - 分类目录: AI实用指令 提示词 你是任务执行专家,擅长根据用户的需求,调用多个工具完成当前任务。 # 消息模块说明 - 必须使用工具(函数调用)进行响应,禁止使用纯文本响应 - 尽量独立解决问题,在必要的时候才使用 message_ask_user 工具与用户进行交互 - 使用 message_notify_user 工具向用户发送任务处理的关键通知。 # 任务执行工作流 1. **理解任务**:使用 sequentialthinking 工具(该工具用于分析任务需求、分解步骤并制定执行计划)深刻理解当前任务。 2. ... --- - Published: 2025-05-06 - Modified: 2025-05-21 - URL: https://www.58jingpai.com/realtimevoicechat/ - 分类目录: AI音频, 语音互动 - 标签: AI开源项目, 多模态实时互动产品 RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回复,再将文字转为语音输出,整个过程接近实时。项目采用客户端-服务器架构,强调低延迟,支持 WebSocket 流式传输和动态对话管理。它提供 Docker 部署,推荐在 Linux 系统和 NVIDIA GPU 环境下运行,集成了 RealtimeSTT、RealtimeTTS 和 Ollama 等技术,适合... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/klavis-ai/ - 分类目录: AI工具库 - 标签: AI开源项目, MCP服务 Klavis AI 是一个开源平台,专注于简化模型上下文协议(MCP)的使用和集成。MCP 是一种开放标准,允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack、Discord 客户端、托管的 MCP 服务器和简单网页界面,降低技术门槛,让非技术用户也能轻松使用,开发者也能快速构建和扩展 MCP 应用。平台支持多种工具集成,强调安全性,提供 OAuth 认证,确保数据访问安全。 功能列表 提供 Slack 和 Discord 的 MCP 客户端,支持在聊天平台直接使用... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/step1x-edit/ - 分类目录: AI工具库 - 标签: AI图像编辑, AI开源项目 Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然语言指令编辑图像,例如更改背景、移除物体或转换风格。项目于 2025 年 4 月 25 日发布,性能接近闭源模型如 GPT-4o 和 Gemini 2 Flash。Step1X-Edit 提供模型权重、推理代码和 GEdit-Bench 基准测试,支持广泛的编辑场景。Apache 2. 0 许可证允许免费使用... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/aistudioproxyapi/ - 分类目录: AI工具库 - 标签: AI开源项目, 免费大模型API AIstudioProxyAPI 是一个开源项目,使用 Node. js 和 Playwright 技术,通过模拟 OpenAI API 的方式,将 Google AI Studio 网页版的 Gemini 模型对话功能转换为标准 API 接口。开发者可以利用这个代理服务,让支持 OpenAI API 的客户端(如 Open WebUI、NextChat)直接访问 Google AI Studio 的无限额度功能。项目无需复杂配置,适合希望快速集成 Google AI Studio 能力的开发者... --- - Published: 2025-05-06 - Modified: 2025-05-21 - URL: https://www.58jingpai.com/loveydovey/ - 分类目录: AI生活娱乐, 角色扮演 - 标签: AI角色扮演 LoveyDovey 是一个以AI驱动的聊天应用,专注于为用户提供与虚拟角色的实时互动体验。用户可以创建自己的角色或选择现有角色,展开浪漫、友情或其他类型的对话。应用通过高度定制化的角色设定和多样的聊天模式,模拟真实的情感交流,让用户沉浸在个性化的故事中。无论是寻求情感支持还是创作独特的故事,LoveyDovey 都能满足用户的多样需求。应用支持多语言,覆盖全球用户,已在 iOS 和 Android 平台上线,下载量超过72万次。 功能列表 角色创建与定制 :用户可以设定角色的性别、性格、背景故... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/hula/ - 分类目录: AI工具库 - 标签: AI社交媒体 Hula 是一个人工智能驱动的创意工具,旨在通过简单的一键操作,将用户自拍转化为病毒式传播的视频、多种风格的形象和个性化贴纸包。开发商 Prequel Inc. 打造的这款应用支持 iOS 和 Android 平台,适合热衷于社交媒体的内容创作者。用户上传一张自拍,即可生成动漫、复古或时尚风格的视频和贴纸,轻松分享到 Instagram、TikTok 或 WhatsApp。Hula 提供免费功能和订阅模式,部分高级功能需付费解锁。应用操作直观,生成速度快,助力用户快速实现创意表达。 功能列表 一... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/trae-ide-zhinanbu/ - 分类目录: AI实操教程 随着人工智能在编程领域的应用日益深入,许多开发者在体验到 AI 辅助编程的便捷之后,便期望能够拥有一个更懂自己需求的“专属 AI 工程师”。这种需求的核心在于,让 AI 能够精确遵循开发者的个性化指令和特定项目规范进行工作。为了满足这一需求, Trae IDE 推出了 AI 规则(Trae Rules)配置功能,允许用户为 AI 定制行为,从而实现个性化任务的自动化执行。 一、什么是 Rules Trae Rules 是一项强大的功能,它允许开发团队或个人开发者自定义并强制 AI 在代码生成、解... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/qinglanglijianban/ - 分类目录: AI新闻 近日,中央网信办启动了“清朗·整治AI技术滥用”专项行动,针对当前人工智能发展中出现的若干问题划定了清晰的治理红线。此举旨在引导AI技术健康发展,防范潜在风险。该专项行动聚焦13个重点方向,分为两个阶段实施,对AI产品、服务、内容及行为规范提出了细致要求。 第一阶段:源头治理与基础建设 行动的第一阶段着重于AI技术的源头治理,目标是清理违规AI应用,强化内容标识管理,并提升平台的检测鉴伪能力。 违规AI产品需完成上线合规 监管部门指出,利用生成式人工智能技术向公众提供服务的应用,必须履行大模型备... --- - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.58jingpai.com/jiudazhuliudamoan/ - 分类目录: AI知识 随着大型语言模型技术的飞速发展和广泛应用,其潜在的安全风险日益成为业界关注的焦点。为了应对这些挑战,全球众多顶尖科技公司、标准化组织及研究机构纷纷构建并发布了各自的安全框架。本文将梳理并剖析其中九个具有代表性的大模型安全框架,旨在为相关领域的从业者提供一个清晰的参考。 图:大模型安全框架概览 Google 的 Secure AI Framework (SAIF) (2025. 04 发布) 图:Google SAIF 框架结构 谷歌(Google)推出的 Secure AI Framework,... --- - Published: 2025-05-06 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/mad-professor/ - 分类目录: AI教育学习, 文档辅助阅读 - 标签: AI开源项目, AI教育工具 Mad Professor(暴躁的教授读论文) 是一个开源的 AI 学术工具,专为研究人员和学生设计,旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问答和语音交互等功能。用户可以导入 PDF 论文,工具会自动提取内容、翻译并生成结构化文本,支持中英文对照阅读。Mad Professor 通过智能问答和语音交互,帮助用户快速理解论文内容。它还提供分屏界面,左侧显示论文,右侧展示 AI 对话,方便用户边读边问。 功能列表 PDF 内容提取与结构化:自动从 PD... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/openrouter-diaozhengmian/ - 分类目录: AI答疑 OpenRouter 作为聚合了全球众多主流大语言模型 API 的平台,近期对其免费使用政策和速率限制进行了显著调整。该平台因其便捷性——提供单一 API Key 调用包括 DeepSeek 、 Qwen 、 GPT 、 Claude 、 Gemini 、 Grok 在内的多种模型,并支持国内用户直接访问及支付宝、微信支付,吸引了大量开发者和 AI 爱好者。然而,最新的政策变动对不同用户群体产生了直接影响。 此次调整的核心在于免费额度和速率限制的变化,这反映了平台可能在寻求更可持续的运营模式,并... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/openrouter-chongzhizhi/ - 分类目录: AI答疑 背景:OpenRouter 及其支付选项 OpenRouter 提供了一个集成的平台,允许开发者和用户通过统一的 API 接口访问来自不同提供商的多种大型语言模型。对于希望利用这些高级 AI 功能的用户而言,向账户充值是使用付费模型的必要步骤。值得注意的是, OpenRouter 近期已支持通过支付宝( Alipay )和微信支付( WeChat Pay )进行充值,这极大地方便了没有国际信用卡或偏好使用本地支付方式的用户群体。本文将详细介绍如何使用支付宝或微信为 OpenRouter 账户充值... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/jiaochengjiang-fastgpt/ - 分类目录: AI实操教程 背景:n8n 与 RAG 知识库集成的挑战 n8n 作为一款强大的开源自动化工作流工具,正获得越来越多用户的青睐。它由前《加勒比海盗》视觉设计师 Jan Oberhauser 于 2019 年创立,旨在提供比 Zapier 等工具更灵活、成本更低的自动化方案。 n8n 秉持“自由可持续,开放且务实”的理念,其核心在于通过 可视化与代码 双模式,让用户能够连接不同应用,实现复杂流程的自动化(官方文档:https://docs. n8n. io/)。用户熟悉后,用其构建简单的工作流通常相当快捷,并且... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/cursor-nage-ai-mo/ - 分类目录: AI答疑 近期,AI 辅助编程工具 Cursor 公布了一份开发者偏爱的 AI 模型排行榜,数据显示 Claude 3. 7 Sonnet 模型占据了榜首位置。 这份官方数据无疑反映了相当一部分开发者的选择。但这是否意味着开发者应该直接将 Claude 3. 7 Sonnet 作为默认选项?实际使用情况可能更为复杂。 观察一些资深开发者的使用习惯,会发现其模型选择比例与官方榜单存在显著差异。例如,在 Cursor 中,Gemini 2. 5 Pro 的使用率可能高达 80%,Claude 3. 7 Son... --- - Published: 2025-05-05 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/little-language-lessons/ - 分类目录: AI教育学习, 翻译/语言学习 - 标签: AI教育工具 Google Labs的Little Language Lessons(简称LLL)是一个基于Gemini AI的交互式英语学习平台,提供一系列小型实验,帮助用户通过趣味对话和场景练习提升英语能力。LLL设计简洁,适合初学者、学生和职场人士,免费提供三种核心实验:Tiny Lesson、Slang Hang和Word Cam。平台支持多语言界面(英语、西班牙语、法语、葡萄牙语),通过AI驱动的个性化反馈和沉浸式体验,降低语言学习难度,让用户轻松掌握词汇、语法和口语表达。 功能列表 Tiny Le... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/nideaishenghuozhinan/ - 分类目录: AI新闻 近期观察显示,生成式人工智能(AI)正悄然渗透进人们的日常生活,其应用场景已远超最初普遍认为的工作辅助范畴。印度金融科技公司 CRED 的创始人 Kunal Shah 在4月的一次峰会上提到,高达五至六成的 ChatGPT 用户正将这项技术用于处理非工作相关的日常任务,例如寻求情感陪伴、娱乐消遣,甚至包括获取占星建议。 这一趋势也得到了 filtered. com 联合创始人 Marc Zao-Sanders 的印证。他在《哈佛商业评论》的文章中指出,过去一年里,AI 的使用重心已从自动化工作流... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/audibit/ - 分类目录: AI工具库 - 标签: AI开源项目, AI文本转语音 Audibit 是一个开源项目,核心功能是将 Hacker News、TechCrunch 等热门科技文章自动转为音频播客,让用户在通勤、健身或忙碌时通过 Web 端或移动端收听资讯。项目使用 Next. js 和 React 开发前端,结合 OpenAI 和 Lemonfox 的文本转语音技术生成高质量音频。Audibit 支持零配置快速上手,内容通过 GitHub Action 定时更新,部署在 Netlify 上。用户可自定义文章源,社区可通过 GitHub 贡献代码。项目采用 AGPL-... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/deepwiki-open/ - 分类目录: AI工具库 - 标签: AI开源项目 DeepWiki-Open 是一个开源项目,专为 GitHub、GitLab 和 Bitbucket 的代码仓库自动生成结构化文档。它利用 AI 技术分析代码结构、文件内容和逻辑关系,快速生成类似维基百科的知识库页面。用户只需输入仓库 URL,即可获得代码架构、功能模块和实现细节的清晰说明。项目支持本地部署,数据存储在本地,保障隐私安全。它还提供检索增强生成(RAG)功能,允许用户与代码库进行上下文问答,并通过 DeepResearch 功能深入研究复杂问题。DeepWiki-Open 由 As... --- - Published: 2025-05-05 - Modified: 2025-05-21 - URL: https://www.58jingpai.com/paper2code/ - 分类目录: AI教育学习, 深度研究智能体 - 标签: AI开源项目, 智能体应用 Paper2Code 是一个开源项目,旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型(LLM)系统 PaperCoder,将科学论文自动转化为可运行的代码仓库。系统采用规划、分析和代码生成三阶段流程,由专门的代理分别处理,生成高质量、忠实于论文的代码实现。项目以著名的“Attention Is All You Need”论文为例,展示了从论文到 Transformer 模型代码的转化能力。它支持 PDF 和 LaTeX 格式的论文输入,适用于机器学习研究人员、开发者及学生。Pap... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/fantasytalking/ - 分类目录: AI工具库 - 标签: AI开源项目, AI数字人 FantasyTalking 是一个由 Fantasy-AMAP 团队开发的开源项目,专注于通过音频驱动生成真实感说话肖像视频。项目基于先进的视频扩散模型 Wan2. 1,结合音频编码器 Wav2Vec 和专有模型权重,利用人工智能技术实现高度逼真的唇部同步和面部表情。它支持多种风格的肖像生成,包括真实人物和卡通形象,适用于全景、半身或特写等多种视角。用户可以通过简单的命令行操作,输入图像和音频,快速生成高质量的说话视频。 功能列表 生成真实感说话肖像视频,唇部动作与音频高度同步。 支持多种视角... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/cleverbee/ - 分类目录: AI工具库 - 标签: AI开源项目, 生成深度研究报告 CleverBee 是一个开源的 AI 研究助手,托管在 GitHub 上,由 SureScaleAI 开发。它通过大语言模型(如 Gemini 和 Claude)结合网页浏览技术,帮助用户快速收集、分析和总结信息,生成带引证的研究报告。用户可以轻松获取网页、PDF、YouTube 视频或学术资源的精准内容。CleverBee 支持云端和本地模型,适合学术研究、商业分析等场景。它的界面基于 Chainlit,操作简单直观,配置灵活,适合个人和研究团队使用。 功能列表 支持多种大语言模型,包括 G... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/deep-recall/ - 分类目录: AI工具库 - 标签: AI开源项目, 知识检索与RAG框架 Deep Recall 是一个开源的企业级记忆框架,专为大型语言模型(LLM)设计。它通过高效的上下文检索和整合,提供超个性化的响应能力。框架采用三层架构,包括记忆服务、推理服务和协调器,支持GPU优化推理和向量数据库整合。Deep Recall 适用于云端和本地部署,具备自动化扩展功能,确保高性能和可靠性。它不仅提升模型的上下文感知能力,还能根据用户历史和偏好生成定制化回复,非常适合需要深度个性化交互的场景。 功能列表 高效上下文检索:快速从用户历史交互中提取相关信息。 个性化响应生成:根据用... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/mcp-server-deep-research/ - 分类目录: AI工具库 - 标签: AI开源项目, MCP服务, 生成深度研究报告 MCP Server Deep Research 是一个开源工具,通过人工智能和网页搜索,自动为复杂问题生成结构化的研究报告。用户输入研究问题,工具会分解问题、搜索权威信息、评估来源可信度,并生成包含引用的 Markdown 报告。它基于 Model Context Protocol (MCP),与 Claude Desktop 等平台无缝集成,适合学术研究、市场分析和内容创作。 功能列表 自动分解研究问题,生成子问题,覆盖主题多方面。 集成网页搜索,查找权威信息,收集多样化观点。 评估来源可信... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/instantcharacter/ - 分类目录: AI工具库 - 标签: AI图像风格控制, AI开源项目 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目,托管在 GitHub 上。它通过一张参考图片和一句文本描述,就能生成外观一致的角色图像,适用于多种场景和风格。项目基于扩散变换器(Diffusion Transformer)技术,突破了传统 U-Net 架构的限制,提供更高的图像质量和灵活性。用户无需复杂调参,只需简单操作即可生成符合描述的角色图像,广泛应用于动画、游戏和数字艺术等领域。项目支持 Flux. 1 模型,并提供风格 LoRA ... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/cooragent/ - 分类目录: AI工具库 - 标签: AI开源项目, 智能体开发框架 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架,托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理,并支持多个代理协作完成复杂任务。框架提供两种模式:Agent Factory 自动生成定制化代理,Agent Workflow 通过任务规划实现多代理协作。Cooragent 深度兼容 Langchain 工具链,支持 MCP 协议,确保代理间高效通信。开发者可通过 CLI 工具或 API 快速构建、编辑和管理代理。 功能列表 Agent Facto... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/describe-anything/ - 分类目录: AI工具库 - 标签: AI开源项目, 视觉目标检测 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目,核心是 Describe Anything Model(DAM)。这个工具能根据用户在图像或视频中标记的区域(如点、框、涂鸦或掩码),生成详细的描述。它不仅能描述静态图像的细节,还能捕捉视频中区域随时间的变化。 功能列表 支持多种区域标注方式:用户可通过点、框、涂鸦或掩码指定图像或视频的描述区域。 图像和视频描述:为静态图像生成详细描述,或分析视频中特定区域的动态变化。 开源模型与数据集:提供 DAM-3B 和... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/kimi-audio/ - 分类目录: AI工具库 - 标签: AI开源项目, AI文本转语音, AI语音转文本 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型,专注于音频理解、生成和对话。它支持多种音频处理任务,例如语音识别、音频问答和语音情感识别。模型经过超过 1300 万小时的音频数据预训练,结合创新的混合架构,在多个音频基准测试中表现优异。Kimi-Audio 提供模型权重、推理代码和评估工具包,方便开发者在研究和应用中集成。它适合需要高效音频处理和对话能力的场景,文档清晰,支持 Docker 部署,社区活跃,持续更新。 功能列表 语音识别(ASR):将音频转为文本,... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/trackers/ - 分类目录: AI工具库 - 标签: AI开源项目, 视觉目标检测 Trackers 是一个开源的 Python 工具库,专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法,如 SORT 和 DeepSORT,允许用户结合不同的对象检测模型(如 YOLO、RT-DETR)进行灵活的视频分析。用户可以通过简单的代码实现视频帧的检测、跟踪和标注,适用于交通监控、工业自动化等场景。 功能列表 支持多种跟踪算法,包括 SORT 和 DeepSORT,未来计划增加更多算法。 兼容主流对象检测模型,如 YOLO、RT-DETR 和 RFDETR。 提供视频帧标注功能,支持... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/deepwiki/ - 分类目录: AI工具库 - 标签: AI搜索工具 DeepWiki 是一个由 Cognition AI 推出的免费工具,专注于为 GitHub 仓库生成结构化、类似维基百科的文档。它通过分析代码、README 文件和配置文件,自动创建详细的文档和交互式图表,帮助开发者快速理解复杂代码库。用户只需将 GitHub 仓库的 URL 中的 "github" 替换为 "deepwiki",即可访问生成的文档页面。该工具支持超过 30,000 个仓库,覆盖 40 亿行代码,特别适合开源项目。DeepWiki 还提供 AI 对话功能,允许用户通过自然语言提... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/local-deep-research/ - 分类目录: AI工具库 - 标签: AI开源项目, 生成深度研究报告 Local Deep Research 是一个开源的人工智能研究助手,旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行,使用户可以在不依赖云服务的情况下完成研究任务。工具结合了本地大语言模型(LLM)与多种搜索功能,覆盖学术数据库、维基百科、网页内容等来源。用户可以通过简单的安装和配置,快速生成包含引文的综合报告。项目强调隐私保护和灵活性,适合学术研究、技术探索或个人知识管理。 功能列表 支持本地大语言模型,保护数据隐私。 自动选择合适的搜索工具,如维基百科、arXiv、Pu... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/abogen/ - 分类目录: AI工具库 - 标签: AI开源项目, AI语音转文本 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物、视频配音或学习辅助材料。用户可以选择多种语言和男女声,调整字幕粒度,甚至混合不同语音模型以创建独特的声音效果。Abogen 支持 WAV、FLAC、MP3 和 M4B 等音频格式,操作简单,兼容 Windows、Linux 和 macOS。 功能列表 支持 ePub、PDF 和 TXT 文件输入,自动提取文本... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/llmpdf/ - 分类目录: AI工具库 - 标签: AI开源项目, 本地部署开源大模型工具 llm. pdf 是一个开源项目,允许用户在 PDF 文件中直接运行大型语言模型(LLM)。这个项目由 EvanZhouDev 开发,托管在 GitHub 上,展示了一种创新的方法:通过 Emscripten 将 llama. cpp 编译为 asm. js,并结合 PDF 的 JavaScript 注入功能,让 LLM 的推理过程完全在 PDF 文件中完成。项目支持 GGUF 格式的量化模型,推荐使用 Q8 量化模型以获得最佳性能。用户可以通过提供的 Python 脚本生成包含 LLM 的 P... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/acidev/ - 分类目录: AI工具库 - 标签: AI开源项目, MCP服务 ACI. dev 是一个开源基础设施平台,专为 AI 智能体提供与 600 多种工具的快速集成。它通过多租户认证和细粒度权限管理,确保智能体安全访问工具,如 Google Calendar、Slack 和 Brave Search。开发者可通过直接函数调用或统一的 MCP 服务器使用工具,灵活适配任何大型语言模型框架。ACI. dev 提供 Python SDK 和详细文档,支持快速开发生产环境开箱即用的 AI 智能体。 功能列表 集成 600+ 工具,支持 Google Calendar、Sl... --- - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/graphgen/ - 分类目录: AI工具库 - 标签: AI开源项目, 大模型微调, 知识图谱 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从源文本构建细粒度知识图谱,利用预期校准误差(ECE)指标识别模型知识盲点,优先生成针对高价值、长尾知识的问答对。GraphGen 支持多跳邻域采样以捕获复杂关系信息,并通过风格控制生成多样化数据。项目采用 Apache 2. 0 许可证,代码公开,适用于学术研究和商业开发。用户可通过命令行或 Gradio 界... --- - Published: 2025-05-04 - Modified: 2025-05-04 - URL: https://www.58jingpai.com/google-notebooklm-ao/ - 分类目录: AI新闻 Google 旗下的 AI 笔记工具 NotebookLM 近期获得更新,其发展路径日益清晰,正朝着成为一款重要的个人知识管理和生产力工具迈进。最新的进展包括对中文等多种语言的音频播报支持,以及即将推出的移动应用程序。 NotebookLM 自去年发布以来,凭借其将用户上传的文档、网页链接或文本笔记转化为结构化信息的能力受到关注。其功能集包括内容摘要、自动生成时间线和交互式思维导图等。 然而,该工具中最引人注目的功能之一是“音频概览”( Audio Overviews )。该功能允许用户上传多种... --- - Published: 2025-05-04 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/quick-prompt/ - 分类目录: AI对话, Prompt辅助 - 标签: AI开源项目, PROMPTS辅助工具 Quick Prompt 是一个开源的浏览器扩展,专注于提示词(Prompt)的管理和快速输入。用户可以创建、组织和存储提示词库,并在任何网页的输入框中快速插入预设的提示词内容。这个工具特别适合需要频繁使用AI模型(如ChatGPT、Grok等)进行内容生成的用户,比如开发者、内容创作者和研究人员。它支持Chrome、Edge、Firefox等主流浏览器,安装简单,界面直观。通过Quick Prompt,用户可以轻松管理复杂的提示词集合,提升AI交互效率。项目托管在GitHub,由开发者weny... --- - Published: 2025-05-04 - Modified: 2025-05-04 - URL: https://www.58jingpai.com/voltagent/ - 分类目录: AI工具库 - 标签: AI开源项目, 低代码工作流, 智能体开发框架 VoltAgent 是一个开源的 TypeScript 框架,专为开发者设计,帮助快速构建和协调 AI 智能体。它提供模块化的工具和标准化的开发模式,简化了与大型语言模型(LLM)交互、状态管理和外部工具集成的复杂性。开发者可以用它创建聊天机器人、虚拟助手或复杂的多智能体系统。VoltAgent 避免了从零开始开发的繁琐,也突破了无代码平台的限制。它支持多种 LLM 模型,如 OpenAI、Google 和 Anthropic,且提供本地调试控制台,让开发者轻松监控智能体运行状态。项目通过 Gi... --- - Published: 2025-05-04 - Modified: 2025-05-04 - URL: https://www.58jingpai.com/on-device-ai/ - 分类目录: AI工具库 - 标签: AI本地化聊天应用, AI语音转文本 On-Device AI 是一款完全离线运行的AI应用,专为苹果设备设计,支持iOS、macOS和visionOS。它提供本地大型语言模型(LLM)运行、实时语音转录、文档分析等功能,无需联网即可使用,确保数据隐私。用户可通过语音转文字、AI聊天、网页搜索和自定义AI角色完成多种任务。应用支持Llama、Gemini、DeepSeek等模型,深度整合苹果生态,运行效率高。On-Device AI 适合注重隐私保护的用户,提供安全、便捷的AI体验。 功能列表 语音转录:实时将语音转为文字,支持多语... --- - Published: 2025-05-04 - Modified: 2025-05-04 - URL: https://www.58jingpai.com/shiyong-cursor-kaifa/ - 分类目录: AI实用指令 You are a senior developer that can help me with developing Dify Plugin Tool, which is an AI Agent Tool that can be used on AI Agent Development Tool, Dify. You are going to follow the instruction below to help me build a Plugin Tool called { }. The ... --- - Published: 2025-05-04 - Modified: 2025-05-04 - URL: https://www.58jingpai.com/jetbrains-kaiyuan-mel/ - 分类目录: AI新闻 软件开发工具供应商 JetBrains 近日宣布,将其专门为代码补全设计的语言模型 Mellum 的基础版本开源,并在 Hugging Face 平台上提供。此举旨在推动 AI 在软件开发领域的透明度与协作。 Mellum 的设计哲学并非追求无所不包,而是专注于一项核心任务:代码补全。 JetBrains 将这类模型称为 专用模型 (specialized model),强调其设计目标是在特定领域具备深度能力,而非盲目追求广泛的通用性。该模型支持多种编程语言的代码补全,包括 Java, Kotl... --- - Published: 2025-05-01 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/qwen3-fabushenba/ - 分类目录: AI新闻 大型语言模型领域迎来了新成员。近日, Qwen 系列大语言模型发布了其最新版本 Qwen3。据开发团队介绍,其旗舰模型 Qwen3-235B-A22B 在编码、数学及通用能力等基准测试中,展现出与 DeepSeek-R1 , o1 , o3-mini , Grok-3 及 Gemini-2. 5-Pro 等业界顶尖模型相匹敌的性能。这些竞品的选择,反映了 Qwen3 旨在与当前性能标杆直接对话的定位。 值得关注的是,小型混合专家( MoE )模型 Qwen3-30B-A3B 据称在性能上超越了参... --- - Published: 2025-04-24 - Modified: 2025-05-05 - URL: https://www.58jingpai.com/openai-kaifangzuixina/ - 分类目录: AI新闻 OpenAI 近期宣布将其最新的图像生成模型 gpt-image-1 正式通过 API 提供给开发者和企业。该模型此前已在 ChatGPT 中应用,并因其强大的图像生成能力受到用户欢迎。据 OpenAI 方面透露,在 ChatGPT 中集成该功能的第一周,全球用户就创建了超过 7 亿张图片。现在,通过 API 的形式开放,意味着第三方可以将这种图像生成能力直接整合到自己的应用和服务中。 gpt-image-1 被描述为一个原生的多模态模型,能够同时接受文本和图像作为输入,并生成图像输出。这种特性... --- - Published: 2025-04-24 - Modified: 2025-04-24 - URL: https://www.58jingpai.com/strawberry/ - 分类目录: AI工具库 - 标签: 桌面自动化智能体 Strawberry 是一款内置 AI 助手的智能浏览器,旨在帮助用户自动化日常工作,提升效率。它不同于传统浏览器,集成了 AI 技术,能实时理解网页内容,执行复杂任务,如快速研究、内容撰写和数据整理。用户可通过简单的指令让 AI 完成重复性工作,节省时间。Strawberry 强调隐私,所有数据存储在本地,AI 处理时需用户许可。它适合需要高效管理任务的专业人士,目前处于预测试阶段,功能还在完善。 功能列表 快速网页研究:AI 可同时浏览多个网站,提取关键信息并生成摘要。 内容生成:根据用户风... --- - Published: 2025-04-24 - Modified: 2025-05-21 - URL: https://www.58jingpai.com/springnew/ - 分类目录: AI商业应用, 无代码开发 - 标签: 智能体应用 Spring. new 是一个基于人工智能的在线平台,专注于帮助营销经理和产品经理快速构建定制化工作流和小型应用。它通过自然语言输入,让用户描述需求,自动生成连接 Notion、Airtable、Slack 等工具的工作流或应用,例如将 Figma 设计转为可交互界面,或创建轻量级 CRM 系统。平台无需用户具备编程经验,操作简单,适合快速迭代的团队。Spring. new 强调即时性,号称从需求到成品只需几分钟,特别适合需要快速上线营销活动或产品功能的用户。 功能列表 自然语言构建 :通过聊天... --- - Published: 2025-04-24 - Modified: 2025-04-24 - URL: https://www.58jingpai.com/corgea/ - 分类目录: AI工具库 - 标签: AI开放服务 Corgea 是一个基于人工智能的代码安全平台,专注于帮助开发者和安全团队发现、分析并自动修复代码中的漏洞。它通过与现有静态应用安全测试(SAST)工具(如 Snyk 和 Semgrep)集成,扫描代码中的潜在问题,并利用 AI 生成高质量的修复代码,供开发者审查。Corgea 支持多种编程语言,包括 Java、Python、Go 等,覆盖业务逻辑错误、身份验证漏洞等复杂问题。它能减少约 30% 的误报,显著降低修复成本和时间,平均节省 80% 的开发工作量。平台操作简单,可通过 GitHub ... --- - Published: 2025-04-24 - Modified: 2025-04-24 - URL: https://www.58jingpai.com/suna/ - 分类目录: AI工具库 - 标签: AI开源项目, 桌面自动化智能体, 生成深度研究报告 Suna 是 Kortix AI 开发的一个开源通用 AI 代理,托管在 GitHub 上,基于 Apache 2. 0 许可证,允许用户免费下载、修改和自托管。它通过自然语言对话帮助用户完成复杂任务,如网页浏览、文件管理、数据抓取和网站部署。Suna 采用模块化架构,包括 Python/FastAPI 后端、Next. js/React 前端、Supabase 数据库和 Daytona 沙盒,确保安全性和灵活性。它支持与 OpenAI、Anthropic 等大语言模型集成,并通过 Tavily... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/dia/ - 分类目录: AI工具库 - 标签: AI开源项目, AI文本转语音 Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表达,如笑声。Dia 的核心是 16 亿参数的模型,托管在 Hugging Face 上,用户可通过 GitHub 获取代码和预训练模型。它的设计强调开放性和灵活性,允许用户完全控制对话脚本和语音输出。Dia 提供 Gradio 界面,方便用户快速体验生成对话的效果。项目得到 Google TPU Resear... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/skyreels-v2/ - 分类目录: AI工具库 - 标签: AI图像转视频, AI开源项目, AI文本转视频 SkyReels-V2 是一个开源的视频生成模型,由 SkyworkAI 开发。它通过先进的 Diffusion Forcing 技术,支持生成无限长度的视频,适用于文本转视频(T2V)和图像转视频(I2V)任务。用户可以利用文本描述或输入图像,生成高质量、电影级别的视频内容。该模型在开源社区表现突出,性能媲美商业模型如 Kling 和 Runway-Gen4。它提供灵活的推理模式,适合开发者、创作者和研究人员使用。SkyReels-V2 的代码和模型权重公开在 GitHub,方便用户下载和部署... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/open-codex/ - 分类目录: AI工具库 - 标签: AI开源项目 Open Codex 是一个开源的命令行AI工具,专为开发者设计,能将自然语言指令转换为精准的Shell命令。它使用本地语言模型(如 phi-4-mini),无需联网或API密钥,所有操作在本地运行。用户通过简单描述即可生成Shell命令或代码,适合快速完成编程任务。项目托管在GitHub,安装简单,支持macOS、Linux和Windows。Open Codex强调安全性,命令执行前需用户确认,保护系统安全。 功能列表 自然语言转Shell命令:将用户输入的自然语言转换为可执行的Shell命令... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/noderag/ - 分类目录: AI工具库 - 标签: AI开源项目, 知识检索与RAG框架 NodeRAG 是一个开源的检索增强生成(RAG)系统,托管在 GitHub,由 Terry-Xu-666 开发。它通过异构图结构优化信息检索与生成,显著提升检索精准度和上下文相关性。NodeRAG 支持本地部署,提供用户友好的界面和可视化工具,适用于学术研究、知识管理和数据分析。项目于 2025 年 3 月发布首个稳定版本(v0. 1. 0),可通过 PyPI 安装。官方文档详尽,社区活跃,持续更新。相比传统 RAG 系统,NodeRAG 在多跳推理、检索速度和存储效率上表现更优,特别适合处理... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/mcp-containers/ - 分类目录: AI工具库 - 标签: AI开源项目, MCP服务 MCP Containers 是一个开源项目,托管在 GitHub,专注于为 Model Context Protocol(MCP)服务器提供容器化解决方案。它通过 Docker 容器简化了数百种 MCP 服务器的部署,涵盖 GitHub、Notion、Firecrawl 等多种 AI 工具。MCP 协议支持 AI 模型与外部数据和工具交互,MCP Containers 让用户只需拉取镜像即可快速运行服务器。项目使用 Nixpacks 自动构建容器镜像,确保每日更新,保持最新状态。它支持本地和云... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/guge-veo-2-shipinai/ - 分类目录: AI新闻 谷歌近日宣布,其视频生成模型 Veo 2 已正式集成至 Gemini Advanced 服务以及其实验性平台 Whisk 中。此举意味着 Google One AI Premium 的订阅用户现在可以直接通过文本提示或已有图像,生成短视频内容。 Veo 2 被谷歌定位为其先进的视频生成技术,旨在将文本描述转化为长达 8 秒、720p 分辨率、16:9 宽高比的 MP4 格式视频。据称,该模型在理解现实物理规律和人类运动方面有所增强,能够生成动作流畅、场景逼真且细节丰富的视频片段,覆盖多样化的主题... --- - Published: 2025-04-22 - Modified: 2025-05-22 - URL: https://www.58jingpai.com/bookaroozie/ - 分类目录: AI教育学习, 文档辅助阅读 - 标签: AI教育工具 Bookaroozie 是一个创新的电子书阅读平台,专注于将 PDF、EPUB、TXT、DOC 和 DOCX 等格式的电子书转化为互动式学习体验。它通过 AI 技术,让用户能与书籍内容进行自然对话,深入理解复杂概念或探索相关主题。用户只需一次性付费,无需订阅,即可享受所有功能和未来更新。Bookaroozie 提供多种大语言模型选择,满足不同阅读需求,同时支持文本高亮、笔记整理和知识点保存,适合学生、研究人员和爱书人士。界面简洁,强调无干扰阅读,帮助用户专注内容。它还支持多设备安装,灵活性高。 ... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/postroast/ - 分类目录: AI工具库 - 标签: AI社交媒体 PostRoast 是一个利用人工智能帮助用户优化社交媒体内容的在线工具,主要针对 X 平台(原 Twitter)的帖子分析。用户可以上传帖子内容,PostRoast 会通过 AI 算法分析帖子的清晰度、吸引力和互动潜力,并提供具体的改进建议。它的目标是帮助用户提升帖子质量,增加关注度和互动率。网站界面简洁,操作直观,适合个人创作者、营销人员和品牌管理者使用。PostRoast 强调实用反馈,结合用户选择的发布目标和风格,生成个性化的优化建议。 功能列表 帖子AI分析:分析 X 平台帖子,提供关... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/openutau/ - 分类目录: AI工具库 - 标签: AI开源项目, AI音乐 OpenUtau 是一个免费的开源歌声合成编辑平台,旨在为 UTAU 社区提供现代化编辑体验。它是 UTAU 软件的继任者,解决原软件兼容性和操作复杂的问题。OpenUtau 支持 Windows、macOS 和 Linux 系统,界面直观,功能丰富,适合音乐创作者和语音合成爱好者。用户可以通过 MIDI 编辑器快速创作歌曲,支持多语言语音库和实时音素编辑。软件内置 WORLDLINE-R 渲染器,还兼容大多数 UTAU 重采样器。它的预渲染功能让编辑和预览更高效,适合从初学者到专业人士的各种创... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/google-fabu-gemma/ - 分类目录: AI新闻 继上月推出新一代开放模型 Gemma 3 后,Google 近日再次拓展其模型生态,发布了基于量化感知训练 (Quantization-Aware Training, QAT) 优化的新版本。 Gemma 3 此前已凭借其在 BF16 精度下于单个高端 GPU(如 NVIDIA H100)上运行的能力,证明了其领先性能。而 QAT 版本的推出,旨在显著降低模型的内存需求,同时尽可能保持高质量输出,从而让强大的 AI 模型能够在更多消费级硬件上运行。 该图表依据 Chatbot Arena Elo... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/jiedu-coze-space/ - 分类目录: AI新闻 字节跳动入局:Coze Space 能否定义 AI Agent 的协同办公新范式? 近期,字节跳动旗下 AI Agent 开发平台 Coze 悄然启动了一项名为 Coze Space (space. coze. cn) 的新功能内测。该平台定位为“与 AI Agent 协同办公的最佳场所”,旨在通过整合大型模型能力、自动化工具和开放生态,提升用户处理复杂任务的效率,实现从需求输入到成果输出的全流程自动化。此举标志着字节跳动在通用型 AI Agent 领域迈出了重要一步,试图探索 AI 在实际工作... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/uno/ - 分类目录: AI工具库 - 标签: AI开源项目 UNO 是由 ByteDance 智能创作团队开发的一个开源图像生成框架。它基于 FLUX. 1 模型,专注于通过“少到多”的泛化方式实现单主体和多主体的定制化图像生成。UNO 利用扩散变换器(DiT)的上下文生成能力,结合高一致性的数据合成流程,解决了多主体场景下数据扩展和主体一致性的难题。它支持用户通过文字描述和参考图像生成高质量图像,广泛适用于个性化图像创作、虚拟角色设计等场景。项目代码采用 Apache 2. 0 许可证,模型权重则使用 CC BY-NC 4. 0 许可证,适合学术研究和... --- - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.58jingpai.com/docagent/ - 分类目录: AI工具库 - 标签: AI开源项目 DocAgent 是一个由 Meta AI 开发、开源的 Python 代码文档生成工具。它通过多智能体协作和层次化代码分析,自动为 Python 代码库生成高质量、上下文感知的文档注释(docstrings)。DocAgent 解决了传统语言模型生成文档时缺乏深度和上下文的问题,能够分析代码依赖关系,生成简洁、准确的文档。它适合开发者和团队提升代码可读性和维护性。项目托管在 GitHub,采用 MIT 许可证,支持本地和云端部署,配备 Web 界面便于操作。 功能列表 自动生成上下文感知的 P... --- ---