# AI生产力工具 > 推荐好用的AI工具,免费AI软件排行榜 --- ## 页面 - [我要投稿](https://www.kdjingpai.com/contribute/): - [我的收藏](https://www.kdjingpai.com/collect/): - [找回密码](https://www.kdjingpai.com/zhaohuimima/): - [会员中心](https://www.kdjingpai.com/huiyuanzhongxin/): - [Privacy Policy](https://www.kdjingpai.com/privacy-policy/): 1. Introduction We r... - [精选AI工具列表](https://www.kdjingpai.com/tuijiangongju/): - [工具分类](https://www.kdjingpai.com/tooltag/): - [友情链接](https://www.kdjingpai.com/links/): --- ## 文章 - [Poify:AI驱动的电商图片生成与编辑工具](https://www.kdjingpai.com/ai-art/poify/): Poify 是一款由快手推出的AI作图工... - [Gemma 3n](https://www.kdjingpai.com/models/gemma-3n/): 谷歌在相继推出面向单一云端或桌面加速器运... - [MoviiGen1.1](https://www.kdjingpai.com/models/moviigen11/): MoviiGen1. 1 是由 Zulu... - [HiDream-I1](https://www.kdjingpai.com/models/hidream-i1/): HiDream-I1是一个开源的图像生成... - [Imagen 4](https://www.kdjingpai.com/models/imagen-4/): Google DeepMind 近期推出... - [BAGEL](https://www.kdjingpai.com/models/bagel/): BAGEL 是由 ByteDance S... - [Dolphin](https://www.kdjingpai.com/ai-professional/dolphin/): Dolphin 是由 ByteDance... - [让 Dify “看懂”图片:集成 MinerU-API 实现知识库 OCR 解析](https://www.kdjingpai.com/shicao/rang-dify-kandong/): 许多用户在将重要资料(如纯图片文件或扫描... - [Dia 系统提示词](https://www.kdjingpai.com/prompts/dia-xitongtishici/): 以下是 Dia Browser 官方提示... - [微软CPO Aparna Chennapragada:Prompt即新PRD,AI Agent重塑产品未来](https://www.kdjingpai.com/news/weiruancpo-aparna-che/): 在近期一次与 Lenny's Podca... - [谷歌 I/O 2025:技术盛宴下的产品迷思与整合挑战](https://www.kdjingpai.com/news/guge-io-2025ao/): Google I/O 2025 开发者大... - [DeepResearchAgent](https://www.kdjingpai.com/ai-learning/deepresearchagent/): DeepResearchAgent是Sk... - [OpenAI 与 Jony Ive 新公司 io 宣布合并,共塑 AI 产品未来](https://www.kdjingpai.com/news/openai-yu-jony-ive/): 2025年5月21日,科技界迎来一则重磅... - [易可图](https://www.kdjingpai.com/ai-business/yiketu/): 易可图 是一个面向电商、营销和个人用户的... - [Grok 官方公布系统提示词](https://www.kdjingpai.com/prompts/grok-guanfanggongbuxi/): 核心对话提示() 这个模板定义了 Gro... - [家作](https://www.kdjingpai.com/ai-business/jiazuo/): 家作是阿里巴巴旗下天猫推出的一款AI设计... - [MiniMax Speech 02](https://www.kdjingpai.com/models/minimax-speech-02/): 随着人工智能技术的不断演进,个性化和高自... - [Muscle-Mem](https://www.kdjingpai.com/ai-professional/muscle-mem/): Muscle-Mem 是一个开源的 Py... - [N8N vs. Dify:流程自动化与AI原生应用选型](https://www.kdjingpai.com/news/n8n-vs-difyliubai/): 一、产品定位与核心能力差异 本文将系统性... - [Simple Subtitling:自动生成视频字幕和说话者标识的开源工具](https://www.kdjingpai.com/tool/simple-subtitling/): Simple Subtitling 是一... - [ArXiv Paper Summarizer:arXiv论文自动摘要工具](https://www.kdjingpai.com/tool/arxiv-paper-summarizer/): arXiv Summarizer 是一个... - [Open Agent Platform](https://www.kdjingpai.com/ai-professional/open-agent-platform/): LangChain Open Agent... - [Windsurf SWE-1](https://www.kdjingpai.com/models/swe-1/): SWE-1: 软件工程领域的新一代前沿模... - [AI 智能体记忆性能之争:Zep 指 Mem0 基准测试存疑](https://www.kdjingpai.com/news/ai-zhinengtijiyiban/): 近期,AI 智能体记忆领域的一则声明引发... - [Sim Studio:开源的AI代理工作流构建工具](https://www.kdjingpai.com/tool/sim-studio/): Sim Studio 是一个开源的 AI... - [Mad Professor](https://www.kdjingpai.com/ai-learning/mad-professor/): Mad Professor(暴躁的教授读... - [九大主流大模型安全框架深度剖析与对比](https://www.kdjingpai.com/knowledge/jiudazhuliudamoan/): 随着大型语言模型技术的飞速发展和广泛应用... - [“清朗”利剑斩向AI滥用:13大关注点详解中国AI治理新方向](https://www.kdjingpai.com/news/qinglanglijianban/): 近日,中央网信办启动了“清朗·整治AI技... - [Trae IDE 指南:轻松配置自定义 AI 规则 (Trae Rules)](https://www.kdjingpai.com/shicao/trae-ide-zhinanbu/): 随着人工智能在编程领域的应用日益深入,许... - [Hula:将自拍一键生成病毒式短视频和个性化贴纸](https://www.kdjingpai.com/tool/hula/): Hula 是一个人工智能驱动的创意工具,... - [LoveyDovey](https://www.kdjingpai.com/ai-life/loveydovey/): LoveyDovey 是一个以AI驱动的... - [AIstudioProxyAPI:无限使用 Gemini 2.5 Pro 模型 API](https://www.kdjingpai.com/tool/aistudioproxyapi/): AIstudioProxyAPI 是一个... - [Step1X-Edit:自然语言指令编辑图像的开源工具](https://www.kdjingpai.com/tool/step1x-edit/): Step1X-Edit 是一个开源图像编... - [Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具](https://www.kdjingpai.com/tool/klavis-ai/): Klavis AI 是一个开源平台,专注... - [RealtimeVoiceChat](https://www.kdjingpai.com/ai-audio/realtimevoicechat/): RealtimeVoiceChat 是一... - [扣子空间系统提示词](https://www.kdjingpai.com/prompts/kouzikongjianxitongan/): 提示词 你是任务执行专家,擅长根据用户的... - [NotebookLM 系统提示词](https://www.kdjingpai.com/prompts/notebooklm-xitongti/): 近期 NotebookLM 已经支持中文... - [微软 GitHub Copilot 系统提示词解析](https://www.kdjingpai.com/prompts/weiruan-github-copilo/): 对于希望与大语言模型 (LLM) 高效协... - [Claude 网页版与 API 体验差异:解密近十万字的系统提示词](https://www.kdjingpai.com/prompts/claude-wangyebanyu/): 许多用户观察到,直接调用 Anthrop... - [OpenAI 天价收购 Windsurf:AI 编码赛道的战略落子与市场震荡](https://www.kdjingpai.com/news/openai-tianjiashougou/): 2025 年 5 月 5 日,人工智能领... - [PDF文档转换为可视化网页的提示词](https://www.kdjingpai.com/prompts/pdfwendangzhuanhuanweiai/): 提示词 我会给你一个文件,分析内容,并将... - [MiMo:高效数学推理与代码生成的小型开源模型](https://www.kdjingpai.com/tool/mimo/): MiMo 是小米公司开发的一个开源大语言... - [Muyan-TTS:个性化播客语音训练与合成](https://www.kdjingpai.com/tool/muyan-tts/): Muyan-TTS 是一个专为播客场景设... - [CAD-MCP:通过自然语言指令控制CAD软件的MCP服务](https://www.kdjingpai.com/tool/cad-mcp/): CAD-MCP 是一个开源项目,允许用户... - [Cotrans:一站式漫画图片翻译器(开源免费)](https://www.kdjingpai.com/tool/cotransmanyizhana/): manga-image-translat... - [GraphGen:利用知识图谱生成合成数据微调语言模型](https://www.kdjingpai.com/tool/graphgen/): GraphGen 是一个由上海人工智能实... - [ACI.DEV:通过MCP服务器为AI智能体集成600+工具](https://www.kdjingpai.com/tool/acidev/): ACI. dev 是一个开源基础设施平台... - [llm.pdf:在PDF文件中运行大型语言模型的实验项目](https://www.kdjingpai.com/tool/llmpdf/): llm. pdf 是一个开源项目,允许用... - [Abogen:将多种文本格式转换为有声读物的工具](https://www.kdjingpai.com/tool/abogen/): Abogen 是一个开源工具,专为将 e... - [Local Deep Research:本地运行的生成深度研究报告工具](https://www.kdjingpai.com/tool/local-deep-research/): Local Deep Research ... - [DeepWiki:自动生成GitHub仓库文档并用AI对话](https://www.kdjingpai.com/tool/deepwiki/): DeepWiki 是一个由 Cognit... - [Trackers:用于视频对象跟踪的开源工具库](https://www.kdjingpai.com/tool/trackers/): Trackers 是一个开源的 Pyth... - [Kimi-Audio:开源音频处理与对话基础模型](https://www.kdjingpai.com/tool/kimi-audio/): Kimi-Audio 是由 Moonsh... - [Describe Anything:为图像和视频区域生成详细描述的开源工具](https://www.kdjingpai.com/tool/describe-anything/): Describe Anything 是由... - [Cooragent:一句话构建多智能体任务协作工具](https://www.kdjingpai.com/tool/cooragent/): Cooragent 是清华大学 Leap... - [InstantCharacter:从单张图片生成一致性角色的开源工具](https://www.kdjingpai.com/tool/instantcharacter/): InstantCharacter 是由腾... - [Claude生成深度研究报告的MCP服务](https://www.kdjingpai.com/tool/mcp-server-deep-research/): MCP Server Deep Rese... - [Deep Recall:为大模型提供企业级记忆框架的开源工具](https://www.kdjingpai.com/tool/deep-recall/): Deep Recall 是一个开源的企业... - [CleverBee:开源AI研究助手,生成引证研究报告](https://www.kdjingpai.com/tool/cleverbee/): CleverBee 是一个开源的 AI ... - [FantasyTalking:生成真实感说话肖像的开源工具](https://www.kdjingpai.com/tool/fantasytalking/): FantasyTalking 是一个由 ... - [Paper2Code](https://www.kdjingpai.com/ai-learning/paper2code/): Paper2Code 是一个开源项目,旨... - [DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档](https://www.kdjingpai.com/tool/deepwiki-open/): DeepWiki-Open 是一个开源项... - [Audibit:将热门科技文章转为随时收听的音频播客](https://www.kdjingpai.com/tool/audibit/): Audibit 是一个开源项目,核心功能... - [你的AI生活指南:探索生成式AI的18种日常应用](https://www.kdjingpai.com/news/nideaishenghuozhinan/): 近期观察显示,生成式人工智能(AI)正悄... - [Little Language Lessons](https://www.kdjingpai.com/ai-learning/little-language-lessons/): Google Labs的Little L... - [Cursor 哪个 AI 模型最适合你的编码任务?](https://www.kdjingpai.com/aidayi/cursor-nage-ai-mo/): 近期,AI 辅助编程工具 Cursor ... - [教程:将 FastGPT 知识库无缝集成到 n8n 工作流 (基于 MCP 协议)](https://www.kdjingpai.com/shicao/jiaochengjiang-fastgpt/): 背景:n8n 与 RAG 知识库集成的挑... - [OpenRouter 充值指南:如何使用支付宝与微信支付](https://www.kdjingpai.com/aidayi/openrouter-chongzhizhi/): 背景:OpenRouter 及其支付选项... - [OpenRouter 调整免费额度与速率限制](https://www.kdjingpai.com/aidayi/openrouter-diaozhengmian/): OpenRouter 作为聚合了全球众多... - [Google NotebookLM 拓展中文等多语言能力,并推出移动应用](https://www.kdjingpai.com/news/google-notebooklm-ao/): Google 旗下的 AI 笔记工具 N... - [JetBrains 开源 Mellum:专为代码补全设计的专用模型](https://www.kdjingpai.com/news/jetbrains-kaiyuan-mel/): 软件开发工具供应商 JetBrains ... - [使用 Cursor 开发 Dify 插件的提示词](https://www.kdjingpai.com/prompts/shiyong-cursor-kaifa/): You are a senior dev... - [On Device AI:iPhone本地运行的AI语音转录与聊天工具](https://www.kdjingpai.com/tool/on-device-ai/): On-Device AI 是一款完全离线... - [VoltAgent:快速构建AI智能体的TypeScript开源框架](https://www.kdjingpai.com/tool/voltagent/): VoltAgent 是一个开源的 Typ... - [Quick Prompt](https://www.kdjingpai.com/ai-chat/quick-prompt/): Quick Prompt 是一个开源的浏... - [Qwen3 发布:深入思考与快速响应并存的新一代大语言模型](https://www.kdjingpai.com/news/qwen3-fabushenba/): 大型语言模型领域迎来了新成员。近日, Q... - [OpenAI 开放最新图像生成 API,gpt-image-1 模型全面开放](https://www.kdjingpai.com/news/openai-kaifangzuixina/): OpenAI 近期宣布将其最新的图像生成... - [Suna:集成浏览器操作与数据分析的智能代理](https://www.kdjingpai.com/tool/suna/): Suna 是 Kortix AI 开发的... - [Corgea:自动修复代码漏洞的AI安全平台](https://www.kdjingpai.com/tool/corgea/): Corgea 是一个基于人工智能的代码安... - [Spring.new](https://www.kdjingpai.com/ai-business/springnew/): Spring. new 是一个基于人工智... - [Strawberry:自动化任务的AI智能浏览器](https://www.kdjingpai.com/tool/strawberry/): Strawberry 是一款内置 AI ... - [InternVL:开源多模态大模型,支持图像、视频和文本处理](https://www.kdjingpai.com/tool/internvl/): InternVL 是由上海人工智能实验室... - [roop-unleashed:基于Roop优化的全能换脸工具](https://www.kdjingpai.com/ai-life/roop-unleashed/): Roop-Unleashed 是一个基于... - [Potpie AI:快速创建专属代码库的AI工程助手](https://www.kdjingpai.com/tool/potpie-ai/): Potpie AI 是一个开源平台,专注... - [Bilanc:评估开发团队生产力的AI管理工具](https://www.kdjingpai.com/tool/bilanc/): Bilanc 是一个专注于提升工程团队生... - [Extrovert:通过AI辅助在LinkedIn上高效建立商业关系](https://www.kdjingpai.com/tool/extrovert/): Extrovert 是一个基于人工智能的... - [$150 订阅费换超 $1800 AI 工具?Lenny's Newsletter 年度捆绑包来了](https://www.kdjingpai.com/news/150-dingyuefeihuanchao/): Lenny's Newsletter 推... - [Vexa:实时会议转录与智能知识提取工具](https://www.kdjingpai.com/tool/vexa/): Vexa 是一个开源的实时会议转录和知识... - [RooFlow:基于 Roo Code 扩展的记忆增强系统](https://www.kdjingpai.com/tool/rooflow/): 综合介绍 RooFlow 是一个开源的A... - [Zev:用自然语言快速查询终端命令的CLI工具](https://www.kdjingpai.com/tool/zev-cli/): Zev 是一个简单易用的命令行界面(CL... - [Together Open Deep Research:生成带索引的深度研究报告](https://www.kdjingpai.com/tool/together-open-deep-research/): Open Deep Research 是... - [LLManager:智能自动化流程审批与人类审核结合的管理工具](https://www.kdjingpai.com/tool/llmanager/): LLManager 是一个开源的智能审批... - [OpenAI.fm:展示OpenAI语音API的交互式演示工具](https://www.kdjingpai.com/tool/openaifm/): openai-fm 是一个开源项目,托管... - [Fellou:自动化执行任务的原生AI浏览器](https://www.kdjingpai.com/tool/fellou/): Fellou是一款由Fellou AI公... - [Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具](https://www.kdjingpai.com/tool/find-my-kids/): Find My Kids 是一个开源项目... - [DocAgent:自动生成Python代码文档的智能工具](https://www.kdjingpai.com/tool/docagent/): DocAgent 是一个由 Meta A... - [UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)](https://www.kdjingpai.com/tool/uno/): UNO 是由 ByteDance 智能创... - [解读 Coze Space:字节跳动布局 AI Agent,瞄准“零门槛”办公助手](https://www.kdjingpai.com/news/jiedu-coze-space/): 字节跳动入局:Coze Space 能否... - [Google 发布 Gemma 3 QAT 模型:让顶尖 AI 模型走进消费级 GPU](https://www.kdjingpai.com/news/google-fabu-gemma/): 继上月推出新一代开放模型 Gemma 3... - [OpenUtau:免费的开源歌声合成编辑工具](https://www.kdjingpai.com/tool/openutau/): OpenUtau 是一个免费的开源歌声合... --- # # Detailed Content ## 页面 ### 我要投稿 - Published: 2025-05-09 - Modified: 2025-05-09 - URL: https://www.kdjingpai.com/contribute/ --- ### 我的收藏 - Published: 2025-05-09 - Modified: 2025-05-09 - URL: https://www.kdjingpai.com/collect/ --- ### 找回密码 - Published: 2025-02-03 - Modified: 2025-02-03 - URL: https://www.kdjingpai.com/zhaohuimima/ --- ### 会员中心 - Published: 2025-02-03 - Modified: 2025-02-03 - URL: https://www.kdjingpai.com/huiyuanzhongxin/ --- ### Privacy Policy - Published: 2025-01-30 - Modified: 2025-01-31 - URL: https://www.kdjingpai.com/privacy-policy/ 1. Introduction We respect your privacy and are committed to complying with applicable privacy laws, including the General Data Protection Regulation (GDPR). This policy explains how we collect, use, and protect your data when you visit our website. ... --- ### 精选AI工具列表 - Published: 2024-09-24 - Modified: 2024-09-24 - URL: https://www.kdjingpai.com/tuijiangongju/ --- ### 工具分类 - Published: 2024-09-24 - Modified: 2025-05-09 - URL: https://www.kdjingpai.com/tooltag/ --- ### 友情链接 - Published: 2024-07-16 - Modified: 2024-07-16 - URL: https://www.kdjingpai.com/links/ --- --- ## 文章 ### Poify:AI驱动的电商图片生成与编辑工具 - Published: 2025-05-27 - Modified: 2025-05-27 - URL: https://www.kdjingpai.com/ai-art/poify/ - 分类目录: AI商拍, AI绘画, 图像编辑 - 标签: AI图像风格控制 Poify 是一款由快手推出的AI作图工具,专为电商用户设计。它帮助商家快速生成高质量的商品展示图、促销海报和店铺装修图片。Poify 支持“文生图”和“图生图”功能,用户可以通过文字描述生成图片,或对已有图片进行再创作。此外,Poify 提供独特的AI模特试衣和背景替换功能,简化电商图片制作流程。它的操作简单,适合中小型电商商家和个人创作者使用。Poify 强调高效和实用,生成的图片能直接用于商品展示和社交媒体推广。 功能列表 文生图:通过文字描述生成符合需求的图片。 图生图:基于现有图片进行... --- ### Gemma 3n - Published: 2025-05-23 - Modified: 2025-05-23 - URL: https://www.kdjingpai.com/models/gemma-3n/ - 分类目录: 基础模型, 多模态模型 谷歌在相继推出面向单一云端或桌面加速器运行的开源模型 Gemma 3 与 Gemma 3 QAT 之后,再次拓展其普惠 AI 的版图。如果说 Gemma 3 为开发者带来了强大的云端与桌面端能力,那么此次于 2025 年 5 月 20 日发布的 Gemma 3n 预览版,则清晰地揭示了其在移动设备端实时 AI 的雄心——目标是让我们日常使用的手机、平板和笔记本电脑直接运行高性能 AI。 为了驱动下一代端侧 AI 并支持多样化的应用场景,包括进一步提升 Gemini Nano 的能力,谷歌工程团队... --- ### MoviiGen1.1 - Published: 2025-05-23 - Modified: 2025-05-23 - URL: https://www.kdjingpai.com/models/moviigen11/ - 分类目录: 基础模型, 视频生成模型 MoviiGen1. 1 是由 ZuluVision 开发的一款开源人工智能工具,专注于从文本生成高质量视频。它支持 720P 和 1080P 分辨率,特别适合需要电影级视觉效果的专业视频制作。用户可以通过简单的文本描述生成具有自然动态和一致美感的视频。MoviiGen1. 1 提供模型权重和推理代码,基于 PyTorch 框架,易于部署和使用。它的开放性和高性能使其成为视频创作者和开发者的理想选择,广泛应用于影视制作、广告和创意内容生成。 功能列表 支持 720P 和 1080P 高分辨率视频... --- ### HiDream-I1 - Published: 2025-05-23 - Modified: 2025-05-23 - URL: https://www.kdjingpai.com/models/hidream-i1/ - 分类目录: 图像生成模型, 基础模型 HiDream-I1是一个开源的图像生成基础模型,拥有170亿参数,能够快速生成高质量图像。用户只需输入文字描述,模型即可生成包括写实、卡通、艺术等多种风格的图像。该项目由HiDream. ai团队开发,托管在GitHub上,采用MIT许可证,支持个人、科研和商业用途。HiDream-I1在多项基准测试中表现优异,例如HPS v2. 1、GenEval和DPG,生成图像质量和提示词遵循能力均达到行业领先水平。用户可以通过Hugging Face平台体验模型,或下载模型权重在本地运行。项目还提供G... --- ### Imagen 4 - Published: 2025-05-23 - Modified: 2025-05-23 - URL: https://www.kdjingpai.com/models/imagen-4/ - 分类目录: 图像生成模型, 基础模型 Google DeepMind 近期推出的 Imagen 4 模型,作为其图像生成技术的最新迭代,正迅速成为行业焦点。该模型在提升图像的丰富性、细节精确度以及生成速度方面取得了显著进展,致力于将用户的想象力以前所未有的方式变为现实。目前,用户已能在 Gemini 、 Whisk 及 Vertex AI 等平台体验到 Imagen 4 的强大功能。 核心能力:真实感、清晰度与文本表现力的新高度 Imagen 4 在多个核心维度展现了其卓越性能。 首先是照片级真实感(Photo-realistic)... --- ### BAGEL - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/models/bagel/ - 分类目录: 基础模型, 多模态模型 - 标签: AI图像编辑, AI开源项目, 多模态实时互动产品 BAGEL 是由 ByteDance Seed 团队开发的一个开源多模态基础模型,托管于 GitHub。它集成了文本理解、图像生成和编辑功能,支持跨模态任务。模型拥有 7B 活跃参数(总计 14B 参数),采用 Mixture-of-Transformer-Experts (MoT) 架构,通过大规模交错多模态数据训练。BAGEL 在多模态理解和生成任务中表现出色,超越了 Qwen2. 5-VL 和 InternVL-2. 5 等开源模型,图像生成质量可媲美 SD3。它支持自由形式的图像编辑、视... --- ### Dolphin - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/ai-professional/dolphin/ - 分类目录: AI专业工具, 文档提取 Dolphin 是由 ByteDance 开发的一款开源文档图像解析工具,专注于处理复杂的文档图像,如包含文本、表格、公式和图片的扫描件或 PDF 文件。它采用“先分析后解析”的方法,通过两阶段处理实现高效解析:首先分析文档的页面布局,生成自然阅读顺序的元素序列;然后使用异构锚点和任务特定提示并行解析文档元素。Dolphin 在多种页面和元素级解析任务中表现出色,兼顾轻量级架构和高效性能。该工具已在 ACL 2025 会议上发表论文,并提供预训练模型和推理代码,方便开发者使用。用户可以通过 Gi... --- ### 让 Dify “看懂”图片:集成 MinerU-API 实现知识库 OCR 解析 - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/shicao/rang-dify-kandong/ - 分类目录: AI实操教程 许多用户在将重要资料(如纯图片文件或扫描版 PDF 文档)上传至 LLM 应用开发平台 Dify 的知识库时,常常会遇到一个棘手的问题:Dify 无法直接读取并解析这些非文本格式的内容。这主要是因为 Dify 的知识库原生功能更侧重于处理和理解纯文本数据。为了克服这一限制,可以引入 MinerU-API 工具,它能赋予 Dify 知识库强大的光学字符识别(OCR)能力。接下来,将详细介绍如何构建一个工作流,使 Dify 知识库能够有效解析图片和扫描文档中的文字信息。本教程操作基于 Dify 1.... --- ### Dia 系统提示词 - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/prompts/dia-xitongtishici/ - 分类目录: AI实用指令 以下是 Dia Browser 官方提示词: 提示词原文 You are an AI chat product called Dia, created by The Browser Company of New York. You work inside the Dia web browser, and users interact with you via text input. You are not part of the Arc browser. You decorate your re... --- ### 微软CPO Aparna Chennapragada:Prompt即新PRD,AI Agent重塑产品未来 - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/news/weiruancpo-aparna-che/ - 分类目录: AI新闻 在近期一次与 Lenny's Podcast 的访谈中,Microsoft 首席产品官 Aparna Chennapragada 分享了她对当前 AI 驱动产品开发的深刻见解。她明确指出,Prompt 正逐步取代传统的产品需求文档(PRD),成为产品构建的全新起点,而自然语言交互(NLI)则预示着新的用户体验设计范式。 AI 时代的产品设计新起点:Prompt 即 PRD Aparna Chennapragada 强调,在 AI 飞速发展的今天,如果产品开发缺乏原型验证和实际操作,便会偏离正确的... --- ### 谷歌 I/O 2025:技术盛宴下的产品迷思与整合挑战 - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/news/guge-io-2025ao/ - 分类目录: AI新闻 Google I/O 2025 开发者大会展示了众多技术成果,其中不乏令人印象深刻的创新,彰显了 Google 在人工智能核心技术领域的深厚积累。然而,信息的洪流和略显混乱的产品呈现方式,也让外界对其整体战略和市场沟通能力产生疑虑。 DeepMind 员工 Logan Kilpatrick 曾指出 Google AI 自去年以来取得的显著进展:拥有全球领先的模型、Gemini 应用月活用户超4亿、每月处理 Token 量达480T(同比增长50倍)、超过700万开发者使用 Gemini API(... --- ### DeepResearchAgent - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/ai-learning/deepresearchagent/ - 分类目录: AI专业工具, AI教育学习, 智能体开发框架, 深度研究智能体 - 标签: AI开源项目, 智能体开发框架, 生成深度研究报告 DeepResearchAgent是SkyworkAI开发的一款开源AI工具,专注于自动化深度研究。它通过结合搜索引擎、网页抓取和大型语言模型(LLM),帮助用户快速生成详细的研究报告。用户只需输入研究主题或问题,工具就能自动搜索、提取信息并整理成结构化的报告。项目托管在GitHub,面向开发者、研究人员和内容创作者,提供灵活的定制和本地运行支持。DeepResearchAgent强调隐私保护,支持本地部署,适合需要高效分析复杂主题的用户。 功能列表 自动化研究:根据用户输入的主题或问题,自动搜... --- ### OpenAI 与 Jony Ive 新公司 io 宣布合并,共塑 AI 产品未来 - Published: 2025-05-22 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/news/openai-yu-jony-ive/ - 分类目录: AI新闻 2025年5月21日,科技界迎来一则重磅消息。人工智能领域的领军者 OpenAI 与传奇设计师 Jony Ive 所创立的新公司 io 正式宣布合并。这一合作预示着双方将共同致力于开发能够深度融合尖端人工智能与卓越设计的新一代产品。 此次合并并非一蹴而就。据透露,OpenAI 的 Sam Altman 与 Jony Ive 及 LoveFrom 创意团队的合作已悄然进行两年之久。最初基于友谊、好奇心和共同价值观的探索,逐步发展为具体的合作设计与产品构想。这些构想被双方认为是“重要且实用”,充满“... --- ### 易可图 - Published: 2025-05-19 - Modified: 2025-05-19 - URL: https://www.kdjingpai.com/ai-business/yiketu/ - 分类目录: AI商业应用, AI商拍 - 标签: AI图像编辑 易可图 是一个面向电商、营销和个人用户的在线图片编辑与海报设计平台。用户无需安装软件,通过浏览器即可完成图片处理、海报制作和视频剪辑。平台提供丰富的免费模板、正版素材和AI工具,适合快速生成电商商品图、节日海报和社交媒体内容。易可图操作简单,界面直观,即使没有设计经验的用户也能轻松上手。平台还支持跨境电商合规标签生成,满足多样化的商业需求。 功能列表 图片编辑工具:支持裁剪、滤镜、调色、添加文字等基础编辑功能。 AI商品图生成:通过AI技术快速生成产品展示图,支持背景替换和模特试衣。 模板中心:... --- ### Grok 官方公布系统提示词 - Published: 2025-05-16 - Modified: 2025-05-17 - URL: https://www.kdjingpai.com/prompts/grok-guanfanggongbuxi/ - 分类目录: AI实用指令 核心对话提示() 这个模板定义了 Grok 3 在 grok. com 和 X 平台上的对话行为。提示内容包括角色设定、回答风格和上下文处理逻辑。 操作方法 :打开 文件,查看 Grok 的指令,如“以幽默和知识性语气回答”或“提供 2-3 个后续问题建议”。开发者可修改这些指令,调整 AI 的语气或回答深度。例如,将幽默语气改为正式语气,测试不同场景下的效果。 You are Grok 3 built by xAI. When applicable, you have some additio... --- ### 家作 - Published: 2025-05-16 - Modified: 2025-05-21 - URL: https://www.kdjingpai.com/ai-business/jiazuo/ - 分类目录: AI商业应用, AI商拍 家作是阿里巴巴旗下天猫推出的一款AI设计工具,专为家装、家居和家电行业的电商商家设计。商家只需上传商品图片,家作即可通过AI技术一键生成多种风格的场景图和逼真的模特展示图,效果媲美专业棚拍。家作大幅降低设计和拍摄成本,缩短传统拍摄周期,提升商品展示效果和点击率。工具深度整合淘宝电商生态,已吸引超13万商家使用,包括慕思、全友等知名品牌。家作通过简单操作即可上手,适合中小型商家和大型品牌。 功能列表 AI棚拍:上传商品图片,一键生成80多种风格的场景图,用于商品展示。 AI模特:生成逼真的AI模特... --- ### MiniMax Speech 02 - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.kdjingpai.com/models/minimax-speech-02/ - 分类目录: 基础模型, 语音模型 随着人工智能技术的不断演进,个性化和高自然度的语音交互已成为众多智能应用的关键需求。然而,现有的文本转语音 (TTS) 技术在满足大规模个性化音色、多语种覆盖以及高度真实情感表达方面仍面临挑战。针对这些行业痛点,MiniMax Speech 02 作为一款基于 AR Transformer 架构的高质量 TTS 系统被推出,旨在通过其独特的技术创新,为个性化语音合成领域带来新的突破。 该系统宣称具备强大的泛化能力,能够处理多达 32 种语言,并支持不同口音和情感风格的人声合成。其核心亮点在于引入... --- ### Muscle-Mem - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.kdjingpai.com/ai-professional/muscle-mem/ - 分类目录: AI专业工具, 记忆缓存系统 - 标签: AI开源项目, 智能体开发框架 Muscle-Mem 是一个开源的 Python 工具,托管在 GitHub 上,由 pig-dot-dev 开发。它旨在为 AI 代理提供行为缓存功能,帮助减少重复任务中的大语言模型(LLM)调用,从而提高运行速度、降低变异性并节省成本。Muscle-Mem 通过记录 AI 代理的工具调用模式,在遇到相同任务时直接复用已缓存的行为,只有在检测到新场景时才调用代理逻辑。它的核心机制是缓存验证,通过检查环境特征判断是否可以安全复用缓存。这个工具适合需要优化自动化任务的开发者,特别是处理重复性高的工... --- ### N8N vs. Dify:流程自动化与AI原生应用选型 - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.kdjingpai.com/news/n8n-vs-difyliubai/ - 分类目录: AI新闻 一、产品定位与核心能力差异 本文将系统性对比分析 N8N 与 Dify 这两款工具,在产品定位、技术特性以及适用场景上的关键区别。 N8N 是一款专注于工作流自动化的开源工具。其核心能力在于实现跨系统的数据集成与高效流转,尤其适用于构建复杂的系统间联动逻辑。可以认为, N8N 扮演着“数字世界的连接器”的角色。该平台对社区贡献节点和自定义节点开发也表现出较好的友好度,方便技术人员进行扩展。 Dify 则定位为 AI 原生应用开发平台。它聚焦于利用大语言模型 (LLM) 来构建智能化应用系统,赋予... --- ### Simple Subtitling:自动生成视频字幕和说话者标识的开源工具 - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.kdjingpai.com/tool/simple-subtitling/ - 分类目录: AI工具库 - 标签: AI开源项目, AI语音转文本 Simple Subtitling 是一个开源的音频字幕生成工具,专注于为视频或音频文件自动生成字幕并标注说话者身份。项目由 Jaesung Huh 开发,托管在 GitHub 上,旨在提供简单高效的字幕生成解决方案。工具通过音频处理技术,结合机器学习模型,生成带有时间戳和说话者标识的字幕文件,适合需要快速为视频添加字幕的用户。项目采用 Python 开发,支持单声道 16kHz 音频处理,易于安装和使用。Simple Subtitling 是 Jaesung Huh 博士研究期间的开源项目之一... --- ### ArXiv Paper Summarizer:arXiv论文自动摘要工具 - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.kdjingpai.com/tool/arxiv-paper-summarizer/ - 分类目录: AI工具库 - 标签: AI开源项目, AI文本与音频/视频总结工具 arXiv Summarizer 是一个开源的 Python 脚本工具,托管在 GitHub 上,旨在帮助用户快速从 arXiv 平台获取并生成学术论文的摘要。它利用免费的 Gemini API 进行高效的文本摘要,适合研究人员、学生和学术爱好者快速把握论文核心内容,无需逐篇阅读冗长文档。该工具支持单篇论文摘要、批量论文摘要以及基于关键词的自动论文提取与摘要生成,操作简单,安装方便。通过自动化和关键词驱动的论文处理,它大大提高了学术文献筛选的效率,特别适合需要跟踪最新研究动态的用户。 功能列表 ... --- ### Open Agent Platform - Published: 2025-05-16 - Modified: 2025-05-21 - URL: https://www.kdjingpai.com/ai-professional/open-agent-platform/ - 分类目录: AI专业工具, 智能体开发框架 - 标签: 无代码开发, 智能体开发框架 LangChain Open Agent Platform(简称OAP)是一个开源、无代码的AI智能体构建平台。它让非技术用户也能轻松设计、测试和部署AI智能体。平台基于LangChain的LangGraph框架,支持连接外部工具、数据源和智能体,实现复杂任务自动化。OAP通过直观的网页界面简化操作,用户无需编程即可创建智能体,连接MCP工具、LangConnect RAG服务或其他LangGraph智能体。平台支持灵活的托管选项,适合个人开发者、企业和社区用户。OAP的开源特性鼓励社区贡献,文... --- ### Windsurf SWE-1 - Published: 2025-05-16 - Modified: 2025-05-16 - URL: https://www.kdjingpai.com/models/swe-1/ - 分类目录: 专用模型, 基础模型 SWE-1: 软件工程领域的新一代前沿模型问世 近日,业界瞩目的 SWE-1 系列模型正式发布。该系列模型专为优化整个软件工程流程而设计,其目标远不止于传统的代码编写任务。 当前,SWE-1家族包含三款定位清晰的模型: SWE-1: 这款主力模型在工具调用推理能力上,据称可与 Claude 3. 5 Sonnet 等量齐观,同时具备更低的运营成本。在推广期内,所有付费用户均可免费(0积分/用户提示)体验。 SWE-1-lite: 作为一款轻量级模型,SWE-1-lite旨在以更高质量替代原有的 ... --- ### AI 智能体记忆性能之争:Zep 指 Mem0 基准测试存疑 - Published: 2025-05-07 - Modified: 2025-05-07 - URL: https://www.kdjingpai.com/news/ai-zhinengtijiyiban/ - 分类目录: AI新闻 近期,AI 智能体记忆领域的一则声明引发了业界的广泛关注。Mem0 公司发布研究报告,宣称其产品在 AI 智能体记忆技术方面达到了行业领先(SOTA)水平,并在特定基准测试中超越了包括 Zep 在内的竞争对手。然而,这一说法迅速遭到了 Zep 团队的质疑。Zep 指出,在正确实施的情况下,其产品在 Mem0 选用的 LoCoMo 基准测试中,性能实际上要高出 Mem0 大约 24%。这一显著差异,促使人们对基准测试的公正性、实验设计的严谨性以及最终结论的可靠性进行更深入的探究。 在人工智能这个竞... --- ### Sim Studio:开源的AI代理工作流构建工具 - Published: 2025-05-07 - Modified: 2025-05-07 - URL: https://www.kdjingpai.com/tool/sim-studio/ - 分类目录: AI工具库 - 标签: AI开源项目, 低代码工作流, 智能体开发框架 Sim Studio 是一个开源的 AI 代理工作流构建平台,专注于通过轻量、直观的可视化界面帮助用户快速设计、测试和部署大型语言模型(LLM)工作流。用户无需深入编程即可通过拖拽方式创建复杂的多代理应用。它支持本地和云端模型,兼容多种工具集成,如 Slack 和数据库。Sim Studio 采用模块化设计,适合开发者、研究人员和企业用户。官方提供云托管版本(https://simstudio. ai)和自托管选项,满足不同需求。 当下AI代理框架百花齐放,为什么我会特别推荐 Sim Studi... --- ### Mad Professor - Published: 2025-05-06 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/ai-learning/mad-professor/ - 分类目录: AI教育学习, 文档辅助阅读 - 标签: AI开源项目, AI教育工具 Mad Professor(暴躁的教授读论文) 是一个开源的 AI 学术工具,专为研究人员和学生设计,旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问答和语音交互等功能。用户可以导入 PDF 论文,工具会自动提取内容、翻译并生成结构化文本,支持中英文对照阅读。Mad Professor 通过智能问答和语音交互,帮助用户快速理解论文内容。它还提供分屏界面,左侧显示论文,右侧展示 AI 对话,方便用户边读边问。 功能列表 PDF 内容提取与结构化:自动从 PD... --- ### 九大主流大模型安全框架深度剖析与对比 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/knowledge/jiudazhuliudamoan/ - 分类目录: AI知识 随着大型语言模型技术的飞速发展和广泛应用,其潜在的安全风险日益成为业界关注的焦点。为了应对这些挑战,全球众多顶尖科技公司、标准化组织及研究机构纷纷构建并发布了各自的安全框架。本文将梳理并剖析其中九个具有代表性的大模型安全框架,旨在为相关领域的从业者提供一个清晰的参考。 图:大模型安全框架概览 Google 的 Secure AI Framework (SAIF) (2025. 04 发布) 图:Google SAIF 框架结构 谷歌(Google)推出的 Secure AI Framework,... --- ### “清朗”利剑斩向AI滥用:13大关注点详解中国AI治理新方向 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/news/qinglanglijianban/ - 分类目录: AI新闻 近日,中央网信办启动了“清朗·整治AI技术滥用”专项行动,针对当前人工智能发展中出现的若干问题划定了清晰的治理红线。此举旨在引导AI技术健康发展,防范潜在风险。该专项行动聚焦13个重点方向,分为两个阶段实施,对AI产品、服务、内容及行为规范提出了细致要求。 第一阶段:源头治理与基础建设 行动的第一阶段着重于AI技术的源头治理,目标是清理违规AI应用,强化内容标识管理,并提升平台的检测鉴伪能力。 违规AI产品需完成上线合规 监管部门指出,利用生成式人工智能技术向公众提供服务的应用,必须履行大模型备... --- ### Trae IDE 指南:轻松配置自定义 AI 规则 (Trae Rules) - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/shicao/trae-ide-zhinanbu/ - 分类目录: AI实操教程 随着人工智能在编程领域的应用日益深入,许多开发者在体验到 AI 辅助编程的便捷之后,便期望能够拥有一个更懂自己需求的“专属 AI 工程师”。这种需求的核心在于,让 AI 能够精确遵循开发者的个性化指令和特定项目规范进行工作。为了满足这一需求, Trae IDE 推出了 AI 规则(Trae Rules)配置功能,允许用户为 AI 定制行为,从而实现个性化任务的自动化执行。 一、什么是 Rules Trae Rules 是一项强大的功能,它允许开发团队或个人开发者自定义并强制 AI 在代码生成、解... --- ### Hula:将自拍一键生成病毒式短视频和个性化贴纸 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/tool/hula/ - 分类目录: AI工具库 - 标签: AI社交媒体 Hula 是一个人工智能驱动的创意工具,旨在通过简单的一键操作,将用户自拍转化为病毒式传播的视频、多种风格的形象和个性化贴纸包。开发商 Prequel Inc. 打造的这款应用支持 iOS 和 Android 平台,适合热衷于社交媒体的内容创作者。用户上传一张自拍,即可生成动漫、复古或时尚风格的视频和贴纸,轻松分享到 Instagram、TikTok 或 WhatsApp。Hula 提供免费功能和订阅模式,部分高级功能需付费解锁。应用操作直观,生成速度快,助力用户快速实现创意表达。 功能列表 一... --- ### LoveyDovey - Published: 2025-05-06 - Modified: 2025-05-21 - URL: https://www.kdjingpai.com/ai-life/loveydovey/ - 分类目录: AI生活娱乐, 角色扮演 - 标签: AI角色扮演 LoveyDovey 是一个以AI驱动的聊天应用,专注于为用户提供与虚拟角色的实时互动体验。用户可以创建自己的角色或选择现有角色,展开浪漫、友情或其他类型的对话。应用通过高度定制化的角色设定和多样的聊天模式,模拟真实的情感交流,让用户沉浸在个性化的故事中。无论是寻求情感支持还是创作独特的故事,LoveyDovey 都能满足用户的多样需求。应用支持多语言,覆盖全球用户,已在 iOS 和 Android 平台上线,下载量超过72万次。 功能列表 角色创建与定制 :用户可以设定角色的性别、性格、背景故... --- ### AIstudioProxyAPI:无限使用 Gemini 2.5 Pro 模型 API - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/tool/aistudioproxyapi/ - 分类目录: AI工具库 - 标签: AI开源项目, 免费大模型API AIstudioProxyAPI 是一个开源项目,使用 Node. js 和 Playwright 技术,通过模拟 OpenAI API 的方式,将 Google AI Studio 网页版的 Gemini 模型对话功能转换为标准 API 接口。开发者可以利用这个代理服务,让支持 OpenAI API 的客户端(如 Open WebUI、NextChat)直接访问 Google AI Studio 的无限额度功能。项目无需复杂配置,适合希望快速集成 Google AI Studio 能力的开发者... --- ### Step1X-Edit:自然语言指令编辑图像的开源工具 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/tool/step1x-edit/ - 分类目录: AI工具库 - 标签: AI图像编辑, AI开源项目 Step1X-Edit 是一个开源图像编辑框架,由 Stepfun AI 团队开发,托管于 GitHub。它结合多模态大语言模型(Qwen-VL)和扩散变换器(DiT),让用户通过简单的自然语言指令编辑图像,例如更改背景、移除物体或转换风格。项目于 2025 年 4 月 25 日发布,性能接近闭源模型如 GPT-4o 和 Gemini 2 Flash。Step1X-Edit 提供模型权重、推理代码和 GEdit-Bench 基准测试,支持广泛的编辑场景。Apache 2. 0 许可证允许免费使用... --- ### Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/tool/klavis-ai/ - 分类目录: AI工具库 - 标签: AI开源项目, MCP服务 Klavis AI 是一个开源平台,专注于简化模型上下文协议(MCP)的使用和集成。MCP 是一种开放标准,允许 AI 应用与外部工具和数据源动态连接。Klavis AI 提供 Slack、Discord 客户端、托管的 MCP 服务器和简单网页界面,降低技术门槛,让非技术用户也能轻松使用,开发者也能快速构建和扩展 MCP 应用。平台支持多种工具集成,强调安全性,提供 OAuth 认证,确保数据访问安全。 功能列表 提供 Slack 和 Discord 的 MCP 客户端,支持在聊天平台直接使用... --- ### RealtimeVoiceChat - Published: 2025-05-06 - Modified: 2025-05-21 - URL: https://www.kdjingpai.com/ai-audio/realtimevoicechat/ - 分类目录: AI音频, 语音互动 - 标签: AI开源项目, 多模态实时互动产品 RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回复,再将文字转为语音输出,整个过程接近实时。项目采用客户端-服务器架构,强调低延迟,支持 WebSocket 流式传输和动态对话管理。它提供 Docker 部署,推荐在 Linux 系统和 NVIDIA GPU 环境下运行,集成了 RealtimeSTT、RealtimeTTS 和 Ollama 等技术,适合... --- ### 扣子空间系统提示词 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/prompts/kouzikongjianxitongan/ - 分类目录: AI实用指令 提示词 你是任务执行专家,擅长根据用户的需求,调用多个工具完成当前任务。 # 消息模块说明 - 必须使用工具(函数调用)进行响应,禁止使用纯文本响应 - 尽量独立解决问题,在必要的时候才使用 message_ask_user 工具与用户进行交互 - 使用 message_notify_user 工具向用户发送任务处理的关键通知。 # 任务执行工作流 1. **理解任务**:使用 sequentialthinking 工具(该工具用于分析任务需求、分解步骤并制定执行计划)深刻理解当前任务。 2. ... --- ### NotebookLM 系统提示词 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/prompts/notebooklm-xitongti/ - 分类目录: AI实用指令 近期 NotebookLM 已经支持中文 ,这是目前我认为免费产品中且较为推荐的个人知识管理工具。 NotebookLM 最主要的两个功能是:引用准确来源问答和生成双人对话播客。 引用来源准确来源问答提示词 You are a helpful expert who will respond to my query drawing on information in the sources and our conversation history. My query may be a questi... --- ### 微软 GitHub Copilot 系统提示词解析 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/prompts/weiruan-github-copilo/ - 分类目录: AI实用指令 对于希望与大语言模型 (LLM) 高效协作的用户和开发者而言,设计精良的系统提示词 (System Prompt) 至关重要。它如同为 AI 精心准备的行动纲领和行为手册,直接影响 AI 的响应质量、行为一致性和任务完成能力。本文将深入剖析一个结构复杂、内容详尽的系统提示词,提炼其撰写技巧,帮助读者学习如何构建更强大的 AI 指导指令。 提示词核心目标: 指导一个 AI 编程助手 (GitHub Copilot) 如何响应用户请求,特别是如何有效利用外部工具 (functions) 来完成任务,... --- ### Claude 网页版与 API 体验差异:解密近十万字的系统提示词 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/prompts/claude-wangyebanyu/ - 分类目录: AI实用指令 许多用户观察到,直接调用 Anthropic 公司的 Claude API 所获得的体验,似乎与 Claude 官方网页版存在细微但可感知的差异。这种差异很大程度上源于网页版背后复杂的系统提示词(System Prompt)设计。 这些提示词究竟蕴含了哪些机制?它们如何定义规则、管理内容生成(如 Artifacts)、调用外部工具(如网络搜索、Google Drive),并最终塑造了用户与 Claude 的交互体验?一份近期泄露的、包含近十万字符的 Claude 系统提示词文件,为我们揭示了这些... --- ### OpenAI 天价收购 Windsurf:AI 编码赛道的战略落子与市场震荡 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/news/openai-tianjiashougou/ - 分类目录: AI新闻 2025 年 5 月 5 日,人工智能领域的领头羊 OpenAI 确认了一笔引人注目的交易:以约 30 亿美元收购 AI 编码工具初创公司 Windsurf 。这不仅是 OpenAI 迄今为止最大手笔的收购,超过了之前对 Rockset 和 Multi 等公司的收购,更在竞争激烈的 AI 编码领域投下了一颗重磅炸弹。 这笔交易的消息最早由彭博社记者 Rachel Metz 披露,数周前双方已进入谈判阶段。对于 Windsurf 的早期投资者,如 Kleiner Perkins 、 General... --- ### PDF文档转换为可视化网页的提示词 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/prompts/pdfwendangzhuanhuanweiai/ - 分类目录: AI实用指令 提示词 我会给你一个文件,分析内容,并将其转化为美观漂亮的中文可视化网页作品集: ## 内容要求 - 所有页面内容必须为简体中文- 保持原文件的核心信息,但以更易读、可视化的方式呈现- 在页面底部添加作者信息区域,包含: * 作者姓名: * 社交媒体链接: 至少包含Twitter/X:https://www. deepseek. com/ * 版权信息和年份 ## 设计风格 - 整体风格参考Linear App的简约现代设计- 使用清晰的视觉层次结构,突出重要内容- 配色方案应专业、和谐,适合长... --- ### MiMo:高效数学推理与代码生成的小型开源模型 - Published: 2025-05-06 - Modified: 2025-05-06 - URL: https://www.kdjingpai.com/tool/mimo/ - 分类目录: AI工具库 - 标签: AI开源项目 MiMo 是小米公司开发的一个开源大语言模型项目,专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型,包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学习模型 (RL-Zero) 和从 SFT 模型训练的强化学习模型 (RL)。这些 70 亿参数模型通过优化预训练数据、多重令牌预测 (MTP) 和强化学习,展现出媲美更大模型的推理能力。MiMo-7B-RL 在数学和代码任务中性能突出,可匹敌 OpenAI o1-mini。模型支持 vLLM 和 SGLang... --- ### Muyan-TTS:个性化播客语音训练与合成 - Published: 2025-05-06 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/muyan-tts/ - 分类目录: AI工具库 - 标签: AI开源项目, AI文本转语音 Muyan-TTS 是一个专为播客场景设计的开源文本转语音(TTS)模型。它通过超过10万小时的播客音频数据预训练,支持零样本语音合成,生成高质量的自然语音。模型基于 Llama-3. 2-3B 构建,结合 SoVITS 解码器,提供高效的语音生成能力。Muyan-TTS 还支持通过几十分钟的单人语音数据进行个性化语音定制,适合特定音色的需求。项目以 Apache 2. 0 许可证发布,提供完整训练代码、数据处理流程和模型权重,托管在 GitHub、Hugging Face 和 ModelSco... --- ### CAD-MCP:通过自然语言指令控制CAD软件的MCP服务 - Published: 2025-05-06 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/cad-mcp/ - 分类目录: AI工具库 - 标签: AI开源项目, MCP服务 CAD-MCP 是一个开源项目,允许用户通过自然语言指令控制 CAD 软件进行绘图操作。它结合了自然语言处理和 CAD 自动化技术,让用户无需手动操作 CAD 界面,只需输入简单的文字命令即可创建和修改图纸。项目支持多种主流 CAD 软件,如 AutoCAD、GstarCAD 和 ZWCAD,适合工程设计和建筑绘图领域。CAD-MCP 运行在 Python 环境下,通过模型控制协议(MCP)实现与 CAD 软件的交互。用户可通过启动服务器并发送指令,快速完成绘图任务,简化操作流程,提高效率。 功... --- ### Cotrans:一站式漫画图片翻译器(开源免费) - Published: 2025-05-06 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/cotransmanyizhana/ - 分类目录: AI工具库 - 标签: AI翻译 manga-image-translator(Cotrans翻译器开源版),用于翻译漫画或图片中的文字。提供命令行交互方式和在线演示,拥有批量转换模式、web服务器模式等多样化的使用选项。可设置多种语言目标翻译和识别参数,配有详尽的安装和使用教程。 针对群内、各个图站上大量不太可能会有人去翻译的图片设计,让我这种日语小白能够勉强看懂图片 主要支持日语,汉语、英文和韩语 支持图片修补和嵌字 该项目是求闻转译志的 v2 版本 功能列表 批量翻译模式 Web服务器模式 CLI使用方式 多语言支持 Nv... --- ### GraphGen:利用知识图谱生成合成数据微调语言模型 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/graphgen/ - 分类目录: AI工具库 - 标签: AI开源项目, 大模型微调, 知识图谱 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从源文本构建细粒度知识图谱,利用预期校准误差(ECE)指标识别模型知识盲点,优先生成针对高价值、长尾知识的问答对。GraphGen 支持多跳邻域采样以捕获复杂关系信息,并通过风格控制生成多样化数据。项目采用 Apache 2. 0 许可证,代码公开,适用于学术研究和商业开发。用户可通过命令行或 Gradio 界... --- ### ACI.DEV:通过MCP服务器为AI智能体集成600+工具 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/acidev/ - 分类目录: AI工具库 - 标签: AI开源项目, MCP服务 ACI. dev 是一个开源基础设施平台,专为 AI 智能体提供与 600 多种工具的快速集成。它通过多租户认证和细粒度权限管理,确保智能体安全访问工具,如 Google Calendar、Slack 和 Brave Search。开发者可通过直接函数调用或统一的 MCP 服务器使用工具,灵活适配任何大型语言模型框架。ACI. dev 提供 Python SDK 和详细文档,支持快速开发生产环境开箱即用的 AI 智能体。 功能列表 集成 600+ 工具,支持 Google Calendar、Sl... --- ### llm.pdf:在PDF文件中运行大型语言模型的实验项目 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/llmpdf/ - 分类目录: AI工具库 - 标签: AI开源项目, 本地部署开源大模型工具 llm. pdf 是一个开源项目,允许用户在 PDF 文件中直接运行大型语言模型(LLM)。这个项目由 EvanZhouDev 开发,托管在 GitHub 上,展示了一种创新的方法:通过 Emscripten 将 llama. cpp 编译为 asm. js,并结合 PDF 的 JavaScript 注入功能,让 LLM 的推理过程完全在 PDF 文件中完成。项目支持 GGUF 格式的量化模型,推荐使用 Q8 量化模型以获得最佳性能。用户可以通过提供的 Python 脚本生成包含 LLM 的 P... --- ### Abogen:将多种文本格式转换为有声读物的工具 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/abogen/ - 分类目录: AI工具库 - 标签: AI开源项目, AI语音转文本 Abogen 是一个开源工具,专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音,同时支持同步字幕生成,适合制作有声读物、视频配音或学习辅助材料。用户可以选择多种语言和男女声,调整字幕粒度,甚至混合不同语音模型以创建独特的声音效果。Abogen 支持 WAV、FLAC、MP3 和 M4B 等音频格式,操作简单,兼容 Windows、Linux 和 macOS。 功能列表 支持 ePub、PDF 和 TXT 文件输入,自动提取文本... --- ### Local Deep Research:本地运行的生成深度研究报告工具 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/local-deep-research/ - 分类目录: AI工具库 - 标签: AI开源项目, 生成深度研究报告 Local Deep Research 是一个开源的人工智能研究助手,旨在帮助用户针对复杂问题进行深度研究并生成详细的报告。它支持本地运行,使用户可以在不依赖云服务的情况下完成研究任务。工具结合了本地大语言模型(LLM)与多种搜索功能,覆盖学术数据库、维基百科、网页内容等来源。用户可以通过简单的安装和配置,快速生成包含引文的综合报告。项目强调隐私保护和灵活性,适合学术研究、技术探索或个人知识管理。 功能列表 支持本地大语言模型,保护数据隐私。 自动选择合适的搜索工具,如维基百科、arXiv、Pu... --- ### DeepWiki:自动生成GitHub仓库文档并用AI对话 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/deepwiki/ - 分类目录: AI工具库 - 标签: AI搜索工具 DeepWiki 是一个由 Cognition AI 推出的免费工具,专注于为 GitHub 仓库生成结构化、类似维基百科的文档。它通过分析代码、README 文件和配置文件,自动创建详细的文档和交互式图表,帮助开发者快速理解复杂代码库。用户只需将 GitHub 仓库的 URL 中的 "github" 替换为 "deepwiki",即可访问生成的文档页面。该工具支持超过 30,000 个仓库,覆盖 40 亿行代码,特别适合开源项目。DeepWiki 还提供 AI 对话功能,允许用户通过自然语言提... --- ### Trackers:用于视频对象跟踪的开源工具库 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/trackers/ - 分类目录: AI工具库 - 标签: AI开源项目, 视觉目标检测 Trackers 是一个开源的 Python 工具库,专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法,如 SORT 和 DeepSORT,允许用户结合不同的对象检测模型(如 YOLO、RT-DETR)进行灵活的视频分析。用户可以通过简单的代码实现视频帧的检测、跟踪和标注,适用于交通监控、工业自动化等场景。 功能列表 支持多种跟踪算法,包括 SORT 和 DeepSORT,未来计划增加更多算法。 兼容主流对象检测模型,如 YOLO、RT-DETR 和 RFDETR。 提供视频帧标注功能,支持... --- ### Kimi-Audio:开源音频处理与对话基础模型 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/kimi-audio/ - 分类目录: AI工具库 - 标签: AI开源项目, AI文本转语音, AI语音转文本 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型,专注于音频理解、生成和对话。它支持多种音频处理任务,例如语音识别、音频问答和语音情感识别。模型经过超过 1300 万小时的音频数据预训练,结合创新的混合架构,在多个音频基准测试中表现优异。Kimi-Audio 提供模型权重、推理代码和评估工具包,方便开发者在研究和应用中集成。它适合需要高效音频处理和对话能力的场景,文档清晰,支持 Docker 部署,社区活跃,持续更新。 功能列表 语音识别(ASR):将音频转为文本,... --- ### Describe Anything:为图像和视频区域生成详细描述的开源工具 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/describe-anything/ - 分类目录: AI工具库 - 标签: AI开源项目, 视觉目标检测 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目,核心是 Describe Anything Model(DAM)。这个工具能根据用户在图像或视频中标记的区域(如点、框、涂鸦或掩码),生成详细的描述。它不仅能描述静态图像的细节,还能捕捉视频中区域随时间的变化。 功能列表 支持多种区域标注方式:用户可通过点、框、涂鸦或掩码指定图像或视频的描述区域。 图像和视频描述:为静态图像生成详细描述,或分析视频中特定区域的动态变化。 开源模型与数据集:提供 DAM-3B 和... --- ### Cooragent:一句话构建多智能体任务协作工具 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/cooragent/ - 分类目录: AI工具库 - 标签: AI开源项目, 智能体开发框架 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架,托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理,并支持多个代理协作完成复杂任务。框架提供两种模式:Agent Factory 自动生成定制化代理,Agent Workflow 通过任务规划实现多代理协作。Cooragent 深度兼容 Langchain 工具链,支持 MCP 协议,确保代理间高效通信。开发者可通过 CLI 工具或 API 快速构建、编辑和管理代理。 功能列表 Agent Facto... --- ### InstantCharacter:从单张图片生成一致性角色的开源工具 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/instantcharacter/ - 分类目录: AI工具库 - 标签: AI图像风格控制, AI开源项目 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目,托管在 GitHub 上。它通过一张参考图片和一句文本描述,就能生成外观一致的角色图像,适用于多种场景和风格。项目基于扩散变换器(Diffusion Transformer)技术,突破了传统 U-Net 架构的限制,提供更高的图像质量和灵活性。用户无需复杂调参,只需简单操作即可生成符合描述的角色图像,广泛应用于动画、游戏和数字艺术等领域。项目支持 Flux. 1 模型,并提供风格 LoRA ... --- ### Claude生成深度研究报告的MCP服务 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/mcp-server-deep-research/ - 分类目录: AI工具库 - 标签: AI开源项目, MCP服务, 生成深度研究报告 MCP Server Deep Research 是一个开源工具,通过人工智能和网页搜索,自动为复杂问题生成结构化的研究报告。用户输入研究问题,工具会分解问题、搜索权威信息、评估来源可信度,并生成包含引用的 Markdown 报告。它基于 Model Context Protocol (MCP),与 Claude Desktop 等平台无缝集成,适合学术研究、市场分析和内容创作。 功能列表 自动分解研究问题,生成子问题,覆盖主题多方面。 集成网页搜索,查找权威信息,收集多样化观点。 评估来源可信... --- ### Deep Recall:为大模型提供企业级记忆框架的开源工具 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/deep-recall/ - 分类目录: AI工具库 - 标签: AI开源项目, 知识检索与RAG框架 Deep Recall 是一个开源的企业级记忆框架,专为大型语言模型(LLM)设计。它通过高效的上下文检索和整合,提供超个性化的响应能力。框架采用三层架构,包括记忆服务、推理服务和协调器,支持GPU优化推理和向量数据库整合。Deep Recall 适用于云端和本地部署,具备自动化扩展功能,确保高性能和可靠性。它不仅提升模型的上下文感知能力,还能根据用户历史和偏好生成定制化回复,非常适合需要深度个性化交互的场景。 功能列表 高效上下文检索:快速从用户历史交互中提取相关信息。 个性化响应生成:根据用... --- ### CleverBee:开源AI研究助手,生成引证研究报告 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/cleverbee/ - 分类目录: AI工具库 - 标签: AI开源项目, 生成深度研究报告 CleverBee 是一个开源的 AI 研究助手,托管在 GitHub 上,由 SureScaleAI 开发。它通过大语言模型(如 Gemini 和 Claude)结合网页浏览技术,帮助用户快速收集、分析和总结信息,生成带引证的研究报告。用户可以轻松获取网页、PDF、YouTube 视频或学术资源的精准内容。CleverBee 支持云端和本地模型,适合学术研究、商业分析等场景。它的界面基于 Chainlit,操作简单直观,配置灵活,适合个人和研究团队使用。 功能列表 支持多种大语言模型,包括 G... --- ### FantasyTalking:生成真实感说话肖像的开源工具 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/fantasytalking/ - 分类目录: AI工具库 - 标签: AI开源项目, AI数字人 FantasyTalking 是一个由 Fantasy-AMAP 团队开发的开源项目,专注于通过音频驱动生成真实感说话肖像视频。项目基于先进的视频扩散模型 Wan2. 1,结合音频编码器 Wav2Vec 和专有模型权重,利用人工智能技术实现高度逼真的唇部同步和面部表情。它支持多种风格的肖像生成,包括真实人物和卡通形象,适用于全景、半身或特写等多种视角。用户可以通过简单的命令行操作,输入图像和音频,快速生成高质量的说话视频。 功能列表 生成真实感说话肖像视频,唇部动作与音频高度同步。 支持多种视角... --- ### Paper2Code - Published: 2025-05-05 - Modified: 2025-05-21 - URL: https://www.kdjingpai.com/ai-learning/paper2code/ - 分类目录: AI教育学习, 深度研究智能体 - 标签: AI开源项目, 智能体应用 Paper2Code 是一个开源项目,旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型(LLM)系统 PaperCoder,将科学论文自动转化为可运行的代码仓库。系统采用规划、分析和代码生成三阶段流程,由专门的代理分别处理,生成高质量、忠实于论文的代码实现。项目以著名的“Attention Is All You Need”论文为例,展示了从论文到 Transformer 模型代码的转化能力。它支持 PDF 和 LaTeX 格式的论文输入,适用于机器学习研究人员、开发者及学生。Pap... --- ### DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/deepwiki-open/ - 分类目录: AI工具库 - 标签: AI开源项目 DeepWiki-Open 是一个开源项目,专为 GitHub、GitLab 和 Bitbucket 的代码仓库自动生成结构化文档。它利用 AI 技术分析代码结构、文件内容和逻辑关系,快速生成类似维基百科的知识库页面。用户只需输入仓库 URL,即可获得代码架构、功能模块和实现细节的清晰说明。项目支持本地部署,数据存储在本地,保障隐私安全。它还提供检索增强生成(RAG)功能,允许用户与代码库进行上下文问答,并通过 DeepResearch 功能深入研究复杂问题。DeepWiki-Open 由 As... --- ### Audibit:将热门科技文章转为随时收听的音频播客 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/tool/audibit/ - 分类目录: AI工具库 - 标签: AI开源项目, AI文本转语音 Audibit 是一个开源项目,核心功能是将 Hacker News、TechCrunch 等热门科技文章自动转为音频播客,让用户在通勤、健身或忙碌时通过 Web 端或移动端收听资讯。项目使用 Next. js 和 React 开发前端,结合 OpenAI 和 Lemonfox 的文本转语音技术生成高质量音频。Audibit 支持零配置快速上手,内容通过 GitHub Action 定时更新,部署在 Netlify 上。用户可自定义文章源,社区可通过 GitHub 贡献代码。项目采用 AGPL-... --- ### 你的AI生活指南:探索生成式AI的18种日常应用 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/news/nideaishenghuozhinan/ - 分类目录: AI新闻 近期观察显示,生成式人工智能(AI)正悄然渗透进人们的日常生活,其应用场景已远超最初普遍认为的工作辅助范畴。印度金融科技公司 CRED 的创始人 Kunal Shah 在4月的一次峰会上提到,高达五至六成的 ChatGPT 用户正将这项技术用于处理非工作相关的日常任务,例如寻求情感陪伴、娱乐消遣,甚至包括获取占星建议。 这一趋势也得到了 filtered. com 联合创始人 Marc Zao-Sanders 的印证。他在《哈佛商业评论》的文章中指出,过去一年里,AI 的使用重心已从自动化工作流... --- ### Little Language Lessons - Published: 2025-05-05 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/ai-learning/little-language-lessons/ - 分类目录: AI教育学习, 翻译/语言学习 - 标签: AI教育工具 Google Labs的Little Language Lessons(简称LLL)是一个基于Gemini AI的交互式英语学习平台,提供一系列小型实验,帮助用户通过趣味对话和场景练习提升英语能力。LLL设计简洁,适合初学者、学生和职场人士,免费提供三种核心实验:Tiny Lesson、Slang Hang和Word Cam。平台支持多语言界面(英语、西班牙语、法语、葡萄牙语),通过AI驱动的个性化反馈和沉浸式体验,降低语言学习难度,让用户轻松掌握词汇、语法和口语表达。 功能列表 Tiny Le... --- ### Cursor 哪个 AI 模型最适合你的编码任务? - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/aidayi/cursor-nage-ai-mo/ - 分类目录: AI答疑 近期,AI 辅助编程工具 Cursor 公布了一份开发者偏爱的 AI 模型排行榜,数据显示 Claude 3. 7 Sonnet 模型占据了榜首位置。 这份官方数据无疑反映了相当一部分开发者的选择。但这是否意味着开发者应该直接将 Claude 3. 7 Sonnet 作为默认选项?实际使用情况可能更为复杂。 观察一些资深开发者的使用习惯,会发现其模型选择比例与官方榜单存在显著差异。例如,在 Cursor 中,Gemini 2. 5 Pro 的使用率可能高达 80%,Claude 3. 7 Son... --- ### 教程:将 FastGPT 知识库无缝集成到 n8n 工作流 (基于 MCP 协议) - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/shicao/jiaochengjiang-fastgpt/ - 分类目录: AI实操教程 背景:n8n 与 RAG 知识库集成的挑战 n8n 作为一款强大的开源自动化工作流工具,正获得越来越多用户的青睐。它由前《加勒比海盗》视觉设计师 Jan Oberhauser 于 2019 年创立,旨在提供比 Zapier 等工具更灵活、成本更低的自动化方案。 n8n 秉持“自由可持续,开放且务实”的理念,其核心在于通过 可视化与代码 双模式,让用户能够连接不同应用,实现复杂流程的自动化(官方文档:https://docs. n8n. io/)。用户熟悉后,用其构建简单的工作流通常相当快捷,并且... --- ### OpenRouter 充值指南:如何使用支付宝与微信支付 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/aidayi/openrouter-chongzhizhi/ - 分类目录: AI答疑 背景:OpenRouter 及其支付选项 OpenRouter 提供了一个集成的平台,允许开发者和用户通过统一的 API 接口访问来自不同提供商的多种大型语言模型。对于希望利用这些高级 AI 功能的用户而言,向账户充值是使用付费模型的必要步骤。值得注意的是, OpenRouter 近期已支持通过支付宝( Alipay )和微信支付( WeChat Pay )进行充值,这极大地方便了没有国际信用卡或偏好使用本地支付方式的用户群体。本文将详细介绍如何使用支付宝或微信为 OpenRouter 账户充值... --- ### OpenRouter 调整免费额度与速率限制 - Published: 2025-05-05 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/aidayi/openrouter-diaozhengmian/ - 分类目录: AI答疑 OpenRouter 作为聚合了全球众多主流大语言模型 API 的平台,近期对其免费使用政策和速率限制进行了显著调整。该平台因其便捷性——提供单一 API Key 调用包括 DeepSeek 、 Qwen 、 GPT 、 Claude 、 Gemini 、 Grok 在内的多种模型,并支持国内用户直接访问及支付宝、微信支付,吸引了大量开发者和 AI 爱好者。然而,最新的政策变动对不同用户群体产生了直接影响。 此次调整的核心在于免费额度和速率限制的变化,这反映了平台可能在寻求更可持续的运营模式,并... --- ### Google NotebookLM 拓展中文等多语言能力,并推出移动应用 - Published: 2025-05-04 - Modified: 2025-05-04 - URL: https://www.kdjingpai.com/news/google-notebooklm-ao/ - 分类目录: AI新闻 Google 旗下的 AI 笔记工具 NotebookLM 近期获得更新,其发展路径日益清晰,正朝着成为一款重要的个人知识管理和生产力工具迈进。最新的进展包括对中文等多种语言的音频播报支持,以及即将推出的移动应用程序。 NotebookLM 自去年发布以来,凭借其将用户上传的文档、网页链接或文本笔记转化为结构化信息的能力受到关注。其功能集包括内容摘要、自动生成时间线和交互式思维导图等。 然而,该工具中最引人注目的功能之一是“音频概览”( Audio Overviews )。该功能允许用户上传多种... --- ### JetBrains 开源 Mellum:专为代码补全设计的专用模型 - Published: 2025-05-04 - Modified: 2025-05-04 - URL: https://www.kdjingpai.com/news/jetbrains-kaiyuan-mel/ - 分类目录: AI新闻 软件开发工具供应商 JetBrains 近日宣布,将其专门为代码补全设计的语言模型 Mellum 的基础版本开源,并在 Hugging Face 平台上提供。此举旨在推动 AI 在软件开发领域的透明度与协作。 Mellum 的设计哲学并非追求无所不包,而是专注于一项核心任务:代码补全。 JetBrains 将这类模型称为 专用模型 (specialized model),强调其设计目标是在特定领域具备深度能力,而非盲目追求广泛的通用性。该模型支持多种编程语言的代码补全,包括 Java, Kotl... --- ### 使用 Cursor 开发 Dify 插件的提示词 - Published: 2025-05-04 - Modified: 2025-05-04 - URL: https://www.kdjingpai.com/prompts/shiyong-cursor-kaifa/ - 分类目录: AI实用指令 You are a senior developer that can help me with developing Dify Plugin Tool, which is an AI Agent Tool that can be used on AI Agent Development Tool, Dify. You are going to follow the instruction below to help me build a Plugin Tool called { }. The ... --- ### On Device AI:iPhone本地运行的AI语音转录与聊天工具 - Published: 2025-05-04 - Modified: 2025-05-04 - URL: https://www.kdjingpai.com/tool/on-device-ai/ - 分类目录: AI工具库 - 标签: AI本地化聊天应用, AI语音转文本 On-Device AI 是一款完全离线运行的AI应用,专为苹果设备设计,支持iOS、macOS和visionOS。它提供本地大型语言模型(LLM)运行、实时语音转录、文档分析等功能,无需联网即可使用,确保数据隐私。用户可通过语音转文字、AI聊天、网页搜索和自定义AI角色完成多种任务。应用支持Llama、Gemini、DeepSeek等模型,深度整合苹果生态,运行效率高。On-Device AI 适合注重隐私保护的用户,提供安全、便捷的AI体验。 功能列表 语音转录:实时将语音转为文字,支持多语... --- ### VoltAgent:快速构建AI智能体的TypeScript开源框架 - Published: 2025-05-04 - Modified: 2025-05-04 - URL: https://www.kdjingpai.com/tool/voltagent/ - 分类目录: AI工具库 - 标签: AI开源项目, 低代码工作流, 智能体开发框架 VoltAgent 是一个开源的 TypeScript 框架,专为开发者设计,帮助快速构建和协调 AI 智能体。它提供模块化的工具和标准化的开发模式,简化了与大型语言模型(LLM)交互、状态管理和外部工具集成的复杂性。开发者可以用它创建聊天机器人、虚拟助手或复杂的多智能体系统。VoltAgent 避免了从零开始开发的繁琐,也突破了无代码平台的限制。它支持多种 LLM 模型,如 OpenAI、Google 和 Anthropic,且提供本地调试控制台,让开发者轻松监控智能体运行状态。项目通过 Gi... --- ### Quick Prompt - Published: 2025-05-04 - Modified: 2025-05-22 - URL: https://www.kdjingpai.com/ai-chat/quick-prompt/ - 分类目录: AI对话, Prompt辅助 - 标签: AI开源项目, PROMPTS辅助工具 Quick Prompt 是一个开源的浏览器扩展,专注于提示词(Prompt)的管理和快速输入。用户可以创建、组织和存储提示词库,并在任何网页的输入框中快速插入预设的提示词内容。这个工具特别适合需要频繁使用AI模型(如ChatGPT、Grok等)进行内容生成的用户,比如开发者、内容创作者和研究人员。它支持Chrome、Edge、Firefox等主流浏览器,安装简单,界面直观。通过Quick Prompt,用户可以轻松管理复杂的提示词集合,提升AI交互效率。项目托管在GitHub,由开发者weny... --- ### Qwen3 发布:深入思考与快速响应并存的新一代大语言模型 - Published: 2025-05-01 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/news/qwen3-fabushenba/ - 分类目录: AI新闻 大型语言模型领域迎来了新成员。近日, Qwen 系列大语言模型发布了其最新版本 Qwen3。据开发团队介绍,其旗舰模型 Qwen3-235B-A22B 在编码、数学及通用能力等基准测试中,展现出与 DeepSeek-R1 , o1 , o3-mini , Grok-3 及 Gemini-2. 5-Pro 等业界顶尖模型相匹敌的性能。这些竞品的选择,反映了 Qwen3 旨在与当前性能标杆直接对话的定位。 值得关注的是,小型混合专家( MoE )模型 Qwen3-30B-A3B 据称在性能上超越了参... --- ### OpenAI 开放最新图像生成 API,gpt-image-1 模型全面开放 - Published: 2025-04-24 - Modified: 2025-05-05 - URL: https://www.kdjingpai.com/news/openai-kaifangzuixina/ - 分类目录: AI新闻 OpenAI 近期宣布将其最新的图像生成模型 gpt-image-1 正式通过 API 提供给开发者和企业。该模型此前已在 ChatGPT 中应用,并因其强大的图像生成能力受到用户欢迎。据 OpenAI 方面透露,在 ChatGPT 中集成该功能的第一周,全球用户就创建了超过 7 亿张图片。现在,通过 API 的形式开放,意味着第三方可以将这种图像生成能力直接整合到自己的应用和服务中。 gpt-image-1 被描述为一个原生的多模态模型,能够同时接受文本和图像作为输入,并生成图像输出。这种特性... --- ### Suna:集成浏览器操作与数据分析的智能代理 - Published: 2025-04-24 - Modified: 2025-04-24 - URL: https://www.kdjingpai.com/tool/suna/ - 分类目录: AI工具库 - 标签: AI开源项目, 桌面自动化智能体, 生成深度研究报告 Suna 是 Kortix AI 开发的一个开源通用 AI 代理,托管在 GitHub 上,基于 Apache 2. 0 许可证,允许用户免费下载、修改和自托管。它通过自然语言对话帮助用户完成复杂任务,如网页浏览、文件管理、数据抓取和网站部署。Suna 采用模块化架构,包括 Python/FastAPI 后端、Next. js/React 前端、Supabase 数据库和 Daytona 沙盒,确保安全性和灵活性。它支持与 OpenAI、Anthropic 等大语言模型集成,并通过 Tavily... --- ### Corgea:自动修复代码漏洞的AI安全平台 - Published: 2025-04-24 - Modified: 2025-04-24 - URL: https://www.kdjingpai.com/tool/corgea/ - 分类目录: AI工具库 - 标签: AI开放服务 Corgea 是一个基于人工智能的代码安全平台,专注于帮助开发者和安全团队发现、分析并自动修复代码中的漏洞。它通过与现有静态应用安全测试(SAST)工具(如 Snyk 和 Semgrep)集成,扫描代码中的潜在问题,并利用 AI 生成高质量的修复代码,供开发者审查。Corgea 支持多种编程语言,包括 Java、Python、Go 等,覆盖业务逻辑错误、身份验证漏洞等复杂问题。它能减少约 30% 的误报,显著降低修复成本和时间,平均节省 80% 的开发工作量。平台操作简单,可通过 GitHub ... --- ### Spring.new - Published: 2025-04-24 - Modified: 2025-05-21 - URL: https://www.kdjingpai.com/ai-business/springnew/ - 分类目录: AI商业应用, 无代码开发 - 标签: 智能体应用 Spring. new 是一个基于人工智能的在线平台,专注于帮助营销经理和产品经理快速构建定制化工作流和小型应用。它通过自然语言输入,让用户描述需求,自动生成连接 Notion、Airtable、Slack 等工具的工作流或应用,例如将 Figma 设计转为可交互界面,或创建轻量级 CRM 系统。平台无需用户具备编程经验,操作简单,适合快速迭代的团队。Spring. new 强调即时性,号称从需求到成品只需几分钟,特别适合需要快速上线营销活动或产品功能的用户。 功能列表 自然语言构建 :通过聊天... --- ### Strawberry:自动化任务的AI智能浏览器 - Published: 2025-04-24 - Modified: 2025-04-24 - URL: https://www.kdjingpai.com/tool/strawberry/ - 分类目录: AI工具库 - 标签: 桌面自动化智能体 Strawberry 是一款内置 AI 助手的智能浏览器,旨在帮助用户自动化日常工作,提升效率。它不同于传统浏览器,集成了 AI 技术,能实时理解网页内容,执行复杂任务,如快速研究、内容撰写和数据整理。用户可通过简单的指令让 AI 完成重复性工作,节省时间。Strawberry 强调隐私,所有数据存储在本地,AI 处理时需用户许可。它适合需要高效管理任务的专业人士,目前处于预测试阶段,功能还在完善。 功能列表 快速网页研究:AI 可同时浏览多个网站,提取关键信息并生成摘要。 内容生成:根据用户风... --- ### InternVL:开源多模态大模型,支持图像、视频和文本处理 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/internvl/ - 分类目录: AI工具库 - 标签: AI开源项目 InternVL 是由上海人工智能实验室(OpenGVLab)开发的一个开源多模态大模型项目,托管在 GitHub 上。它集成了视觉和语言处理能力,支持图像、视频和文本的综合理解与生成。InternVL 的目标是打造一个媲美商业模型(如 GPT-4o)的开源替代品,广泛应用于视觉感知、跨模态检索和多模态对话等任务。该项目以其强大的视觉编码器、动态高分辨率支持和高效训练策略著称,模型规模从 1B 到 78B 参数不等,适合从边缘设备到高性能服务器的多种应用场景。代码、模型和数据集均开放,遵循 MI... --- ### roop-unleashed:基于Roop优化的全能换脸工具 - Published: 2025-04-22 - Modified: 2025-05-15 - URL: https://www.kdjingpai.com/ai-life/roop-unleashed/ - 分类目录: AI换脸, AI生活娱乐 - 标签: AI开源项目, AI换脸与换装, AI视频换脸 Roop-Unleashed 是一个基于 Python 的开源 AI 换脸工具,继承自 s0md3v 的 Roop 项目,由开发者 C0untFloyd 继续维护并更名为 Roop-Unleashed。它通过深度学习技术实现图片和视频中的面部替换,效果逼真,操作简单。用户只需上传素材,选择目标面部,即可生成高质量的换脸内容。该工具支持 NVIDIA GPU 加速,也兼容 CPU 运行,适合不同硬件配置。Roop-Unleashed 提供批量处理、实时换脸和 VR 场景支持等功能,广泛应用于娱乐、... --- ### Potpie AI:快速创建专属代码库的AI工程助手 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/potpie-ai/ - 分类目录: AI工具库 - 标签: AI开源项目, AI编程 Potpie AI 是一个开源平台,专注于为开发者提供定制化的AI工程助手。它通过构建代码库的知识图谱,让AI代理深入理解代码结构与逻辑,自动化完成调试、测试、代码生成等任务。用户可以用简单提示词快速创建专属代理,集成到现有开发流程中。平台支持多种编程语言,适合个人开发者与企业团队。Potpie AI 提供 VS Code 插件和 API 接口,操作便捷。它的开源特性允许用户自由探索与扩展,社区活跃,适合追求高效开发的程序员。 功能列表 代码库知识图谱:自动分析代码库,生成知识图谱,捕捉函数调用... --- ### Bilanc:评估开发团队生产力的AI管理工具 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/bilanc/ - 分类目录: AI工具库 - 标签: 专业生产力工具 Bilanc 是一个专注于提升工程团队生产力的AI驱动平台,核心目标是帮助企业管理者洞察开发者工作表现并优化团队效率。它通过人工智能技术分析代码库、集成项目管理工具,生成数据驱动的洞察报告。平台支持与 GitHub、GitLab、JIRA 等主流工具无缝对接,自动生成代码变更摘要、任务分类和性能评估草案。Bilanc 强调以数据为核心,提供 DORA 指标、AI驱动的努力估算等功能,助力管理者精准了解团队工作分配和AI工具对生产力的影响。平台目前由伦敦的初创公司运营,已获得 Y Combinat... --- ### Extrovert:通过AI辅助在LinkedIn上高效建立商业关系 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/extrovert/ - 分类目录: AI工具库 - 标签: AI社交媒体 Extrovert 是一个基于人工智能的LinkedIn关系管理工具,专注于帮助企业销售团队高效建立和维护商业关系。它通过AI分析潜在客户的LinkedIn动态,提供个性化评论、点赞和私信建议,帮助用户快速与目标客户建立信任。Extrovert支持多语言,适合全球用户,能大幅提升销售转化率、缩短销售周期并减少客户流失。平台操作简单,用户只需连接LinkedIn账户,上传目标客户名单,设置互动偏好,即可开始使用。Extrovert强调人工审核,确保所有互动真实自然,符合LinkedIn安全规范。 ... --- ### $150 订阅费换超 $1800 AI 工具?Lenny's Newsletter 年度捆绑包来了 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/news/150-dingyuefeihuanchao/ - 分类目录: AI新闻 Lenny's Newsletter 推出重磅订阅捆绑包:高价值 AI 与生产力工具的集结 近期,在科技和产品增长领域颇具影响力的 Lenny Rachitsky 通过其知名的 Lenny’s Newsletter 推出了一个引人注目的软件订阅捆绑服务。该服务的核心是,只要用户订阅 Lenny’s Newsletter 的年费计划,即可免费获得一系列当前热门 AI 及生产力工具为期一年的高级别使用权。 捆绑包内容与价值分析 根据公布的信息,这个捆绑包涵盖了多款备受关注的工具,其单独订阅的年费价值... --- ### Vexa:实时会议转录与智能知识提取工具 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/vexa/ - 分类目录: AI工具库 - 标签: AI开源项目, AI文本与音频/视频总结工具, AI语音转文本 Vexa 是一个开源的实时会议转录和知识管理平台,旨在为企业和个人提供高效的会议记录与智能知识提取服务。它通过 API 驱动的会议机器人,自动加入 Google Meet、Zoom 等平台,实时将语音转录为文本,并支持 99 种语言。Vexa 采用微服务架构,具备高扩展性,适合处理大量并发转录任务。它强调企业级数据安全,提供本地部署选项,确保合规性。目前,Vexa 处于封闭测试阶段,用户可通过官方网站申请免费测试。Vexa 的目标是成为 recall. ai 的企业级替代品,兼具高性能和丰富功能... --- ### RooFlow:基于 Roo Code 扩展的记忆增强系统 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/rooflow/ - 分类目录: AI工具库 - 标签: AI开源项目, AI编程 综合介绍 RooFlow 是一个开源的AI辅助编程工具,核心功能是通过项目记录保存开发过程中的代码、决策和任务进展。它基于Roo Code扩展,集成了五种模式:架构、编码、测试、调试和问答。这些模式互相协作,帮助开发者在项目中无缝切换任务,并自动保存相关信息。RooFlow 支持通过Footgun功能深度定制AI行为,同时优化令牌使用,降低成本。它适合需要长期项目管理和高效开发的程序员。项目在GitHub上开源,社区活跃,持续更新,适用于VS Code环境。 功能列表 项目记录 :自动保存代码、... --- ### Zev:用自然语言快速查询终端命令的CLI工具 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/zev-cli/ - 分类目录: AI工具库 - 标签: AI开源项目 Zev 是一个简单易用的命令行界面(CLI)工具,帮助用户通过自然语言快速查询和生成终端命令。用户无需记住复杂的命令语法,只需用日常语言描述需求,Zev 就能生成对应的终端命令。基于 OpenAI API 或本地 Ollama 模型,Zev 支持多种操作场景,如文件管理、进程查看、网络检测和 Git 操作等。它的设计初衷是降低命令行使用的门槛,适合开发者和新手。用户需配置 OpenAI API 密钥或本地 Ollama 环境即可使用。Zev 的代码开源在 GitHub,允许用户自由贡献和定制。 ... --- ### Together Open Deep Research:生成带索引的深度研究报告 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/together-open-deep-research/ - 分类目录: AI工具库 - 标签: AI开源项目, 生成深度研究报告 Open Deep Research 是一个由 Together AI 团队开发并开源的深度研究工具,托管在 GitHub 上。它通过多代理人工智能工作流,模拟人类研究过程,生成详细的研究报告。用户只需输入一个研究主题,工具便能自动规划、搜索、评估信息并撰写带引用的报告。项目支持 Python 3. 12+,需要配置 API 密钥以使用外部搜索和语言模型服务。它适用于学术研究、市场分析等场景,强调开源与社区扩展,任何人都可以免费获取代码并根据需求定制。 功能列表 生成综合研究报告:根据用户输入的... --- ### LLManager:智能自动化流程审批与人类审核结合的管理工具 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/llmanager/ - 分类目录: AI工具库 - 标签: AI开源项目, 专业生产力工具 LLManager 是一个开源的智能审批管理工具,基于 LangChain 的 LangGraph 框架开发,专注于自动化处理审批请求,同时结合人类审核优化决策。它通过语义搜索、少样本学习和反思机制,从历史审批中学习,提升审批准确性。用户可通过 Agent Inbox 查看和响应请求,支持自定义审批和拒绝标准,适配多种语言模型(如 OpenAI、Anthropic)。LLManager 适用于企业预算审批、项目管理和合规审查等场景,代码托管于 GitHub,开发者可自由扩展功能。工具强调 AI ... --- ### OpenAI.fm:展示OpenAI语音API的交互式演示工具 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/openaifm/ - 分类目录: AI工具库 - 标签: AI开源项目 openai-fm 是一个开源项目,托管在 GitHub 上,专门用于展示 OpenAI 文本转语音(Text-to-Speech, TTS)API 的功能。这个项目通过一个交互式网页应用,让开发者可以直观体验 OpenAI 的语音生成能力。它使用 NextJS 框架开发,结合 TailwindCSS 和 ShadcnUI 打造简洁现代的界面。用户可以输入文本,选择不同语音和情感风格,生成高质量的语音输出。项目代码完全开源,遵循 MIT 许可证,鼓励开发者克隆、修改和贡献代码。openai-fm... --- ### Fellou:自动化执行任务的原生AI浏览器 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/fellou/ - 分类目录: AI工具库 - 标签: 桌面自动化智能体 Fellou是一款由Fellou AI公司推出的全球首个人工智能行动型浏览器。它不仅具备传统浏览器的网页浏览功能,还通过AI技术实现任务自动化和深度信息搜索。Fellou的核心是“深度行动”技术,能将复杂的操作转化为简单指令,提升用户效率。它支持跨平台搜索、自动任务执行和个性化建议,适合需要高效完成工作的用户。Fellou强调隐私保护,承诺不追踪用户行为,采用军工级安全技术。无论是个人用户还是开发者,Fellou都能通过直观的操作和强大的Eko框架,简化繁琐任务,让用户专注于更有价值的工作。 功... --- ### Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/find-my-kids/ - 分类目录: AI工具库 - 标签: AI开源项目, 视觉目标检测 Find My Kids 是一个开源项目,托管在 GitHub 上,由开发者 Tomer Klein 创建。它结合了 DeepFace 人脸识别技术和 WhatsApp Green API,旨在帮助家长通过 WhatsApp 群组监控孩子的安全。用户可以在群组中分享图片,系统会自动分析图片中的人脸,识别预设的孩子面部特征,并向指定联系人发送实时通知。这款工具适合需要远程关注孩子安全的家庭,操作简单且功能强大。项目使用 Python 开发,支持 Docker 部署,代码开放,允许用户自由修改和优化... --- ### DocAgent:自动生成Python代码文档的智能工具 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/docagent/ - 分类目录: AI工具库 - 标签: AI开源项目 DocAgent 是一个由 Meta AI 开发、开源的 Python 代码文档生成工具。它通过多智能体协作和层次化代码分析,自动为 Python 代码库生成高质量、上下文感知的文档注释(docstrings)。DocAgent 解决了传统语言模型生成文档时缺乏深度和上下文的问题,能够分析代码依赖关系,生成简洁、准确的文档。它适合开发者和团队提升代码可读性和维护性。项目托管在 GitHub,采用 MIT 许可证,支持本地和云端部署,配备 Web 界面便于操作。 功能列表 自动生成上下文感知的 P... --- ### UNO:支持单主体和多主体定制化图像生成工具(适合电商配图) - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/uno/ - 分类目录: AI工具库 - 标签: AI开源项目 UNO 是由 ByteDance 智能创作团队开发的一个开源图像生成框架。它基于 FLUX. 1 模型,专注于通过“少到多”的泛化方式实现单主体和多主体的定制化图像生成。UNO 利用扩散变换器(DiT)的上下文生成能力,结合高一致性的数据合成流程,解决了多主体场景下数据扩展和主体一致性的难题。它支持用户通过文字描述和参考图像生成高质量图像,广泛适用于个性化图像创作、虚拟角色设计等场景。项目代码采用 Apache 2. 0 许可证,模型权重则使用 CC BY-NC 4. 0 许可证,适合学术研究和... --- ### 解读 Coze Space:字节跳动布局 AI Agent,瞄准“零门槛”办公助手 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/news/jiedu-coze-space/ - 分类目录: AI新闻 字节跳动入局:Coze Space 能否定义 AI Agent 的协同办公新范式? 近期,字节跳动旗下 AI Agent 开发平台 Coze 悄然启动了一项名为 Coze Space (space. coze. cn) 的新功能内测。该平台定位为“与 AI Agent 协同办公的最佳场所”,旨在通过整合大型模型能力、自动化工具和开放生态,提升用户处理复杂任务的效率,实现从需求输入到成果输出的全流程自动化。此举标志着字节跳动在通用型 AI Agent 领域迈出了重要一步,试图探索 AI 在实际工作... --- ### Google 发布 Gemma 3 QAT 模型:让顶尖 AI 模型走进消费级 GPU - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/news/google-fabu-gemma/ - 分类目录: AI新闻 继上月推出新一代开放模型 Gemma 3 后,Google 近日再次拓展其模型生态,发布了基于量化感知训练 (Quantization-Aware Training, QAT) 优化的新版本。 Gemma 3 此前已凭借其在 BF16 精度下于单个高端 GPU(如 NVIDIA H100)上运行的能力,证明了其领先性能。而 QAT 版本的推出,旨在显著降低模型的内存需求,同时尽可能保持高质量输出,从而让强大的 AI 模型能够在更多消费级硬件上运行。 该图表依据 Chatbot Arena Elo... --- ### OpenUtau:免费的开源歌声合成编辑工具 - Published: 2025-04-22 - Modified: 2025-04-22 - URL: https://www.kdjingpai.com/tool/openutau/ - 分类目录: AI工具库 - 标签: AI开源项目, AI音乐 OpenUtau 是一个免费的开源歌声合成编辑平台,旨在为 UTAU 社区提供现代化编辑体验。它是 UTAU 软件的继任者,解决原软件兼容性和操作复杂的问题。OpenUtau 支持 Windows、macOS 和 Linux 系统,界面直观,功能丰富,适合音乐创作者和语音合成爱好者。用户可以通过 MIDI 编辑器快速创作歌曲,支持多语言语音库和实时音素编辑。软件内置 WORLDLINE-R 渲染器,还兼容大多数 UTAU 重采样器。它的预渲染功能让编辑和预览更高效,适合从初学者到专业人士的各种创... --- ---