
AI生产力工具
Video Face Swap
Video Face Swap 是一款完全免费的 AI 换脸工具,用户可以在任何视频中轻松替换人脸。该工具支持实时或后期处理换脸,适用于视频、照片和 GIF 动画。其智能算法能够识别视频中的面部并进行精确替换,生成逼真且有...

Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成
sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目,旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台,包括 Android、iOS、Raspberry Pi 等,能够在没有网络连接的情况下进行实时...

Codeium(Windsurf Editor):免费的AI代码补全与聊天工具,Windsurf以对话方式编写完整项目代码
Codeium是一款免费的AI代码补全与聊天工具,旨在提升开发者的编程效率。它支持超过70种编程语言,并与40多种集成开发环境(IDE)兼容。Codeium不仅提供代码自动补全功能,还具备代码生成、代码解释和聊天功能,帮...

xiaozhi-esp32-server:小智AI聊天机器人开源后端服务
xiaozhi-esp32-server 是一个为 小智AI聊天机器人(xiaozhi-esp32)提供后端服务的工具。它用 Python 编写,基于 WebSocket 协议,帮助用户快速搭建一个控制 ESP32 设备的服务器。这个项目适...

Cursor试用期重置工具:解决Cursor试用期限制问题,轻松重置试用期,避免升级到专业版
Cursor Free Trial Reset Tool 是一个开源工具,旨在解决Cursor在免费订阅期间出现的多账户限制问题。当用户在同一台机器上使用多个免费试用账户时,Cursor会提示“Too many free trial acc...

PocketPal AI
PocketPal AI 是一款开源的移动应用,旨在将小型语言模型(Small Language Models, SLMs)直接引入到你的手机中,无论是iOS还是Android用户都可以使用。它提供了一种不依赖网络的AI聊天体验,确保用户隐...

KunAvatar(kun-lab):基于 Ollama 的本地轻量AI对话客户端
kun-lab 是一款基于 Ollama 的开源 AI 对话应用,专注于提供轻量、快速的本地化智能对话体验。它支持 Windows、macOS 和 Linux(目前以 Windows 为主),无需复杂配置即可使用。用户可以与 AI 进行流畅...

元宝/元器
腾讯元宝是腾讯推出的一款基于自研混元大模型的C端AI助手App。它不仅能在工作场景中提供AI搜索、AI总结、AI写作等核心功能,还能解析多个微信公众号链接、网址,以及多种格式的文档。元宝还支持创建个人智能体,...

Video Face Swap
Video Face Swap 是一款完全免费的 AI 换脸工具,用户可以在任何视频中轻松替换人脸。该工具支持实时或后期处理换脸,适用于视频、照片和 GIF 动画。其智能算法能够识别视频中的面部并进行精确替换,生成逼真且有...

PolyBuzz:与AI角色互动的免费聊天与角色扮演平台
PolyBuzz 是一个免费的 AI 聊天和角色扮演平台。用户可以与超过 2000 万个虚拟角色互动。这些角色涵盖动漫、电影、游戏和历史人物等多个领域。平台支持用户创建自定义角色,设计个性化的外观和背景故事。它提供自...

Unlimited AI Chat:免费无限制的AI聊天工具
Unlimited AI Chat 是一个免费的在线AI聊天平台,用户无需注册即可使用。它支持无限制的内容生成,包括创意写作、虚构故事,甚至NSFW(不适合工作环境)内容。平台采用先进的自然语言处理技术,生成接近人类对话...

Polyglotta:多语言翻译与学习工具
Polyglotta 是一个专为语言爱好者和学习者设计的多语言翻译工具。它不仅提供单词或短语在多种语言中的翻译,还能展示不同语言间意义的细微变化。用户可以比较同一单词在多文化背景下的表达,深入了解语言的多样性...

Jan:开源离线AI助手,ChatGPT 替代品,运行本地AI模型或连接云端AI
Jan 是一个开源的 ChatGPT 替代品,能够在用户的设备上 100% 离线运行。它由 Cortex 引擎驱动,支持多种硬件平台,包括 NVIDIA GPU 和 Apple M 系列芯片。Jan 提供了丰富的模型库,用户可以下载并运行如...

Video Face Swap
Video Face Swap 是一款完全免费的 AI 换脸工具,用户可以在任何视频中轻松替换人脸。该工具支持实时或后期处理换脸,适用于视频、照片和 GIF 动画。其智能算法能够识别视频中的面部并进行精确替换,生成逼真且有...

Vheer:免费不限量生成AI图像和视频的在线工具
Vheer 是一个免费的在线 AI 图像生成和编辑平台,适合创作者、设计师和普通用户。用户通过输入文本描述或上传图片,即可快速生成高质量图像,无需注册或付费。平台提供文本转图像、图像风格转换、背景移除、图像...

AI Face Swap:免费AI人脸替换、视频换脸、多人换脸工具
AI Face Swap 是一个免费的在线平台,利用人工智能技术让用户轻松实现照片、视频和GIF中的人脸替换。无需下载软件或注册账号,用户只需上传文件即可快速完成操作。网站支持多种格式,如JPG、PNG、MP4和GIF,输出...

AdpexAI:生成式AI图像、视频内容创作平台
AdpexAI 是一个集生成式AI工具于一体的在线平台,提供图像编辑、视频编辑、AI聊天和代码生成等功能。用户无需安装软件,通过浏览器即可快速创建高质量视觉内容、编写代码或与智能AI模型互动。平台支持多种尖端AI...

Cursor试用期重置工具:解决Cursor试用期限制问题,轻松重置试用期,避免升级到专业版
Cursor Free Trial Reset Tool 是一个开源工具,旨在解决Cursor在免费订阅期间出现的多账户限制问题。当用户在同一台机器上使用多个免费试用账户时,Cursor会提示“Too many free trial acc...

Repo Prompt:依赖本地文件夹上下文进行写作、对话与优化代码
Repo Prompt是一款专为macOS平台打造的原生应用程序,致力于简化开发者使用先进AI语言模型处理本地代码的流程。该工具通过智能化的方式帮助开发者管理和修改代码文件,显著提升开发效率。其核心优势在于为开发者...

Internet.io:聚合多AI模型答案的智能工作平台
Internet.io 是一个聚合多个顶级 AI 模型答案的智能平台。旨在解决单一 AI 答案可能不准确或不一致的问题。用户只需提出一个问题,就能同时获得多个领先 AI 模型的回答,方便对比和选择最可靠的答案。平台还提供...

闲鱼自动回复系统:闲鱼智能客服与商品自动发货工具
闲鱼自动回复系统是一个专为闲鱼平台设计的自动化客服与管理工具,基于Python和FastAPI开发,托管于GitHub。系统通过WebSocket实时连接闲鱼服务器,自动处理买家消息、发货和商品管理。支持多用户、多账号管理,...

Open-Fiesta:同时与多个AI大模型聊天的开源工具
Open-Fiesta 是一个开源的AI聊天工具。它让用户可以在同一个界面里,同时和多个不同的大语言模型进行对话。用户最多可以选择5个模型,发送一次问题,就能并排看到每个模型的不同回答,方便直接比较。这个工具支持...

AIClient-2-API:模拟AI编程客户端请求转发为标准OpenAI接口
AIClient-2-API 是一个为开发者设计的轻量化API代理工具,其核心在于模拟多种AI客户端的授权和请求过程。该项目将那些原本仅限在客户端使用的大模型服务,例如谷歌的Gemini CLI、阿里的Qwen Code Plus以及Kir...

通义听悟:阿里通义音视频内容转录AI助手
通义听悟是阿里云推出的一款工作学习AI助手,专注于音视频内容的转写和分析。它依托阿里云的强大AI模型,能够将音视频内容实时转写成文字,并提供翻译、总结、定位等功能。通义听悟支持多种语言和场景,帮助用户...

置顶Had No Idea:快速生成并验证创业想法的AI工具
Had No Idea 是一个帮助用户快速生成、验证和启动创业项目的免费AI工具。它针对没有明确创业方向的用户,10分钟内从零开始生成个性化创业想法,验证市场可行性,创建品牌形象,并生成可直接用于开发的蓝图。工具...

置顶Internet.io:聚合多AI模型答案的智能工作平台
Internet.io 是一个聚合多个顶级 AI 模型答案的智能平台。旨在解决单一 AI 答案可能不准确或不一致的问题。用户只需提出一个问题,就能同时获得多个领先 AI 模型的回答,方便对比和选择最可靠的答案。平台还提供...

置顶Sigma AI Browser:免费使用主流大模型的AI浏览器
Sigma AI Browser是一款由SigmaBrowser OÜ开发的先进浏览器,利用人工智能技术为用户提供更快、更智能的浏览体验。该浏览器不仅注重速度和效率,还提供了增强的安全性和个性化推荐功能,确保用户在浏览网页时获得...

置顶Page Assist:本地AI模型对话与检索文档的网页助手插件
Page Assist 是一个开源的浏览器扩展,旨在为用户提供与本地AI模型交互的便捷方式。通过这个扩展,用户可以在任何网页上打开一个侧边栏,与本地运行的AI模型进行互动。Page Assist 支持多种浏览器,包括Chrome、B...

PocketPal AI
PocketPal AI 是一款开源的移动应用,旨在将小型语言模型(Small Language Models, SLMs)直接引入到你的手机中,无论是iOS还是Android用户都可以使用。它提供了一种不依赖网络的AI聊天体验,确保用户隐...

Jan:开源离线AI助手,ChatGPT 替代品,运行本地AI模型或连接云端AI
Jan 是一个开源的 ChatGPT 替代品,能够在用户的设备上 100% 离线运行。它由 Cortex 引擎驱动,支持多种硬件平台,包括 NVIDIA GPU 和 Apple M 系列芯片。Jan 提供了丰富的模型库,用户可以下载并运行如...

Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端
Cherry Studio 是一款支持多种大语言模型(LLM)服务的桌面客户端,兼容 Windows、Mac 和 Linux 系统。它提供了丰富的个性化选项和领先的功能设计,帮助用户在多种场景下提升工作效率。用户可以通过 Cherry St...

豆包
豆包综合介绍 豆包是由抖音旗下子公司开发的人工智能AI助手,国内版使用最新的云雀大模型。它是一款能够帮助用户解决问题、获取信息和提高效率的智能助手工具。豆包支持中英文,可以联网使用,并提供网页版、安卓...
Open WebUI:本地托管的AI聊天WebUI
Open WebUI(原名Ollama WebUI)是一款友好的AI交互用户界面,专为LLMs(大型语言模型)设计。它具有可扩展性、丰富的功能并完全离线运行。Open WebUI突出特性包括聊天式界面设计、高响应速度、使用Docker或Ku...
GizAI:全能AI助手,集成主流生成式AI工具,让每个人免费使用商业化AI工具
GizAI 是一个集成了AI生成、笔记和云存储功能的一站式平台。用户可以通过GizAI生成图像、视频、音频、文本、角色、故事和游戏,并且可以在平台上进行协作笔记和云存储。GizAI 提供了多种AI工具,帮助用户提高生产...

Chatbox:多平台客户端AI桌面助手
Chatbox 综合介绍 Chatbox 是一款桌面软件,支持多款全球最先进的AI大模型服务,包括但不限于ChatGPT。它旨在提升用户的工作与学习效率,并受到全球专业人士的高度评价。Chatbox 支持Windows、Mac...

Monica AI(莫妮卡): 全功能的综合AI助手,全终端支持的AI助手
推荐在Chrome或Edge中使用 Monica AI 浏览器插件版(海外文明上网版) Monica(莫妮卡)开启国内域名,对比海外收费模式,国内版免费使用! Monica介绍 Monica(莫妮卡)是一款全功能...

置顶Vheer:免费不限量生成AI图像和视频的在线工具
Vheer 是一个免费的在线 AI 图像生成和编辑平台,适合创作者、设计师和普通用户。用户通过输入文本描述或上传图片,即可快速生成高质量图像,无需注册或付费。平台提供文本转图像、图像风格转换、背景移除、图像...

置顶Lovart:将文字提示转化为专业设计的AI工具
Lovart 是一个创新的AI设计平台,通过自然语言输入将用户的创意想法转化为专业级视觉设计。用户只需用简单文字描述需求,Lovart 就能生成海报、品牌标识、视频和3D内容等多种设计资产。该平台整合了多种AI模型,...

置顶Artbreeder:超强图像控制与图像风格混合工具,适合教学使用
Artbreeder 是一个基于人工智能(AI)的协作艺术创作网站。它利用StyleGAN和BigGAN模型帮助用户生成和修改人脸、风景、绘画等图像。通过“基因”滑块操作,用户能够创造出新的变体,或者交配图片产生新的影响因子。...

置顶OpenCreator:整合多种AI模型生成创意视频
OpenCreator 是一个在线工具,专为创作者设计,核心功能是把20多种生成式AI模型整合在一起。用户可以用它轻松生成创意视频,无需在不同平台间切换或支付多份订阅费。它界面简单,支持一键比较不同模型效果,按使...

MagicQuill:智能交互式图像涂鸦编辑系统,精准局部涂鸦编辑
MagicQuill是一个由香港科技大学、蚂蚁集团、浙江大学和香港大学共同推出的开源AI互动式图像编辑工具。该工具旨在通过智能化和互动式的方式,实现对图像的精准局部编辑。MagicQuill提供了用户友好的界面和AI驱动...

Meshy:免费使用图像生成3D模型工具
Meshy 是一个强大的AI 3D模型生成工具,旨在帮助艺术家、游戏开发者和创作者快速生成高质量的3D模型。通过简单的文本或图像输入,用户可以在几秒钟内创建出令人惊叹的3D模型。Meshy 提供了多种艺术风格和自动生成...
Nordy:免费在线使用数百种完整ComfyUI工作流
Nordy AI 是一个基于 ComfyUI 的在线设计工具,旨在帮助用户轻松创建专业级设计。无需安装或使用 GPU,用户可以直接通过网页访问并使用 Nordy AI 进行设计工作。该平台提供快速的执行速度和丰富的功能,适合各种...

文心一格
文心一格是由百度推出的一款基于深度学习和自然语言处理技术的AI艺术创作平台。它结合了百度自研的飞桨(PaddlePaddle)深度学习框架和文心大模型,用户只需输入简单的文字描述,即可通过该平台生成风格多样的艺...

通义万相:AI创意作画|文生图|图生图|虚拟模特|个人写真|涂鸦作画
通义万相是阿里云旗下的AI创意作画平台,提供多种AI艺术创作功能。用户可以通过文字生成图片、图片生成图片、涂鸦作画、虚拟模特和个人写真等多种方式进行创作。平台基于自研的Composer组合生成框架,支持多场景...
InstantID:上传一张图片,迁移人像特征来生成不同风格图片
InstantID是一项先进的技术,专注于利用单张参考身份证图片,在几秒钟内生成具有个性化风格或姿态的图像,同时确保高度保真。该技术采用了基于扩散模型的解决方案,通过集成面部图片、地标图片与文本提示...
ClipDrop:集成Stability AI最新的图像编辑工具和实验产品
ClipDrop 综合介绍 ClipDrop是一个基于AI的图片编辑工具平台,可以让您在几秒钟内创建令人惊艳的视觉效果。您可以使用ClipDrop的多种工具来增强您的图片,比如Stable Diffusion, Real-Es...

LuminaBrush:使用智能绘画工具为图像添加照明打光效果
LuminaBrush 是一个创新的交互式图像照明效果编辑工具,由人工智能技术驱动。该项目采用两阶段框架处理图像:第一阶段将输入图像转换为”均匀照明”的外观,第二阶段则根据用户的涂鸦操作生成照明效果...

置顶Wan:基于Wan系列模型的视频和图像生成工具
Wan是一个AI驱动的视觉内容生成网站,其核心是名为Wan 2.2的开源模型。用户可以通过这个工具,将文字、图片或音频快速转换成高质量的视频。网站支持多种生成方式,包括“文字生成视频”、“图片生成视频”以及独特的“...

置顶Animon:免费生成动漫风格短视频的AI工具
Animon 是一个专注于动漫风格视频生成的 AI 平台,由日本公司 Animon Dream Factory 开发。它通过上传静态动漫或漫画风格图像,配合简单的文字描述,快速生成 5 秒左右的动画视频。平台操作简单,适合初学者和专...

置顶Vheer:免费不限量生成AI图像和视频的在线工具
Vheer 是一个免费的在线 AI 图像生成和编辑平台,适合创作者、设计师和普通用户。用户通过输入文本描述或上传图片,即可快速生成高质量图像,无需注册或付费。平台提供文本转图像、图像风格转换、背景移除、图像...

置顶Lovart:将文字提示转化为专业设计的AI工具
Lovart 是一个创新的AI设计平台,通过自然语言输入将用户的创意想法转化为专业级视觉设计。用户只需用简单文字描述需求,Lovart 就能生成海报、品牌标识、视频和3D内容等多种设计资产。该平台整合了多种AI模型,...

DeepMosaics:自动去除图像和视频中的马赛克,或向其添加马赛克
DeepMosaics是一个基于语义分割和图像到图像转换技术的开源项目,旨在自动移除图片和视频中的马赛克,或向其添加马赛克效果。该项目利用深度学习的力量,为用户提供了一种高效的方法来处理马赛克图像,无论是去码...

Hedra
Hedra 是一个创新的数字创作平台,专注于通过人工智能技术生成富有表现力的会说话和会唱歌的人物角色视频。用户可以从简单的文本和图像生成专业质量的视频,无需任何技术专长。Hedra 旨在让每个人都能轻松创作引...

SkyReels:AI视频短剧创作平台,擅长生成动作自然的全景人像
SkyReels 是一个专注于 AI 视频创作的在线平台,旨在帮助用户快速将文本脚本或创意想法转化为高质量短视频。无论你是内容创作者、营销人员还是普通用户,只需输入文字,平台就能自动生成带有逼真语音、精准字幕和...

Remaker:免费在线换脸工具
Remaker AI 是一个利用最新人工智能技术开发的创新工具集,支持创建和生成各种类型的内容,包括文本、图像、语音等。用户可以通过该平台进行照片和视频的面部交换、生成AI肖像、图像放大、制作会说话的照片等。Re...

Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具
Vidnoz是一款免费的AI视频生成平台,可在1分钟内快速创建AI视频。不需要成本、下载和经验。平台提供500+ AI虚拟人物,470+逼真AI配音以及500+模板。通过Vidnoz AI视频生成器,用户可以更快地创建视频,从而提高投...

LensGo:创造独特风格的视频变得简单|视频风格转换工具
LensGo是一个利用AI技术轻松创建风格转换视频的平台,提供风格转换、图像生成、文字到视频、训练和模型等工具。用户可以使用模型或图像改变视频风格,通过文本或图像提示生成图像,也可以用自己的图像训练自定义...

可灵 AI:快手推出的生成创意图片和视频的AI工具
可灵 AI(Kling AI)是快手推出的一款新一代AI创意生产力平台,旨在通过先进的生成式AI技术,帮助用户轻松创建高质量的图片和视频内容。平台基于快手自研的可图大模型和可灵大模型(Kolors),提供了强大的图像和...

iFoto.AI:智能AI照片编辑器|免费图像去背景|模特换装|换脸
iFoto 综合介绍 ifoto是一个免费在线AI照片编辑工具,专为电子商务设计,提供了一系列功能来提升在线产品展示。它通过AI技术将服装模特转化为逼真的模特,并为产品提供多样化的真实场景背景。ifoto还提供了一键式...

置顶OpenWispr:隐私优先的语音转文字桌面应用
OpenWispr 是一款开源的桌面语音转文字应用,基于 OpenAI Whisper 技术,将用户语音快速转换为文本。它提供本地和云端处理选项,强调隐私保护,数据可完全留存在本地。用户通过全局热键快速启动听写,文本自动粘...

置顶MiniMax Audio(海螺语音):生成自然语音的AI工具
MiniMax Audio 是 MiniMax 公司推出的一款 AI 语音生成工具,核心特点是快速将文字转为高相似度的自然语音。它基于 Speech-02 模型,语音合成相似度高达 99%,音质达到录音室级别,支持超过 30 种语言和多种口...

置顶通义听悟:阿里通义音视频内容转录AI助手
通义听悟是阿里云推出的一款工作学习AI助手,专注于音视频内容的转写和分析。它依托阿里云的强大AI模型,能够将音视频内容实时转写成文字,并提供翻译、总结、定位等功能。通义听悟支持多种语言和场景,帮助用户...

gibberlink:两个AI智能体间高效音频通信的演示项目
gibberlink 是一个由开发者 PennyroyalTea 在 GitHub 上开源的项目,专注于实现两个对话型 AI 智能体之间的通信优化。当两个 AI 智能体通过电话交谈并识别出彼此均为 AI 时,它们会从人类语言(英语)切换到一...

Ondoku:在线文本朗读工具|文本转语音|图片转语音朗读
Ondoku 综合介绍 Ondoku是一款在线文字转语音软件,用户可将文本内容输入网站提供的文本框,软件能够根据用户需要将文章转换成语音读出,并支持将语音保存为MP3格式文件。这项服务既适合即时聆听,也适合生成音频...

小智 AI 聊天机器人
小智 AI 聊天机器人是一个基于ESP32开发板的开源项目,旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发,主要用于教学目的,帮助更多人入门AI硬件开发,并了解如何将大语言模型应用到实际的硬件设备中。项目...

ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具
ebook2audiobook是一款功能强大的开源电子书转有声读物工具。它能够将多种格式的电子书转换成带有完整章节标记和元数据的有声读物。该工具使用Calibre进行电子书格式转换,采用Coqui的XTTSv2和Fairseq进行高质量.....

TTSMaker:免费的在线文本转语音工具
TTSMaker是一款免费的在线文本转语音工具,支持100多种语言和300多种语音风格。用户可以将文本转换为自然流畅的语音,并下载音频文件用于商业用途。该工具适用于视频配音、有声读物、教育培训和广告营销等多种场...

“Always-On” Deepseek AI Assistant:基于Deepseek-V3打造智能语音交互系统
Always-On AI Assistant是一个创新的AI助手项目,它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术,打造了一个功能强大的永久在线AI助理系统。该项目特别针对工程开发场景进行优化,提供了完整的...

RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别
RealtimeSTT 是一个高效、低延迟的实时语音转文字库,具备先进的语音活动检测和唤醒词激活功能。该项目由 Kolja Beigel 开发,旨在为需要快速、准确语音转文字的应用提供支持。无论是语音助手还是需要精确语音转...

Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)
Kokoro-FastAPI是一个基于Docker的FastAPI封装,旨在为Kokoro-82M文本转语音模型提供支持。该项目支持NVIDIA GPU加速,并提供了队列处理和自动拼接功能,使得生成长文本的语音输出更加高效和连贯。项目由Gi...

Ichigo(llama3-s)
Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为一个开源数据、开源权重的本地设备语音...

置顶ARGO:在个人电脑上部署和使用的AI智能体客户端
ARGO 是一款开源的AI智能体(AI Agent)平台,它的核心设计理念是“本地优先”,让用户可以在自己的个人电脑上搭建一个功能强大的专属AI助手。这个平台整合了AI领域的多种先进技术,比如能够让AI自主思考和规划任务...

置顶MAESTRO:拥有本地知识库和多代理协作的深度研究助手
MAESTRO 是一个开源的 AI 研究工具,旨在帮助用户处理复杂的科研任务。它通过文档管理、检索增强生成(RAG)和多代理协作,提供从研究规划到报告生成的完整流程。用户可以上传 PDF 文档,借助 AI 代理完成信息检...

置顶蛙蛙写作:快速生成小说大纲与内容的AI写作工具
蛙蛙写作 是一款专为小说作者设计的AI智能写作工具。它能帮助用户快速生成小说大纲、角色设定和正文内容,适合需要灵感或高效创作的写作者。用户通过微信扫码登录,无需下载软件,直接在网页端操作。平台提供自动...

置顶Cotrans:一站式漫画图片翻译器(开源免费)
manga-image-translator(Cotrans翻译器开源版),用于翻译漫画或图片中的文字。提供命令行交互方式和在线演示,拥有批量转换模式、web服务器模式等多样化的使用选项。可设置多种语言目标翻译和识别参数,配有详...

YouChat:高级AI聊天搜索工具|You搜索引擎
YouChat 综合介绍 YouChat是You.com提供的一款聊天和搜索服务,用户可以通过它进行自然语言的交流和发现AI的力量。作为一个高级聊天机器人,YouChat融入了GPT-4技术,提供了包含实时网络访问权限的全面特性。YouC....

Speak
Speak 是一款创新的 AI 英语学习应用程序,旨在通过与 AI 对话来帮助用户提升英语口说能力。该应用程序利用最先进的人工智能技术,提供个性化的课程和即时反馈,帮助用户在短时间内显著提高英语水平。Speak 提供...

OpenAI Translator
openai-translator是一款基于OpenAI的ChatGPT API开发的翻译增强工具。它包括浏览器插件和跨平台的桌面应用程序。支持翻译、润色和总结三种模式,涵盖了55种不同语言。此外,工具还支持一键复制,文本到语音转换...

ResearchFlow
ResearchFlow 是一款结合白板和思维导图功能的AI学术研究工具,旨在帮助用户更轻松、直观地探索和组织复杂的研究内容。基于AI驱动的搜索和可视化技术,用户可以深入研究、连接想法,扩展研究的深度。通过学术数据...

Liner
Liner是一款由GPT-4/Cloude驱动的AI搜索引擎,旨在帮助用户更高效地查找、管理和利用在线内容。无论是学术研究、专业写作还是日常信息整理,Liner都能提供智能化的解决方案。通过浏览器扩展或移动应用,用户可以...

Connected Papers
Connected Papers是一款专为研究员和科学家设计的学术论文探索工具。通过构建论文间的关联图谱,帮助用户可视化探索各自研究领域内相关论文。用户可输入论文标识符,如DOI、arXiv、论文URL、论文标题、Semantic S...

Suna( Kortix AI):集成浏览器操作与数据分析的智能代理
Suna 是 Kortix AI 开发的一个开源通用 AI 代理,托管在 GitHub 上,基于 Apache 2.0 许可证,允许用户免费下载、修改和自托管。它通过自然语言对话帮助用户完成复杂任务,如网页浏览、文件管理、数据抓取和网站.....

RTranslator
RTranslator 是一款几乎开源的免费离线实时翻译应用,专为 Android 设备设计。用户可以通过连接蓝牙耳机,将手机放在口袋中,与他人进行如同对方说自己语言的对话。RTranslator 支持多种模式,包括对话模式、对讲...

置顶Kode:Claude Code 开源优化版
Kode是一个强大的AI助手,它直接在你的电脑终端里运行。你可以把它看作一个和你一起工作的程序员,它能理解你的代码库,帮你编辑文件,还能执行命令行指令来处理整个开发流程。和其他工具不同的是,Kode可以同时...

置顶Storydoc:快速创建与编辑互动演示文稿的智能工具
Storydoc 是一个帮助用户快速创建互动演示文稿的在线平台。它通过人工智能技术简化设计流程,让用户无需专业技能也能制作出吸引人的幻灯片。Storydoc 提供多种模板,适用于营销、销售、投资、招聘和报告等多种场...

置顶Had No Idea:快速生成并验证创业想法的AI工具
Had No Idea 是一个帮助用户快速生成、验证和启动创业项目的免费AI工具。它针对没有明确创业方向的用户,10分钟内从零开始生成个性化创业想法,验证市场可行性,创建品牌形象,并生成可直接用于开发的蓝图。工具...

置顶Claudia:管理Claude Code的图形界面工具
Claudia 是一个开源的桌面应用程序,专为 Claude Code 用户设计。它通过直观的图形界面(GUI)简化了 Claude Code 的操作,取代了传统的命令行方式。用户可以更轻松地管理 AI 开发项目、创建自定义代理、运行后台....

Codeium(Windsurf Editor):免费的AI代码补全与聊天工具,Windsurf以对话方式编写完整项目代码
Codeium是一款免费的AI代码补全与聊天工具,旨在提升开发者的编程效率。它支持超过70种编程语言,并与40多种集成开发环境(IDE)兼容。Codeium不仅提供代码自动补全功能,还具备代码生成、代码解释和聊天功能,帮...

Roo Code(Roo Cline):基于Cline的增强版自主编程助手,智能化IDE编程助手
Roo Code(前称Roo Cline)Roo Code(Roo Cline) 是一个基于 Cline 的增强版自主编程助手,它是一个强大的 VS Code 扩展插件。这个工具能够在您的集成开发环境(IDE)中实现自主编码,具备创建和编辑...

Trae:字节跳动推出的免费AI编程工具
Trae是一款由字节跳动推出的免费AI编程工具,专为中文开发者设计的集成开发环境(IDE)。它利用Claude 3.5和GPT-4o等先进的AI模型,帮助开发者快速生成、优化和调试代码。Trae支持原生中文界面,提供了Builder模...

Cline(Claude Dev):自动化编程的VSCode插件
Cline 是一个功能强大的 VSCode 插件,旨在通过自动化任务执行和链式思维提示,帮助开发者高效完成各种编程任务。它不仅能创建和编辑文件,还能执行终端命令,提供人机协作的编程体验。用户可以通过简单的指令启...

Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑
Aider是一款强大的开源AI编程助手工具,它能够通过自然语言对话的方式帮助开发者编写、编辑和重构代码。作为一款交互式的AI配对编程工具,Aider支持多种主流编程语言,可以无缝集成到Git工作流中,并能够自动进行...

Cursor:与AI共同编程的代码编辑器
Cursor 综合介绍 Cursor是一个基于OpenAI GPT模型的AI驱动的代码编辑器,它可以帮助您更快地编写,编辑,调试,和修复代码。您可以与您的项目进行聊天,参考文件和文档,生成代码,以及发现和解决错误。Cursor是V...

Qoder:能自主完成软件开发的 AI IDE 编程平台
Qoder是由阿里巴巴推出的一款AI智能体编程平台,它为处理真实的软件开发项目而设计。与简单的代码补全工具不同,Qoder内置的AI智能体能够深入理解整个项目的代码库和相关文档。开发者可以用简单的自然语言下达指...

BASE44:无需编程快速构建功能完整的Web应用
BASE44 是一个利用人工智能帮助用户快速创建自定义软件的在线平台。它的核心特点是无需编程知识,用户只需用自然语言描述需求,就能生成功能完整的应用。网站由 BASE44 团队开发,目标是让非技术人员也能轻松将想...

置顶Akool:生成图像和视频营销素材|视频换脸|视频翻译|人像说话
Akool是一个专注于个性化视觉营销和广告。通过先进的AI技术,AKOOL能够帮助用户轻松创建高质量、个性化的视频内容,适用于广告、在线教育、艺术创作和电子商务等多个领域。 它提供了面部换位、真实头像创建、说话...

Video Face Swap
Video Face Swap 是一款完全免费的 AI 换脸工具,用户可以在任何视频中轻松替换人脸。该工具支持实时或后期处理换脸,适用于视频、照片和 GIF 动画。其智能算法能够识别视频中的面部并进行精确替换,生成逼真且有...

FaceFusion:视频换脸增强工具|语音同步视频嘴型动作
FaceFusion是一个集成了面部交换与增强功能的先进云平台,优化了“图像到视频”、“图像到图像”的交换过程,并拥有5个专业模型,以确保无瑕的输出。此外,它通过7种模型进行面部增强,使用3种不同模型提升视频和图片...

DeepFaceLive:经典实时人脸替换工具
DeepFaceLive 是一个开源的实时人脸替换工具,主要用于视频通话和直播。用户可以通过摄像头或视频中的人脸进行替换,使用预训练的模型实现高质量的人脸替换效果。该工具支持多种人脸模型,并允许用户自行训练和导...

Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣
Open-LLM-VTuber 是一个开源项目,允许用户通过语音和文字与大型语言模型(LLM)互动,并结合Live2D技术呈现动态虚拟角色。它支持Windows、macOS和Linux,可完全离线运行,兼具网页版和桌面客户端两种模式。用户....

Remaker:免费在线换脸工具
Remaker AI 是一个利用最新人工智能技术开发的创新工具集,支持创建和生成各种类型的内容,包括文本、图像、语音等。用户可以通过该平台进行照片和视频的面部交换、生成AI肖像、图像放大、制作会说话的照片等。Re...

Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统
Paperless-AI 是一个创新的文档自动化分析工具,专门为 Paperless-ngx 文档管理系统设计。它巧妙地结合了 OpenAI API 和 Ollama 等多种先进的人工智能模型(包括 Mistral、LLaMA、PHI-3 ...

InsightFace:图像面部交换功能与面部克隆
InsightFace 综合介绍 InsightFace是一款开源的2D及3D深度面部分析库,提供多种先进的面部识别、检测和对齐算法。该库以高效的训练和部署为设计目标,适合研究机构和产业界使用。InsightFace支持Pyt...

VisoMaster:强大且易用的图片/视频换脸和编辑软件
VisoMaster 是一款强大且易用的视频换脸和编辑工具,利用人工智能技术实现自然逼真的换脸效果。无论是图像还是视频,VisoMaster 都能通过简单的操作生成高质量的换脸结果,适合普通用户和专业人士使用。该工具支...

Reface:使用AI进行面部替换和视频生成,创作有趣的动画形象(付费)
Reface是一款利用人工智能技术进行面部替换和视频生成的网站。用户可以通过上传照片或视频,使用Reface的AI工具将自己的面部替换到其他视频或GIF中,或将照片转化为动画。该网站提供了多种有趣的功能,如面部动画...

GoEnhance:视频转视频,图像增强和放大的AI工具
GoEnhance 综合介绍 GoEnhance AI是一款先进的人工智能平台,专注于视频到视频的转换、图像的增强与放大。它利用尖端AI技术,能够将图像增强至极致细节,让动画创作流程更简便。用户可轻松转换视频成多种风格,包...

FaceSwapper
FaceSwapper 是一个基于人工智能技术的在线免费换脸平台,用户可以通过上传照片或视频,快速实现面部替换,生成有趣或逼真的效果。无需专业技能,只需几次点击,就能将自己的脸换到他人身上,或体验性别转换、名...

置顶Had No Idea:快速生成并验证创业想法的AI工具
Had No Idea 是一个帮助用户快速生成、验证和启动创业项目的免费AI工具。它针对没有明确创业方向的用户,10分钟内从零开始生成个性化创业想法,验证市场可行性,创建品牌形象,并生成可直接用于开发的蓝图。工具...

置顶ListenHub:将网页、文件快速转为AI播客的工具
ListenHub 是一个利用人工智能技术将网页、文档或用户输入的内容快速转化为播客的平台。它支持中英文语音合成,用户只需上传文件、输入话题或粘贴链接,即可生成自然流畅的播客音频。平台操作简单,适合移动端使...

置顶KrillinAI
KrillinAI 是一个开源的视频处理工具,专注于用人工智能帮助用户翻译视频并自动配音。它能从视频下载开始,一直到生成适配不同平台的成品,全程只需几次点击。开发者在 GitHub 上提供了免费代码,用户可以下载到...

置顶LLPlayer
LLPlayer 是一款专为语言学习者设计的开源媒体播放器,托管于 GitHub,由开发者 umlx5h 创建。它集成了多种实用功能,如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等,旨在帮助用户通过观看视频提升语言...

SoniTranslate
SoniTranslate 是一个强大且用户友好的视频多语言配音工具,旨在提供视频翻译和同步音频的解决方案。它利用先进的语音识别和机器翻译技术,将视频内容翻译成多种语言,并保持音频同步。该项目基于 Gradio 库构建...
RoomGPT:上传房间照片,使用AI重新设计
RoomGPT是一个由GitHub用户Nutlope开发的开源项目,允许用户上传房间照片并利用人工智能技术生成重新设计的房间版本。该项目旨在让用户无需昂贵的设计师费用即可获得专业级的室内设计建议。 功能列表 上传...

Suno:用想象力创作音乐|AI音乐生成软件
与许多 AI 音乐应用程序不同,Suno(发音为 soon-oh,在印地语中意为“听”)专注于用原创人声创作原创曲调,而不是克隆或模仿流行艺术家的声音或歌曲。 Suno 综合介绍 Suno是一个让您用想象力和AI创作歌曲...

Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型
Kolors Virtual Try-On 是由 Kwai-Kolors 团队在 Hugging Face 平台上推出的一款虚拟试穿应用。该应用利用先进的人工智能技术,帮助用户在虚拟环境中试穿不同颜色的服装,从而找到最适合自己的颜色。用户只...

Weights:模仿声音翻唱歌曲和文本转语音的创作平台
Weights 是一个利用 AI 进行创作的社交平台,用户可以通过简单的操作创建语音翻唱、文本转语音、图像、音乐和视频等内容。平台提供了丰富的工具和模板,帮助用户快速上手创作,并与社区分享自己的作品。Weights ...

Linly-Dubbing
Linly-Dubbing 是一个智能多语言AI配音和翻译工具,旨在通过整合先进的AI技术,为用户提供高质量的多语言视频配音和字幕翻译服务。该工具特别适用于国际教育、全球内容本地化等场景,帮助团队将优质内容传播到全...

Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具
Vidnoz是一款免费的AI视频生成平台,可在1分钟内快速创建AI视频。不需要成本、下载和经验。平台提供500+ AI虚拟人物,470+逼真AI配音以及500+模板。通过Vidnoz AI视频生成器,用户可以更快地创建视频,从而提高投...

即梦AI
即梦AI是一个一站式的AI创作平台,旨在为用户提供多功能且强大的创作工具。无论是图像生成、智能画布、视频生成还是音乐生成,即梦AI都能帮助用户轻松实现创意。平台支持多种创作模式,包括AI作图、AI视频、AI音...

置顶RenderNet
RenderNet 是一款基于人工智能技术专注于创作保持人物一致性的图像与视频的生成工具。用户可以通过简单的文本提示生成角色驱动的图像和视频。该工具支持多种图像和视频生成选项,用户可以根据需要进行自定义,并...

Unify:AI驱动的GTM工具,高效分析潜在买家数据
Unify 是一个专为销售和营销团队打造的去市场(GTM, Go-To-Market)平台。它利用人工智能(AI)和意图数据,帮助企业快速找到准备购买的潜在客户,并优化销售流程。Unify 的核心在于“温性外联”,通过分析客户的行...

Superads:提升投放媒体广告表现的免费AI创意分析工具
Superads 是一款由 Superside 支持的免费 AI 创意分析工具,旨在帮助广告主和营销团队提升广告表现。通过连接 Facebook、TikTok 和 LinkedIn 等平台,Superads 提供全面的广告数据分析和报告功能...

Folk:使用AI优化客户关系管理
Folk通过结合人工智能技术,为用户提供更为智能的客户关系管理解决方案。AI功能能够自动化处理日常CRM任务,提升用户的工作效率,并通过数据分析提供洞察,帮助用户制定更精准的业务策略。Folk的AI应用不仅仅停留...

Topview:一键创建病毒式营销视频,AI虚拟形象展示并讲解商品
Topview 是一款基于人工智能的在线视频编辑工具,旨在帮助用户通过上传简单的材料和想法,生成高质量的病毒式营销视频。它利用先进的AI技术,包括GPT-4o来生成脚本,并结合来自TikTok和YouTube的成功广告学习,确...

VidAU:视频换脸与视频多语言翻译工具
VidAU.AI 是一款集视频和音频生成于一体的AI工具,提供视频代言人、换脸、多语言翻译、字幕和水印去除、视频混剪和编辑等多种功能。它支持创建包括短剧、广告、销售推介、社交媒体内容和培训视频在内的多样化视频...

MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布
MoneyPrinter V2 是由FujiwaraChoki开发的一个开源项目,旨在通过自动化手段帮助用户在线赚钱。该项目主要集成了Twitter自动化、YouTube短视频生成以及联盟营销等功能。用户可以利用Python脚本进行内容发布...

万相营造:免费生成静物、服饰、家具等各类商品展示图
万相营造是阿里妈妈旗下专注于淘宝商品营销物料的AI创意生产工具。基于生成式AI智能技术,万相营造致力于为商业经营提供更智能、高效、降本且具创造性的服务。其主要功能包括智慧营销、增强分析和创意生产,帮助...

Dante:定制AI聊天机器人平台
Dante 介绍 Dante AI 是一个无代码平台,让您可以在几分钟内创建基于您数据训练的自定义 AI 聊天机器人,无需编程。该平台设计简单易用,让您可以自定义聊天机器人的外观,并将其与各种应用程序集成,以提高您的...

Bannerbear
Bannerbear 是一个帮助用户自动生成图片和视频的在线工具。它通过简单的 API 接口,让用户可以快速制作社交媒体图片、电商横幅和动态邮件图像。网站的核心功能是把设计模板变成可自动调整的素材,用户只需输入数...

Jogg AI:快速生成高质量视频广告,生成社交媒体头像
Jogg AI 是一个先进的 AI 驱动平台,专为快速高效地生成视频广告而设计。用户只需输入一个 URL,即可在几分钟内将其转换为精美的视频广告。该平台提供多种可定制的模板和 AI 头像,简化了视频制作过程,使营销人...

即创:依托巨量引擎生成电商营销物料,快速发布适合抖音推广的商品讲解视频
即创介绍 即创是抖音推出的一站式智能创意生产与管理平台,旨在为创作者提供高效、便捷、专业的内容创作服务。即创平台集成了多种AI功能,如智能成片、AI视频脚本、图文工具、商品卡工具、AI直播背景、AI直播脚本...

置顶ARGO:在个人电脑上部署和使用的AI智能体客户端
ARGO 是一款开源的AI智能体(AI Agent)平台,它的核心设计理念是“本地优先”,让用户可以在自己的个人电脑上搭建一个功能强大的专属AI助手。这个平台整合了AI领域的多种先进技术,比如能够让AI自主思考和规划任务...

置顶dots.ocr:多语言文档布局解析的统一视觉-语言模型
dots.ocr 是一个强大的多语言文档解析工具,基于 1.7B 参数的视觉-语言模型(VLM),能够同时进行布局检测和内容识别。它在 OmniDocBench 等基准测试中展现了最先进的性能,特别是在文本、表格和阅读顺序解析方面...

置顶MAESTRO:拥有本地知识库和多代理协作的深度研究助手
MAESTRO 是一个开源的 AI 研究工具,旨在帮助用户处理复杂的科研任务。它通过文档管理、检索增强生成(RAG)和多代理协作,提供从研究规划到报告生成的完整流程。用户可以上传 PDF 文档,借助 AI 代理完成信息检...

置顶MiniMax Agent:支持多模态交互的智能AI助手
MiniMax Agent 是一个基于先进多模态大语言模型的智能AI助手,旨在提升用户的生产力和创造力。它由上海MiniMax公司开发,成立于2021年,获得阿里巴巴等多家投资机构支持。MiniMax Agent通过集成文本、图像、语音.....

Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成
sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目,旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台,包括 Android、iOS、Raspberry Pi 等,能够在没有网络连接的情况下进行实时...

Chatlog:提取和查询微信聊天记录的开源工具
Chatlog 是一个开源工具,专注于从微信本地数据库提取和查询聊天记录。它支持微信 3.x 和 4.0 版本,覆盖 Windows 和 macOS 系统。用户可以通过命令行、终端界面或 HTTP API 操作,查看聊天记录、联系人、群聊和...

Coze(扣子):免费创建个人智能体和工作流
Coze是一个创新的聊天机器人开发平台,旨在简化AI对话应用的创建过程。它提供了丰富的功能集合,包括插件系统、工作流编辑、知识管理、长期记忆以及定时任务安排,无需任何编程知识即可设计出能在各种社交平台和...

Ollama:本地一键部署开源大语言模型
Ollama 综合介绍 ollama是一个轻量级的本地语言模型运行框架,让用户能够容易地搭建和运行大型语言模型。它提供多种快速开始和安装选项,支持Docker,包含了丰富的库供用户选择。它的使用方法简单,提供了REST AP...

Reader API:网页内容提取工具,HTML转换为Markdown格式
Jina AI的Reader项目是一个开源工具(Reader 开源地址),可将任何URL通过添加前缀https://r.jina.ai/转换成适合大型语言模型(Large Language Models, LLM)的输入格式,...

Page Assist:本地AI模型对话与检索文档的网页助手插件
Page Assist 是一个开源的浏览器扩展,旨在为用户提供与本地AI模型交互的便捷方式。通过这个扩展,用户可以在任何网页上打开一个侧边栏,与本地运行的AI模型进行互动。Page Assist 支持多种浏览器,包括Chrome、B...

LiveKit:构建实时音视频应用的开源工具
LiveKit 是一个开源项目,专注于帮助开发者构建实时音视频应用。它基于 WebRTC 技术,提供了一套完整的解决方案,包括媒体服务器和各种客户端 SDK。LiveKit 的核心是一个可扩展的 SFU(选择性转发单元)服务器,...

OpenRouter:集成多LLMs的统一接口,免费大模型接口
OpenRouter是一个大模型API聚合平台,提供了让用户可以方便地接入和使用多种大型语言模型的能力。用户可以比较不同模型和价格,为自己的情景需求找到最合适的解决方案。OpenRouter支持包括OpenAI的GPT-4、Claude ....

置顶VideoMind
VideoMind 是一个开源的多模态AI工具,专注于长视频的推理、问答和摘要生成。它由香港理工大学的刘晔(Ye Liu)和新加坡国立大学Show Lab的团队共同开发。工具模仿人类理解视频的方式,把任务拆成规划、定位、验...

Reka:提供多模态AI模型,支持多语言处理,优化数据分析,增强视觉理解
Reka 是一家致力于提供新一代多模态AI解决方案的公司。其产品包括Reka Core、Flash、Edge和Spark等多种型号,支持文本、代码、图像、视频和音频数据的处理。Reka 的模型具有强大的推理能力和多语言支持,适用于各...

VITA
VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024年12月,项目推出了重大升级版...

OmniGen
OmniGen 是一个由 VectorSpaceLab(智源) 开发的“通用”图像生成模型,允许用户通过简单的文本提示或多模态输入来创建多样化且具有上下文丰富的视觉效果。它特别适合于需要识别人物和一致性角色渲染的场景。用户...
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS
OuteTTS 是一种实验性文本转语音(TTS)模型,采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同,OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构,支持语音克隆功能,能够生成具有随机说...

Seedance 1.0
Seedance 1.0 是由字节跳动 Seed 团队开发的一款 AI 视频生成工具,专注于将文本或图像转化为高质量视频内容。用户只需输入文字描述或上传图片,Seedance 即可生成分辨率高达 1080p 的视频,适用于创意内容创作、.....

LTX Video(LTXV):生成高质量视频的实时视频生成开源模型
LTX-Video是由Lightricks开发的首个基于DiT(Diffusion Transformer)的实时视频生成模型。该模型能够在768×512分辨率下以24帧每秒的速度生成高质量视频,速度快于观看视频的时间。LTX-V...

Qwen2.5-Omni
Qwen2.5-Omni 是阿里巴巴云 Qwen 团队开发的一款开源多模态 AI 模型。它能处理文本、图像、音频和视频等多种输入,并实时生成文本或自然语音响应。这款模型于 2025 年 3 月 26 日发布,代码和模型文件托管在 GitH....

Hibiki:实时语音翻译模型,保留原声特点的流式翻译
Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模型采用多流架构,能够同时处理输入语...

CogView3:智谱轻言开源的级联扩散文本生成图像模型
综合介绍 CogView3 是由清华大学和智囊团队(智谱清言)开发的先进文本生成图像系统。它基于级联扩散模型,通过多阶段生成高分辨率图像。CogView3 的主要特点包括多阶段生成、创新架构和高效性能,适用于艺术创作...

Step-Audio
Step-Audio 是一个开源的智能语音交互框架,旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话(如中文、英文、日语)、情感语音(如快乐、悲伤)、区域方言(如粤语、四川话)、可调节的语速...

Megrez-3B-Omni
Infini-Megrez是由无问芯穹(Infinigence AI)开发的边缘智能解决方案,旨在通过软硬件协同设计,实现高效的多模态理解和分析。该项目的核心是Megrez-3B模型,支持图像、文本和音频的综合理解,具有高准确性和快...
Kode是一个强大的AI助手,它直接在你的电脑终端里运行。你可以把它看作一个和你一起工作的程序员,它能理解你的代码库,帮你编辑文件,还能执行命令行指令来处理整个开发流程。和其他工具不同的是,Kode可以同时...
Wan是一个AI驱动的视觉内容生成网站,其核心是名为Wan 2.2的开源模型。用户可以通过这个工具,将文字、图片或音频快速转换成高质量的视频。网站支持多种生成方式,包括“文字生成视频”、“图片生成视频”以及独特的“...
音秘是百度推出的AI音频生成平台。它用文本提示创建高质量音频内容,包括音乐、声音效果和配音。用户输入描述,AI快速生成音频。平台支持多种语言,重点是中文和英文。用户可以调整风格、语气和节奏。音频可以导...
DeepAnalyze是一款为自主数据科学设计的智能代理大语言模型。 用户无需人工干预,它就可以独立完成整个数据科学流程的任务,这些任务包括数据准备、分析、建模、可视化和报告生成。DeepAnalyze能够对多种数据来源...
AI图像放大器是一个在线工具,它使用人工智能技术来放大图片的尺寸并提升其清晰度。这个网站的核心功能是“超分辨率”,一种通过算法智能地增加图片像素,从而在放大图片的同时保持甚至优化细节的技术。用户可以直...
CodeFlicker是一个AI驱动的集成开发环境。快手旗下的StreamLake团队开发了它。它帮助开发者生成代码、优化程序和调试错误。工具基于大模型,如KAT-Coder和Claude Sonnet。KAT-Coder是快手自研模型,处...
Anannas AI是一个统一的API网关。它让用户通过一个API访问500多种大型语言模型。这些模型来自不同提供商,比如OpenAI、Anthropic、Mistral、Gemini和DeepSeek。平台提供故障安全的路由功能。它能控制...
GEPA (Genetic-Pareto) 是一个用于优化AI系统中各类文本组件的框架。这些文本组件可以AI模型的提示词、代码片段或配置文件。它采用了一种名为“反思性文本进化”的方法,通过大型语言模型(LLM)来分析和反思AI系统...
DeepSeek-OCR 是由深度求索(DeepSeek-AI)公司开发并开源的一款光学字符识别(OCR)工具。 它提出了一个名为“上下文光学压缩”的新方法,从大语言模型(LLM)的角度来重新看待视觉编码器的角色。 这个工具不是简...
搭叩 (Dā kòu) 是一款由心流AI (iFlow) 团队开发的异步AI智能体(Agent)产品。它本质上是一套由AI驱动的一站式研发工具,旨在帮助用户将创意想法转化为实际产品。该工具提供了一个独立的云端运行环境,用户可以...
grok2api 是一个基于 FastAPI 框架重构的开源项目,旨在将 X(前身为 Twitter)的 Grok 大模型的网页调用格式,转换为与 OpenAI API 完全兼容的接口。 这使得开发者可以轻松地将 Grok 的强大功能集成到...
MixHub AI 是一个集合了多种AI模型的在线平台,用户可以通过这一个网站使用全球主流的AI模型进行聊天、图像生成和视频创作。它整合了例如GPT、Claude、Gemini等聊天模型,以及Sora、Kling、Runway等视频生成模型...

在当前的 Web 开发领域,借助强大的云平台实现个人或企业网站的快速、免费托管已成为一种主流选择。Cloudflare 不仅以其领先的 CDN 和安全服务闻名,其 Cloudflare Pages 服务也为开发者提供了一套与 Git 集成的...

如何平衡服务器的性能、网络质量与成本,是许多开发者和服务部署者面临的共同挑战。高配置的服务器往往价格不菲,而具备优质网络线路(如 CN2 GIA)的服务器,其高昂的成本更是让许多预算有限的项目望而却步。 本...

将小说或剧本转化为分镜脚本,是影视、动画和漫画创作中的关键一环。这个过程需要创作者深度解析文本,梳理情节、人物、场景和对话,再通过想象力构建出一系列连续的画面。传统的人工方式不仅耗时,而且工作量巨...

前言:构建经济高效的 AI 图像生成与编辑工作流 通义千问 Qwen-Image 作为一款开源的文生图模型,凭借其在复杂文本渲染,尤其是中文字符生成方面的卓越能力,获得了广泛关注。 与主流模型相比,它能在图像中精准...

在构建基于大型语言模型(LLM)的知识库问答应用时,开发者普遍会采用检索增强生成(RAG)技术。然而,RAG 的实际效果常常受限于一个核心矛盾:如何平衡检索的精确性与上下文的完整性。如果文本切片(Chunk)过小...

Anthropic 公司推出的 AI 编程助手 Claude Code 以其强大的代码生成和交互能力,在开发者社区中获得了广泛关注。然而,作为一个闭源产品,其内部工作机制对外界始终是一个“黑盒”,这不仅让开发者难以完全理解其决...

AI 编程工具正从被动的代码“补全器”进化为主动的“开发伙伴”。它们能够理解复杂需求、规划任务并直接参与整个开发流程。本文将深度解析一款代表该趋势的命令行AI编程工具——我们称之为 Claude Code,并提供一份详尽...

无论是 Cursor、Claude Code,还是 Aider、RooCode 等工具,各类 AI 编程工具正带着其独特的指令配置方法(如 .cursor/rules/、GEMINI.md 等)进入市场。这种多样性反映了不同团队的创新思路,...

数据可视化通常需要繁琐的编程或复杂的图形界面操作,但现在有了新的选择。蚂蚁集团开源的数据可视化库 AntV 生态下的 @antv/mcp-server-chart 项目,让用户可以通过自然语言指令快速生成各种主流图表,极大地简...

随着 Claude Code 这类代理式终端编程工具的兴起,一种全新的开发模式正在形成。这类工具允许开发者在终端环境中,通过人工智能代理执行从需求分析到代码实现、测试和修复的复杂任务。然而,其原生的交互体验和功...

Dify 作为一个开源的 LLM 应用开发平台,凭借其从 Agent 构建、AI workflow 编排到 RAG 检索和模型管理的全方位能力,在开发者社区中获得了广泛关注。它以优雅的设计和流畅的体验著称,同时开发团队惊人的迭代速...

Claude Code:终端中的智能开发代理 Anthropic 推出的命令行工具 Claude Code 并非又一个聊天窗口或 IDE 插件,而是一个原生集成在终端环境的开发代理。它能理解项目结构,读写文件,执行命令,甚至协调多个子代.....
中文TTS特殊挑战中文存在多音字、儿化音等复杂发音规则。虽然当前版本对中文支持仍在完善中,但可通过以下方案提升...
商业场景需求客服系统、有声书制作等场景需要动态切换不同音色的语音输出。Kokoro-ONNX通过以下机制满足该...
性能瓶颈分析在CPU资源受限的设备上,TTS系统容易出现延迟。Kokoro-ONNX通过以下设计实现性能优化:...
背景介绍在多语言场景下,传统的TTS系统往往需要复杂的依赖库和庞大的模型文件,导致部署效率低下。Kokoro-...
Kokoro-ONNX的安装过程经过精心设计,确保了开发者的使用便利性。基础安装仅需通过pip执行一条命令即可...
Kokoro-ONNX不仅支持基本的语音合成功能,还提供了多样化的声音选择选项。用户可以通过voices.js...
Kokoro-ONNX在设计之初就考虑了多语言支持的需求。当前版本已完整支持英语的文本转语音功能,这是最基础也...
Kokoro-ONNX是一个基于ONNX Runtime的开源文本转语音(TTS)引擎,由开发者thewh1t...
已公布的开发计划根据项目文档和开发者访谈,未来半年将重点推进:语言扩展:2024年Q3前完成法语/日语支持,Q...
语音生成五步流程配置文件修改:编辑voices.json选择目标语言和音色(如'en_US'英语美国女声)文本...
差异化竞争优势与传统TTS方案比较,Kokoro-ONNX在三个方面表现突出:1. 技术架构优势ONNX运行时...
安装流程详解安装分为三个主要阶段,建议使用Python 3.12环境:基础安装:通过pip执行pip inst...
回顶部