ai-fusion-video(中文名:融光)是由开发者 Stonewuu 开源的一款基于 Agent(智能体)全流程工作流的 AI 视频创作平台。该平台专注于将复杂的影视和短剧制作流程自动化,其核心理念是“剧本即视频”。用户只需在界面输入文字剧本,系统内置的 AI 智能体便会自动对剧本进行深度结构化拆解,生成包含角色、场景和运镜提示词的专业分镜脚本。在视觉生成层面,融光深度集成了市面上主流的文生图与图生视频大模型。平台内置了超过 30 种针对视频制作优化的 AI 工具指令(Tools),全自动调度不同模型完成画面一致性控制、素材生成与最终的视频合成任务。通过直观的可视化分镜编辑器,创作者可实现类似于专业影视制作的流程监控。融光大幅降低了 AI 视频生产的操作门槛,让个人创作者、自媒体团队以及推文博主能以极高的效率产出短剧、漫剧等高质量的视频内容。
Funktionsliste
- 剧本智能解析与拆解:支持一键输入长文本或剧本,AI 智能体会自动根据剧情发展和逻辑,提取关键场景,将其精准切割并拆分为结构化的分镜脚本(高度参考影视行业专业分镜格式)。
- 专业级分镜编辑器:提供类似于专业剪辑软件的分镜管理面板。支持用户对 AI 拆解出的每一帧画面描述、正负向提示词进行手动介入与微调,确保绝对控制力。
- Agent 智能体调度工作流:内置超过 30 个专门处理影视逻辑的 Agent 工具节点,能够自主分配任务、调用画图模型、校验画面质量,并触发视频生成。
- 多模型协作生成:系统底层打通了标准的 API 接口,支持同时接入市面上主流的各类大语言模型、文生图模型及图生视频模型(如 OpenAI 兼容接口、Stable Diffusion、Kling 等)。
- 细颗粒度运镜控制:在生成视频片段时,支持配置详细的摄影机运镜参数(如推镜头、拉近、平移、环绕等),让 AI 生成的画面更具电影级的空间感。
- 素材一键对比与绑定:针对单个分镜可并行生成多张草图供创作者挑选,选定最佳原图后一键转为动态视频,图文状态与剧本节点强关联,不易丢失。
- 全自动视频片段合成:当所有分镜的动态视频片段均生成完毕后,平台会根据分镜时间线自动将其无缝拼合,直接输出连贯的成片视频。
Hilfe verwenden
融光 (ai-fusion-video) 是一款前后端分离的开源架构项目。要流畅使用该平台,你需要先完成本地或服务器的部署,随后通过浏览器进入可视化操作界面进行视频创作。以下是详细的安装部署指南以及全流程操作教程,帮助你从零开始打造自己的 AI 视频工作流。
一、 部署与安装流程
该系统基于 Java 和 TypeScript 开发,部署前请确保你的计算机或云服务器已具备基础的运行环境。
1. 必备环境准备
- Java 运行环境:请安装 JDK 17 或以上版本,并正确配置操作系统的环境变量。
- Node.js 平台:请安装 Node.js v18.x 或更高版本,建议同时全局安装
pnpm或yarn依赖管理工具以便于前端构建。 - 数据库服务:安装并启动 MySQL 8.0+ 数据库,用于持久化存储项目配置、用户的剧本、分镜信息等核心业务数据。
- 缓存与队列:安装并启动 Redis 服务。由于 Agent 生成视频是耗时的异步任务,系统的任务调度队列和状态缓存高度依赖 Redis 服务。
2. 获取项目源码
打开终端或命令行工具,将 GitHub 上的项目代码克隆至你的本地目录:
git clone https://github.com/Stonewuu/ai-fusion-video.git
cd ai-fusion-video
3. 后端服务部署
- 进入项目后端的 Java 源码目录。
- 打开 MySQL 数据库工具,创建一个新的空数据库(例如命名为
fusion_video_db,具体名称可根据配置文件决定),并导入项目附带的初始化 SQL 脚本。 - 找到后端配置文件夹中的
application.yml或application-dev.ymlDokumentation. - 将数据库的连接地址、用户名、密码修改为你本地的 MySQL 信息。同时,配置 Redis 的连接端口和密码(Redis 默认通常为本地 6379 端口)。
- 使用 Maven 工具(运行
mvn clean install)或直接通过 IntelliJ IDEA 等开发工具编译并运行该 Java 项目。若配置正确,终端会显示 Spring Boot 服务启动成功,并监听指定的后端 API 端口(如 8080)。
4. 前端界面部署
- 打开一个新的终端窗口,进入项目的前端目录(通常是
web或frontend等包含package.json的文件夹)。 - 执行前端依赖安装命令:
npm install(如果使用其他包管理器,可执行pnpm install)。 - 依赖安装完成后,执行本地开发启动命令:
npm run dev。 - 控制台运行完毕后会输出一个本地访问地址(例如
http://localhost:3000或http://localhost:5173),在浏览器中打开该地址,即可看到融光平台的用户界面。
二、 核心功能与工作流操作指南
当你成功进入并登录融光系统后,即可体验到“剧本即视频”的自动化魔法。为了达到最佳的生成效果,请严格按照以下步骤操作。
1. 基础配置与模型接入
在开始首次创作前,必须先配置系统引擎。点击系统左侧边栏的**“设置”或“模型配置”**中心。在此处,你需要填入由各大 AI 厂商提供的 API Key(接口密钥):
- Makrolanguage-Modell:填入兼容 OpenAI 格式的大型语言模型 API(如 GPT-4、Claude 或是国内的通义千问、DeepSeek 等),这类模型主要负责分析你的剧本并进行智能分镜拆解。
- 图像与视频模型:配置相关绘画大模型及视频大模型的 API 接口,这是将文本变成视觉画面的算力基础。
2. 剧本导入与智能拆解
- 在项目面板点击右上角的**“新建创作项目”**,为你的作品命名,并设定基础的视频风格(如:写实电影、二次元动漫、3D 渲染等)。
- gehen in剧本工作区,将你构思好的小说核心段落、短剧文案或自媒体解说词直接粘贴进主界面的输入框。
- 点击底部的**“AI 智能拆解”按钮。此时,系统底层的智能体(Agent)工作流将被全面激活。AI 会模拟专业导演的视角深度阅读剧本,将连续长文本依据镜头切换逻辑,切分为结构化的“分镜面板”**。原来的一整段文字会被自动拆解为场景1、场景2等数十个区块,每个区块中自动补全了画面主体描述、环境光影、甚至时间状态。
3. 分镜面板的深度微调(关键步骤)
虽然 AI 的结构化拆解极其高效,但高质量的视频创作离不开创作者的人工微调。融光提供了高度专业的分镜编辑器:
- 提示词重构:点击任意一个独立分镜,你可以清晰看到 AI 为该画面准备的“正向提示词”和“反向提示词”。如果希望给画面加上特定的视觉特征(如“赛博朋克霓虹灯”、“雨天氛围”),可直接在文本框内进行手动追加与修改。
- 摄影机运镜调整:在右侧的运镜控制面板,你可以手动设置摄像机的运动轨迹。例如勾选“推镜头(Zoom In)”、“摇镜头(Pan Left/Right)”,让最终生成的静态图转视频时具有院线级别的空间运动感。
4. 调度 Agent 触发多模态生成
确认所有的分镜描述和运镜设置无误后,点击工作台区域的**“执行工作流 / 开始生成”。
融光系统内置的 30 多个 AI 工具接口(Tools)会自动开始流水线作业。它会首先向图像模型下发任务,为每个分镜生成高质量的参考原图(基准画面)。系统支持每个分镜生成多张草图,你可以像选片一样挑出最符合心意的一张。挑选完毕并确认锁定后,Agent 会自动把该基准图连同运镜提示词一同发送给后端的视频生成模型**,开始将其渲染为动态的 MP4 视频片段。此时,你可以离开电脑,系统会在后台通过队列自动完成所有镜头的渲染。
5. 视频预览、自动拼接与成片导出
- 当所有分镜的视频片段渲染完成后,系统会自动在面板底部的**“视频时间线”**上将它们首尾串联。
- 点击主播放器即可进行全局连贯性预览。如果在播放过程中发现某一个分镜存在动作崩坏或严重穿模问题,可以返回对应分镜,单独点击“重新生成当前分镜”而无需重跑整个项目。
- 最终确认对画面效果完全满意后,点击右上角的**“合成与导出”**。系统后台将自动处理各个独立 MP4 片段的无缝拼接逻辑,几分钟后,一部完全由 AI 打造、可直接用于各类短视频平台发布的高清成片即可下载到本地。
Anwendungsszenario
- AI 剧情短剧与漫剧量产
面向个人创作者或小型工作室,可将网络小说、原创微小说直接输入平台,系统会自动完成分镜拆分和画面生成,极大节省了寻找真人演员、场地租赁和专业摄影团队的巨大成本,单人即可完成一部短剧的制作。 - 小说推文视频化变现
小说推文博主可以将小说的高潮章节或悬疑片段导入平台,系统会根据小说文字描述产出视觉高度连贯的背景视频和解说画面,摆脱以往到处寻找无关素材拼凑的窘境,大幅提升短视频平台上的完播率。 - 专业影视项目前期预览(Animatic 动态分镜)
专业影视导演或摄影指导在正式开机拍摄前,可将原始剧本输入该系统,快速生成一套具备实际运镜效果的动态分镜预览版。用于辅助团队内部的视觉沟通、拍摄机位规划与灯光布景预演。 - 自媒体口播文案配乐视频
科普类或讲书类自媒体博主,输入解说文案后,平台自动拆解不同维度的知识画面场景,批量生成对应的高质量解说辅视频,让抽象的内容具象化,缩短视频产出周期。
QA
- 融光 (ai-fusion-video) 系统是免费的吗?
答:该平台的基础系统是完全免费的。融光作为一个遵循开源协议(MIT)的项目,其全部代码均托管在 GitHub 上,企业或个人都可以免费下载、学习并在本地部署。但需要注意的是,视频和图像的实际生成过程依赖于你自行接入的第三方大模型 API,因此在使用过程中,你需要自理各类大语言模型及视频模型平台所收取的接口调用费用。 - 部署和运行该系统对本地电脑硬件的显卡要求高吗?
答:要求极低。该系统采用了前后端分离加云端模型调用的架构设计,系统的核心作用是作为“智能中央调度台”。所有对算力消耗巨大的图片推理、视频渲染等任务,都通过 API 接口交给了各大 AI 厂商的云端服务器去执行。因此,即使是显卡配置很低的普通办公笔记本或轻量级云服务器,也能毫无压力地流畅运行该系统。 - 如果 AI 拆解分镜后生成的画面不符合我想要的预期怎么办?
答:平台充分考虑了 AI 在艺术理解上的偏差,因此提供了高度可控的编辑机制。在系统内,AI 生成的分镜脚本和提示词并非直接写死的,你可以利用平台内置的分镜编辑器,随时干预和重写每个镜头的描述词、删除多余画面、或者重新规定运镜走向。你对每一帧画面都拥有绝对的修改和决定权。
























