海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする

ai-fusion-video(中文名:融光)是由开发者 Stonewuu 开源的一款基于 Agent(智能体)全流程工作流的 AI 视频创作平台。该平台专注于将复杂的影视和短剧制作流程自动化,其核心理念是“剧本即视频”。用户只需在界面输入文字剧本,系统内置的 AI 智能体便会自动对剧本进行深度结构化拆解,生成包含角色、场景和运镜提示词的专业分镜脚本。在视觉生成层面,融光深度集成了市面上主流的文生图与图生视频大模型。平台内置了超过 30 种针对视频制作优化的 AI 工具指令(Tools),全自动调度不同模型完成画面一致性控制、素材生成与最终的视频合成任务。通过直观的可视化分镜编辑器,创作者可实现类似于专业影视制作的流程监控。融光大幅降低了 AI 视频生产的操作门槛,让个人创作者、自媒体团队以及推文博主能以极高的效率产出短剧、漫剧等高质量的视频内容。

機能一覧

  • 剧本智能解析与拆解:支持一键输入长文本或剧本,AI 智能体会自动根据剧情发展和逻辑,提取关键场景,将其精准切割并拆分为结构化的分镜脚本(高度参考影视行业专业分镜格式)。
  • 专业级分镜编辑器:提供类似于专业剪辑软件的分镜管理面板。支持用户对 AI 拆解出的每一帧画面描述、正负向提示词进行手动介入与微调,确保绝对控制力。
  • Agent 智能体调度工作流:内置超过 30 个专门处理影视逻辑的 Agent 工具节点,能够自主分配任务、调用画图模型、校验画面质量,并触发视频生成。
  • 多模型协作生成:系统底层打通了标准的 API 接口,支持同时接入市面上主流的各类大语言模型、文生图模型及图生视频模型(如 OpenAI 兼容接口、Stable Diffusion、Kling 等)。
  • 细颗粒度运镜控制:在生成视频片段时,支持配置详细的摄影机运镜参数(如推镜头、拉近、平移、环绕等),让 AI 生成的画面更具电影级的空间感。
  • 素材一键对比与绑定:针对单个分镜可并行生成多张草图供创作者挑选,选定最佳原图后一键转为动态视频,图文状态与剧本节点强关联,不易丢失。
  • 全自动视频片段合成:当所有分镜的动态视频片段均生成完毕后,平台会根据分镜时间线自动将其无缝拼合,直接输出连贯的成片视频。

ヘルプの使用

融光 (ai-fusion-video) 是一款前后端分离的开源架构项目。要流畅使用该平台,你需要先完成本地或服务器的部署,随后通过浏览器进入可视化操作界面进行视频创作。以下是详细的安装部署指南以及全流程操作教程,帮助你从零开始打造自己的 AI 视频工作流。

一、 部署与安装流程

该系统基于 Java 和 TypeScript 开发,部署前请确保你的计算机或云服务器已具备基础的运行环境。

1. 必备环境准备

  • Java 运行环境:请安装 JDK 17 或以上版本,并正确配置操作系统的环境变量。
  • Node.js 平台:请安装 Node.js v18.x 或更高版本,建议同时全局安装 pnpm 或 yarn 依赖管理工具以便于前端构建。
  • 数据库服务:安装并启动 MySQL 8.0+ 数据库,用于持久化存储项目配置、用户的剧本、分镜信息等核心业务数据。
  • 缓存与队列:安装并启动 Redis 服务。由于 Agent 生成视频是耗时的异步任务,系统的任务调度队列和状态缓存高度依赖 Redis 服务。

2. 获取项目源码
打开终端或命令行工具,将 GitHub 上的项目代码克隆至你的本地目录:

git clone https://github.com/Stonewuu/ai-fusion-video.git
cd ai-fusion-video

3. 后端服务部署

  1. 进入项目后端的 Java 源码目录。
  2. 打开 MySQL 数据库工具,创建一个新的空数据库(例如命名为 fusion_video_db,具体名称可根据配置文件决定),并导入项目附带的初始化 SQL 脚本。
  3. 找到后端配置文件夹中的 application.yml 或 application-dev.yml ドキュメンテーション
  4. 将数据库的连接地址、用户名、密码修改为你本地的 MySQL 信息。同时,配置 Redis 的连接端口和密码(Redis 默认通常为本地 6379 端口)。
  5. 使用 Maven 工具(运行 mvn clean install)或直接通过 IntelliJ IDEA 等开发工具编译并运行该 Java 项目。若配置正确,终端会显示 Spring Boot 服务启动成功,并监听指定的后端 API 端口(如 8080)。

4. 前端界面部署

  1. 打开一个新的终端窗口,进入项目的前端目录(通常是 web 或 frontend 等包含 package.json 的文件夹)。
  2. 执行前端依赖安装命令:npm install(如果使用其他包管理器,可执行 pnpm install)。
  3. 依赖安装完成后,执行本地开发启动命令:npm run dev
  4. 控制台运行完毕后会输出一个本地访问地址(例如 http://localhost:3000 或 http://localhost:5173),在浏览器中打开该地址,即可看到融光平台的用户界面。

二、 核心功能与工作流操作指南

当你成功进入并登录融光系统后,即可体验到“剧本即视频”的自动化魔法。为了达到最佳的生成效果,请严格按照以下步骤操作。

1. 基础配置与模型接入
在开始首次创作前,必须先配置系统引擎。点击系统左侧边栏的**“设置”“模型配置”**中心。在此处,你需要填入由各大 AI 厂商提供的 API Key(接口密钥):

  • マクロ言語モデル:填入兼容 OpenAI 格式的大型语言模型 API(如 GPT-4、Claude 或是国内的通义千问、DeepSeek 等),这类模型主要负责分析你的剧本并进行智能分镜拆解。
  • 图像与视频模型:配置相关绘画大模型及视频大模型的 API 接口,这是将文本变成视觉画面的算力基础。

2. 剧本导入与智能拆解

  1. 在项目面板点击右上角的**“新建创作项目”**,为你的作品命名,并设定基础的视频风格(如:写实电影、二次元动漫、3D 渲染等)。
  2. 入る剧本工作区,将你构思好的小说核心段落、短剧文案或自媒体解说词直接粘贴进主界面的输入框。
  3. 点击底部的**“AI 智能拆解”按钮。此时,系统底层的智能体(Agent)工作流将被全面激活。AI 会模拟专业导演的视角深度阅读剧本,将连续长文本依据镜头切换逻辑,切分为结构化的“分镜面板”**。原来的一整段文字会被自动拆解为场景1、场景2等数十个区块,每个区块中自动补全了画面主体描述、环境光影、甚至时间状态。

3. 分镜面板的深度微调(关键步骤)
虽然 AI 的结构化拆解极其高效,但高质量的视频创作离不开创作者的人工微调。融光提供了高度专业的分镜编辑器:

  • 提示词重构:点击任意一个独立分镜,你可以清晰看到 AI 为该画面准备的“正向提示词”和“反向提示词”。如果希望给画面加上特定的视觉特征(如“赛博朋克霓虹灯”、“雨天氛围”),可直接在文本框内进行手动追加与修改。
  • 摄影机运镜调整:在右侧的运镜控制面板,你可以手动设置摄像机的运动轨迹。例如勾选“推镜头(Zoom In)”、“摇镜头(Pan Left/Right)”,让最终生成的静态图转视频时具有院线级别的空间运动感。

4. 调度 Agent 触发多模态生成
确认所有的分镜描述和运镜设置无误后,点击工作台区域的**“执行工作流 / 开始生成”
融光系统内置的 30 多个 AI 工具接口(Tools)会自动开始流水线作业。它会首先向图像模型下发任务,为每个分镜生成高质量的
参考原图(基准画面)。系统支持每个分镜生成多张草图,你可以像选片一样挑出最符合心意的一张。挑选完毕并确认锁定后,Agent 会自动把该基准图连同运镜提示词一同发送给后端的视频生成模型**,开始将其渲染为动态的 MP4 视频片段。此时,你可以离开电脑,系统会在后台通过队列自动完成所有镜头的渲染。

5. 视频预览、自动拼接与成片导出

  • 当所有分镜的视频片段渲染完成后,系统会自动在面板底部的**“视频时间线”**上将它们首尾串联。
  • 点击主播放器即可进行全局连贯性预览。如果在播放过程中发现某一个分镜存在动作崩坏或严重穿模问题,可以返回对应分镜,单独点击“重新生成当前分镜”而无需重跑整个项目。
  • 最终确认对画面效果完全满意后,点击右上角的**“合成与导出”**。系统后台将自动处理各个独立 MP4 片段的无缝拼接逻辑,几分钟后,一部完全由 AI 打造、可直接用于各类短视频平台发布的高清成片即可下载到本地。

アプリケーションシナリオ

  1. AI 剧情短剧与漫剧量产
    面向个人创作者或小型工作室,可将网络小说、原创微小说直接输入平台,系统会自动完成分镜拆分和画面生成,极大节省了寻找真人演员、场地租赁和专业摄影团队的巨大成本,单人即可完成一部短剧的制作。
  2. 小说推文视频化变现
    小说推文博主可以将小说的高潮章节或悬疑片段导入平台,系统会根据小说文字描述产出视觉高度连贯的背景视频和解说画面,摆脱以往到处寻找无关素材拼凑的窘境,大幅提升短视频平台上的完播率。
  3. 专业影视项目前期预览(Animatic 动态分镜)
    专业影视导演或摄影指导在正式开机拍摄前,可将原始剧本输入该系统,快速生成一套具备实际运镜效果的动态分镜预览版。用于辅助团队内部的视觉沟通、拍摄机位规划与灯光布景预演。
  4. 自媒体口播文案配乐视频
    科普类或讲书类自媒体博主,输入解说文案后,平台自动拆解不同维度的知识画面场景,批量生成对应的高质量解说辅视频,让抽象的内容具象化,缩短视频产出周期。

QA

  1. 融光 (ai-fusion-video) 系统是免费的吗?
    答:该平台的基础系统是完全免费的。融光作为一个遵循开源协议(MIT)的项目,其全部代码均托管在 GitHub 上,企业或个人都可以免费下载、学习并在本地部署。但需要注意的是,视频和图像的实际生成过程依赖于你自行接入的第三方大模型 API,因此在使用过程中,你需要自理各类大语言模型及视频模型平台所收取的接口调用费用。
  2. 部署和运行该系统对本地电脑硬件的显卡要求高吗?
    答:要求极低。该系统采用了前后端分离加云端模型调用的架构设计,系统的核心作用是作为“智能中央调度台”。所有对算力消耗巨大的图片推理、视频渲染等任务,都通过 API 接口交给了各大 AI 厂商的云端服务器去执行。因此,即使是显卡配置很低的普通办公笔记本或轻量级云服务器,也能毫无压力地流畅运行该系统。
  3. 如果 AI 拆解分镜后生成的画面不符合我想要的预期怎么办?
    答:平台充分考虑了 AI 在艺术理解上的偏差,因此提供了高度可控的编辑机制。在系统内,AI 生成的分镜脚本和提示词并非直接写死的,你可以利用平台内置的分镜编辑器,随时干预和重写每个镜头的描述词、删除多余画面、或者重新规定运镜走向。你对每一帧画面都拥有绝对的修改和决定权。
0ブックマークに登録
0表彰される

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力してください。Bing検索へのアクセシビリティAIツールはこのサイトですぐに見つけることができる。

新着情報

トップに戻る