开源 AI 视频创作工作室

从创意到视频,AI 一键达成

由 9 个专业级 AI Agent 协同组成的导演管线。只需输入一句话,系统将自动撰写脚本、设计分镜、配音、配乐并渲染出完整的视频作品。

AI_STUDIO_V1.0.0
"Create a high-octane cyberpunk video featuring neon streets, a rainy night, cinematic synthetic score, and a narrative around a rogue detective."
Script AgentCOMPLETE
Art Style NodeCyberpunk Neon
BGM NodeSynthwave Track
Status: Rendered
Watch Render Output

演示:一个赛博朋克侦探故事完全由 AI 生成——从剧本到最终渲染仅需几分钟。视频展示了 OpenDirector 的 9 个 Agent 管线如何从一句文字提示生成电影级视觉效果、角色设计、配音旁白和原创背景音乐。

演示视频详解

了解 OpenDirector 如何通过 9 个 Agent 管线将一句话转化为完整的电影级视频。

0:00

输入提示词

用户输入一句话:一个发生在霓虹灯城市的赛博朋克侦探故事。OpenDirector 的调研 Agent 立即开始收集赛博朋克美学、黑色叙事手法和视觉参考的背景资料。

0:10

剧本生成

编剧 Agent 撰写完整的三幕式叙事结构,包含对白、场景描述和节奏标注。它将故事适配为短视频格式,设置戏剧性节拍和令人满意的结局。

0:20

艺术指导

艺术风格 Agent 从 9 大类别 34 种内置风格中选择,应用赛博朋克类型惯例。分镜 Agent 随后运用电影构图原则——三分法、引导线和带有图像生成元数据的镜头角度——规划每个镜头。

0:30

角色与场景设计

角色 Agent 生成详细的角色设定表,确保跨场景视觉一致性,包括表情变化和风格嵌入。场景 Agent 创建富有氛围感的室内和室外环境,支持视差效果的深度图层。

0:40

配音与音乐

配音 Agent 使用 TTS 提供商(Edge、OpenAI 或自定义语音)生成自然旁白,支持 SSML 标记控制节奏。BGM Agent 创作与故事情绪匹配的背景音乐,支持交叉渐变和音效分层。

0:50

最终渲染

媒体 Agent 将所有素材——角色图像、背景、配音、音乐和字幕——使用 FFCreator 组装成完整渲染视频。处理图像合成、字幕叠加、音频同步,并编码至目标分辨率,最高支持 1080p。

从提示词到最终视频的整个过程仅需几分钟,创作模式下每个阶段都支持手动编辑。

什么是 OpenDirector?

OpenDirector 是一个开源 AI 视频制作平台,通过 9 个专业 AI Agent 自动化整个视频创作流程。平台基于 LangGraph 进行 Agent 编排、Next.js 构建 Web 界面、FFCreator 负责视频渲染,只需输入一句话提示词,即可生成包含剧本、分镜、角色设计、场景美术、配音、配乐和最终渲染的完整视频作品。平台提供两种制作模式:导演创作模式支持交互式高端电影级输出,可手动编辑每个环节;短视频批量模式支持自动化批量生成短视频。内置 9 大类别共 34 种艺术风格,支持 16:9 电影宽幅、9:16 竖屏和 1:1 正方形画面比例,最高可导出 1080p 全高清画质。采用 Docker-first 本地部署架构,所有数据保存在用户本地机器上,确保完全隐私。项目采用 MIT 开源协议,由 seme-org 在 GitHub 上维护。

双引擎视频制作

无论是高度自定义的导演协作,还是全自动的短视频批量产出,均能轻松应对。

AI 导演全工作流

导演创作模式

输入一句话创意,AI 导演自动生成完整的制片方案:包括大纲、故事、分镜、配音、人物设定及背景音乐。您也可以随时在行内手动修改每一项细节。

  • 交互式分镜预览,图像与配音音乐同步播放
  • 内置 9 大类别共 34 种艺术风格(如电影感、动漫等)
  • 支持多种 TTS 角色配音,实时试听与情感匹配
  • 支持 16:9 电影宽幅、9:16 竖屏及 1:1 正方形比例
  • 支持高达 1080p 全高清画质导出
Full Control / Real-time Editing / Custom Plates
爆款视频批量生产

短视频批量模式

专为短视频创作者打造的批量生产引擎。只需输入主题,AI 将自动编写多个文案,智能匹配免版权高清素材并添加字幕、配音和音乐,批量导出视频。

  • 主题一键裂变多文案与视频生成
  • 自定义分镜时长与素材切换节奏
  • 高度自定义字幕(支持字体、大小、颜色、描边、阴影等)
  • 集成 Pexels 和 Pixabay 高清免版权素材库
  • 一次性生成多个版本,轻松挑选最优效果
Mass Production / Stock Integration / Configurable Transition

一键本地私有化部署

OpenDirector 采用 Docker-first 设计。您的剧本、素材、生成文件及数据完全保留在您自己的服务器上,保障绝对私密性。

1

克隆开源仓库到本地

Terminal step 1
2

配置 API Key 以及环境参数

Terminal step 2
3

一键启动 MySQL, Redis, MinIO 及主应用

Terminal step 3
4

浏览器打开本地页面,开启视频创作

Terminal step 4
self_host_setup.sh
git clone https://github.com/seme-org/open-director.git
cd open-director
cp .env.example .env
# Edit .env and enter your WAVESPEED_API_KEY and OPENAI_API_KEY
docker compose up -d --build
# Open http://localhost:3000 in your browser
常见问题

常见问题解答

关于 OpenDirector,你想知道的一切。

OpenDirector 是什么?
OpenDirector 是一个开源 AI 视频制作平台,由 9 个专业 AI Agent 协同工作,只需输入一句话即可生成完整视频。基于 LangGraph 编排、Next.js 前端和 FFCreator 渲染器构建,自动化整个制作流程——从剧本撰写、分镜设计到配音、配乐和最终视频渲染。支持交互式创作模式和自动化批量生产。
OpenDirector 是如何工作的?
OpenDirector 使用 LangGraph 编排的 9 个 Agent 管线。调研 Agent 收集背景信息,编剧 Agent 撰写叙事,艺术 Agent 从 34 种视觉风格中选择,分镜 Agent 规划镜头,角色和场景 Agent 设计视觉元素,配音 Agent 生成旁白,音乐 Agent 创作配乐,媒体 Agent 渲染最终视频。每个 Agent 通过状态图通信,支持实时协作和任意阶段的手动调整。
OpenDirector 是免费的吗?
是的,OpenDirector 在 MIT 开源协议下完全免费。可用于个人和商业项目。唯一的费用是你配置的 AI API 密钥(如 OpenAI、Anthropic 或其他大模型服务商)以及你连接的 TTS 或图像生成服务的费用。
如何部署 OpenDirector?
OpenDirector 采用 Docker-first 设计。克隆 GitHub 仓库,在 .env 文件中配置 API 密钥,然后运行 docker compose up 启动 MySQL、Redis、MinIO 和应用。打开浏览器即可开始创作。在任何安装了 Docker 的机器上,整个设置过程约 5 分钟。
OpenDirector 支持哪些视频格式和比例?
OpenDirector 支持三种画面比例:16:9 电影宽幅、9:16 竖屏和 1:1 正方形。视频可导出最高 1080p 全高清分辨率。平台内置 9 大类别共 34 种艺术风格,涵盖电影感、动漫、水彩、赛博朋克等。
我的数据在 OpenDirector 中安全吗?
是的。由于 OpenDirector 通过 Docker 本地部署,你的剧本、配音、角色设计和渲染视频都保存在本地机器上,不会上传到第三方服务器。唯一的外部调用是你明确配置的 AI API,用于生成任务。