Video Material GEN Workstation
一个集内容策划、AI文案自动生成、TTS 批量自动配音、(AI)图片素材合成、ASR自动提取语言字幕脚本、AI自由创作于一体的(短视频)生成工作站。方便管理每期的视频项目。
❗正在考虑使用最新LangGraph架构重构该项目,敬请期待❗
功能速览
- 支持按模板批量生成视频项目,脚本、图片素材(AI)、字幕和音频一键齐备。
- Gemini + TTS合成,既能改写脚本又能直接输出(带情绪的)配音。
- 图文分轨管理,可在前端随时替换图片、字幕或音频并预览结果。
数据展示
![图片[1]| Video Material GEN Workstation|AI短视频生成与项目管理一体化工作站| 小妖客栈](https://wangkay.top/wp-content/uploads/2025/12/20251201004331912-image.png)
前端界面
![图片[2]| Video Material GEN Workstation|AI短视频生成与项目管理一体化工作站| 小妖客栈](https://wangkay.top/wp-content/uploads/2025/12/20251201004425982-image.png)
![图片[3]| Video Material GEN Workstation|AI短视频生成与项目管理一体化工作站| 小妖客栈](https://wangkay.top/wp-content/uploads/2025/12/20251201004434368-image.png)
![图片[4]| Video Material GEN Workstation|AI短视频生成与项目管理一体化工作站| 小妖客栈](https://wangkay.top/wp-content/uploads/2025/12/20251201004440642-image.png)
![图片[5]| Video Material GEN Workstation|AI短视频生成与项目管理一体化工作站| 小妖客栈](https://wangkay.top/wp-content/uploads/2025/12/20251201004446830-image.png)
![图片[6]| Video Material GEN Workstation|AI短视频生成与项目管理一体化工作站| 小妖客栈](https://wangkay.top/wp-content/uploads/2025/12/20251201004450864-image.png)
![图片[7]| Video Material GEN Workstation|AI短视频生成与项目管理一体化工作站| 小妖客栈](https://wangkay.top/wp-content/uploads/2025/12/20251201004455298-image.png)
通过Docker 部署(目前有Bug)
- 复制配置:
cp env.example.yaml env.yaml,填好各个 Key。容器内建议把Default-Project-Root设为/data/projects(会被映射到本地./data目录,方便持久化)。 - 一键启动:
docker compose up -d --build。首次会自动构建。 - 打开
http://localhost:8765使用。查看日志可用docker compose logs -f video-workstation。 - 容器是无桌面环境,“打开项目目录/打开TTS文件夹”等按钮不会弹出文件管理器,接口会直接返回路径;请在宿主机手动进入对应目录(默认挂载在当前仓库的
./data)。
node如果拉不下来,推荐先使用
docker pull node:20-alpine, 再运行docker compose up -d --build
如果不想用 Compose,也可以用单条命令运行镜像(需要先 docker build -t video-workstation .): docker run -d -p 8765:8765 -v $(pwd)/env.yaml:/app/env.yaml:ro -v $(pwd)/data:/data --name video-workstation video-workstation
通过源码部署
- 复制
env.example.yaml为env.yaml,填入自己的 Gemini Key、Base URL、模型、TTS Key 与提示词等配置,否则无法调用接口。 - (可选)在
env.yaml中设置Default-Project-Root,用于存放自动生成的脚本、音频与图片文件。 - 安装依赖:
npm install。 - 启动服务:
npm start或直接双击start.bat,默认访问地址为http://localhost:8765。
功能介绍
- 项目总览:以卡片形式管理批量项目,显示输出目录、创建时间及删除动作,便于快速定位。
- 文案生成:结构化展示场景脚本,可复制单条或整段文案,左侧勾选联动右侧提示词。
- 字幕获取: 需配合我的另一个项目(n8n-http-tools): 开源地址:n8n-http-tools
- TTS 合成:支持单条与批量两种模式,输入合成文本与情感提示即可生成语音。
- 图片生成:集中管理角色描述、场景描述等提示词,勾选后即可批量复制到绘图任务。
- 立绘/背景等生成:提供提示词输入、参考图上传、宽高比设置与历史记录,方便随时复用素材。
- 逆向接口实现ASR自动提取剪辑需要的字幕文件:在TTS合成界面下方,有“字幕生成”功能,点击下方的按钮可以打开字幕生成工具。此部分代码由其它作者开源。
- 常用提示词与自由创作:收藏高频提示词并一键复制,同时提供自由创作面板进行自定义绘制。
其它功能我就懒得一个一个写了,具体有啥自己可以部署一下去玩,注意文案生成这里需要配合n8n来操作,之前写的n8n文件找不到了,所以这部分其实可以忽略,主要就是一个用于生成文案的脚本AI提示词以及我主页另一个仓库中有的一个开源的B站视频字幕提取器(当然网上也有)(参考别人高播放的视频自己学起来也会快很多)
接下来如何好好利用这个项目还是得靠自己。
因为主要还是偏向管理用的(简单来讲就是功能不会有你想象的那么实用),视频内容如何定义,如何打造爆款还是需要动脑子。当然本项目里面使用图像编辑模型的是NanoBanana,本地部署的AIStudio的反向代理的接口,用来生图然后给Sora也是不错的,起码测试下来比较稳定。
© 版权声明
THE END















暂无评论内容