大家好,我是「許澤宇」。
最近短劇/漫劇市場有多火,不用我多說了。刷短視頻平臺(tái),十條里有八條是“重生逆襲”“霸道總裁”“神醫(yī)下山”。看起來簡單,但真正做一部哪怕幾分鐘的短劇,背后都需要完整團(tuán)隊(duì):編劇、導(dǎo)演、演員、剪輯、配音。
而我自己也是一個(gè)資深短劇迷,在過去一兩年里我看過了上百部短劇。
對普通創(chuàng)作者來說,門檻最大的不是“會(huì)不會(huì)寫故事”,而是“能不能把故事穩(wěn)定地變成可控的鏡頭”。
這次我想分享一個(gè)非常“工程化”的開源項(xiàng)目:BigBanana AI Director(AI 漫劇工場)。
![]()
它的定位非常清晰:AI 一站式短劇/漫劇生成平臺(tái)。核心目標(biāo)不是“抽卡式生成”,而是把創(chuàng)作流程工業(yè)化,把導(dǎo)演工作臺(tái)搬進(jìn)瀏覽器。
項(xiàng)目一句話簡介
BigBanana AI Director面向創(chuàng)作者,提供從靈感到成片的完整工作流,支持劇本拆解、角色與場景資產(chǎn)構(gòu)建、關(guān)鍵幀控制、鏡頭生成與成片導(dǎo)出。
更關(guān)鍵的是,它采用Script?to?Asset?to?Keyframe的工業(yè)化流程,強(qiáng)調(diào)“可控”和“連貫”,而不是靠運(yùn)氣出圖。
![]()
為什么它和一般 AI 生成不一樣
傳統(tǒng)的 Text?to?Video 往往有三個(gè)硬傷:
角色不一致,鏡頭一換就“變臉”。
場景不連續(xù),光影與風(fēng)格無法統(tǒng)一。
運(yùn)鏡不可控,劇情節(jié)奏很難把握。
BigBanana 的解法是:關(guān)鍵幀驅(qū)動(dòng)(Keyframe?Driven)。
核心理念:關(guān)鍵幀驅(qū)動(dòng)
先畫后動(dòng):先生成精準(zhǔn)的起始幀(Start)與結(jié)束幀(End)。
插值生成:在兩幀之間生成平滑過渡的視頻。
資產(chǎn)約束:角色定妝照與場景概念圖強(qiáng)約束畫面一致性。
這樣做的意義是:鏡頭起止可控、角色穩(wěn)定、場景統(tǒng)一,從根本上解決“抽卡式翻車”。
核心功能拆解(四階段工作流) Phase 01:劇本與分鏡(Script & Storyboard)
這是整個(gè)生產(chǎn)線的起點(diǎn)。
功能要點(diǎn):
智能劇本拆解:輸入小說或故事大綱,自動(dòng)拆解成標(biāo)準(zhǔn)劇本結(jié)構(gòu)(場次、時(shí)間、氣氛)。
視覺化翻譯:自動(dòng)將文字描述轉(zhuǎn)化為專業(yè)提示詞。
節(jié)奏控制:支持設(shè)定目標(biāo)時(shí)長,自動(dòng)規(guī)劃鏡頭密度。
手動(dòng)編輯:可編輯角色視覺描述、分鏡畫面提示詞、動(dòng)作與臺(tái)詞,確保結(jié)果可控。
![]()
![]()
Phase 02:角色與場景資產(chǎn)(Assets & Casting)
一致性是 AI 視頻最難啃的硬骨頭。BigBanana 在這里下了重功夫。
功能要點(diǎn):
角色定妝照:為每個(gè)角色生成標(biāo)準(zhǔn)參考圖,確保一致性。
衣櫥系統(tǒng):支持多套造型(如日常/戰(zhàn)斗/受傷),在 Base Look 上保持面部特征不變。
場景概念圖:生成環(huán)境參考圖,確保同一場景的光影與氛圍統(tǒng)一。
![]()
Phase 03:導(dǎo)演工作臺(tái)(Director Workbench)
這是我最喜歡的部分,像一個(gè)“虛擬導(dǎo)演臺(tái)”。
功能要點(diǎn):
網(wǎng)格化分鏡表:全景式管理所有鏡頭。
Start / End Frame:精準(zhǔn)控制鏡頭起止畫面。
九宮格分鏡預(yù)覽:一鍵生成 9 個(gè)視角,快速確定構(gòu)圖。
上下文感知:自動(dòng)讀取當(dāng)前場景圖與角色定妝圖,避免“穿幫”。
視頻生成雙模式:支持單圖 Image?to?Video 與首尾幀 Keyframe Interpolation。
![]()
Phase 04:成片與導(dǎo)出(Export)
功能要點(diǎn):
時(shí)間軸式實(shí)時(shí)預(yù)覽
渲染進(jìn)度追蹤
導(dǎo)出高清關(guān)鍵幀與 MP4 片段,方便后期剪輯
![]()
![]()
快速上手(Docker 一鍵啟動(dòng))
如果你想本地體驗(yàn),部署非常直接,Docker Compose 一鍵啟動(dòng)。
# 1. 克隆項(xiàng)目
git clone https://github.com/shuyu-labs/BigBanana-AI-Director.git
cd BigBanana-AI-Director
# 2. 一鍵啟動(dòng)
docker-compose up -d --build# 3. 訪問應(yīng)用
# 瀏覽器打開 http://localhost:3005
使用流程(5 步)
啟動(dòng)應(yīng)用并配置 API Key
在 Phase 01 輸入故事創(chuàng)意,生成分鏡腳本
在 Phase 02 生成主角定妝照與核心場景圖
在 Phase 03 生成首幀,必要時(shí)補(bǔ)充尾幀或用九宮格預(yù)覽選構(gòu)圖
選擇視頻模型生成片段并導(dǎo)出
![]()
技術(shù)棧(簡版)
前端:React 19 + Tailwind CSS
模型組合:
文本:
gpt-5.2視覺:
gemini-3-pro-image-preview視頻:
veo_3_1-fast/sora-2 /Seedance
存儲(chǔ):IndexedDB(本地瀏覽器數(shù)據(jù)庫,無后端依賴)
需要連續(xù)劇情、系列化內(nèi)容的創(chuàng)作者
想把 AI 真正變成生產(chǎn)力工具的工作室
對角色一致性、鏡頭可控性要求高的團(tuán)隊(duì)
項(xiàng)目開源協(xié)議:CC BY?NC?SA 4.0
允許個(gè)人學(xué)習(xí)與非商業(yè)使用
禁止商業(yè)用途(需獲取商業(yè)授權(quán))
默認(rèn)工作流依賴對應(yīng)能力模型組合(文本/圖像/視頻),可自行替換或適配
項(xiàng)目地址:
https://github.com/shuyu-labs/BigBanana-AI-Director客戶端下載(Windows):
https://pan.quark.cn/s/dfbfe01eefdf項(xiàng)目來源參考:
https://github.com/Will-Water/CineGen-AI
BigBanana AI Director 的價(jià)值不在于“出一張圖”,而在于把短劇生產(chǎn)流程做成可控、可復(fù)用、可量產(chǎn)的工業(yè)化系統(tǒng)。
如果你關(guān)注 AI 影視生產(chǎn),或者想把短劇創(chuàng)作真正跑起來,這個(gè)項(xiàng)目值得深入研究。
感興趣的朋友可以去項(xiàng)目頁看看,順手點(diǎn)個(gè) Star。
https://github.com/shuyu-labs/BigBanana-AI-Director
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.