大家好,我是袋鼠帝。
我最近做了一個(gè)挺有意思的實(shí)驗(yàn)。
我給AI發(fā)了一張圖片,然后問了它一個(gè)問題:如果從別的角度看,這個(gè)東西會(huì)長什么樣?
比如,從左邊看,從右邊看,從背面看,或者從下面往上看。
這些常規(guī)角度,其實(shí)現(xiàn)在很多AI都已經(jīng)能做到了。
我又想到一個(gè)更極端的問題:如果不是這幾個(gè)固定的方位,而是從360度任意角度去看呢?
換句話說,如果我們像繞著一輛車走一圈那樣去觀察一個(gè)物體,AI能不能準(zhǔn)確推理出在每一個(gè)極其細(xì)微的機(jī)位下,它應(yīng)該呈現(xiàn)出什么畫面?而且,如果我們要讓AI生成這些特定角度的畫面,那個(gè)提示詞該怎么寫?
類似這樣的情況:
![]()
這件事情并不簡單,需要不斷調(diào)整提示詞,并反復(fù)抽卡。畢竟,AI接收到的輸入只是一張扁平的二維圖片,它沒有厚度,沒有背面的信息。
但沒想到,現(xiàn)在已經(jīng)有工具把這件事做成了,而且操作方式簡單到離譜。
先給大家看個(gè)效果,下面這段黑神話悟空的角色展示視頻,就是我用兩張靜態(tài)圖片,只花了大概5分鐘搞出來的。
不同角度的運(yùn)鏡,悟空頭上的毛發(fā)、衣服的粗糙質(zhì)感、盔甲的反光,甚至在做大動(dòng)作時(shí)的肌肉張力,都很不錯(cuò)。
但生成視頻我用的提示詞只有非常簡單的一句話:根據(jù)我的分鏡圖片,生成視頻(BGM是導(dǎo)入剪映配的)。
這個(gè)效果之所以能這么簡單實(shí)現(xiàn),一個(gè)重要原因是AI現(xiàn)在可以從360度觀察一個(gè)物體了。
就像是一個(gè)攝影師,可以按照你的要求,調(diào)整機(jī)位、改變焦距,從不同方向去拍照。
我給大家拆解一下這個(gè)視頻的制作過程你就明白了
以前我們要展示一個(gè)IP角色或者模型,一般得靠建模師或者動(dòng)畫師一幀一幀地K關(guān)鍵幀。現(xiàn)在AI生視頻火了,大家開始用AI跑視頻。
但是,這里面有個(gè)坑:
你想用AI跑出那種帶絲滑運(yùn)鏡,比如鏡頭從全景推到臉部特寫,還要帶點(diǎn)廣角拉伸的視覺效果,你需要的提示詞寫出來絕對(duì)堪比一篇小作文。需要精準(zhǔn)地描述推、拉、搖、移的軌跡。
對(duì)于我這種不懂專業(yè)攝影、運(yùn)鏡術(shù)語的視頻小白來說,簡直是折磨。
腦子里有畫面,但手敲不出對(duì)應(yīng)的詞。如果你想改一下鏡頭軌跡,還得跟AI反復(fù)拉扯半天。
現(xiàn)在,我找到了一條邪修捷徑。不需要那些復(fù)雜的運(yùn)鏡提示詞
首先打開AI設(shè)計(jì)工具:Lovart
https://www.lovart.ai/
![]()
需要用到它的一個(gè)硬核功能:Multi-Angle(多角度)。
簡單來說,就是把一張圖,變成一個(gè)可以被多機(jī)位反復(fù)拍攝的立體場景。
接下來只要用 Lovart 的 多角度 功能配合 一鍵廣角 或 一鍵特寫 ,先批量生成一各種角度、鏡頭的分鏡圖片,然后再把這些圖片打包丟給視頻生成模型,直接首尾相連就成了。
第一步,我先找了一張純黑背景的黑神話悟空標(biāo)準(zhǔn)站立照。
![]()
第二步,讓它做各種大透視動(dòng)作(科普一下大透視動(dòng)作),這一步是為了讓視頻畫面更有視覺沖擊力。
為了方便達(dá)到這樣種效果,我整理了一套大透視動(dòng)作模版,可以直接用。
![]()
我直接在 Lovart 里調(diào)用了 NanoBanana Pro模型,輸入提示詞:
讓附件1中的人物做附件2中的8個(gè)動(dòng)作。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
Lovart 一次性就甩給了我 8 張不同動(dòng)作的高清大圖,每張圖的細(xì)節(jié)都拉滿了,連手掌心的紋路都沒糊。
第三步,也是最核心的一步:制作運(yùn)鏡分鏡頭。
我選中其中一張動(dòng)作圖,直接右鍵點(diǎn)擊 多角度 功能。
畫面上會(huì)彈出一個(gè)控制面板,它分兩種模式,一種是主體模式,你可以直接用鼠標(biāo)拖拽畫面里的猴子,就像手里拿著一個(gè)手辦在轉(zhuǎn)動(dòng)一樣;另一種是攝像頭模式,你可以像攝影師一樣,調(diào)整虛擬攝像機(jī)的角度。
![]()
你可以選擇推近給個(gè)臉部特寫,也可以拉遠(yuǎn)開個(gè)廣角。
只要找到你滿意的角度,點(diǎn)一下生成,一張完美的新視角分鏡圖就出來了。
完全不需要去想提示詞怎么寫,而且在調(diào)整角度的時(shí)候非常直觀,不用腦補(bǔ)
![]()
我用這種方法,迅速捏出了幾個(gè)不同角度的站立效果圖,以及幾個(gè)大動(dòng)作的不同視角圖。
每一張圖里,猴子的衣服紋路和毛發(fā)走向都保持著驚人的一致性,完全沒有因?yàn)榻嵌雀淖兌缐摹?/p>
![]()
最后,我把這組像連環(huán)畫一樣的分鏡圖扔給 Veo3.1(因?yàn)樗鼘?duì)毛發(fā)和臉部的把控比較準(zhǔn))
![]()
一段還不錯(cuò)的運(yùn)鏡就這么誕生了。全程沒有寫一行復(fù)雜的運(yùn)鏡提示詞~
電商攝影:一張破圖變?nèi)罢故?/p>
既然它能這么輕松地生成多視角圖,那它肯定也能用在淘寶的商品圖上,豈不是連請(qǐng)攝影師拍白底圖的錢都省了?
我隨便找了一張普通的鞋子照片,準(zhǔn)備把它爆改成高級(jí)感拉滿的淘寶多角度產(chǎn)品展示圖。
![]()
為了讓質(zhì)感提上來,我先在 Lovart 里用了一段提示詞
大意是讓 AI 分析鞋子的幾何形狀、材質(zhì)、品牌標(biāo)志,然后應(yīng)用極具商業(yè)感的光影邏輯
CORE OBJECTIVE: Generate a professional studio editorial presentation based strictly on the [ATTACHED_INPUT_IMAGE]. The AI must perform a deep visual analysis of the subject's geometry, material, and brand identity to apply consistent logic across all 7 panels.
Step 1: DYNAMIC VISION ANALYSIS (INTERNAL)
Identify Subject: Detect the primary object in the [ATTACHED_INPUT_IMAGE].
Brand Detection: Identify the logo or brand associated with the subject. If no logo is visible, use the subject's name as a high-end typographic emblem.
Material Logic Synthesis:
If Industrial/Tech: Precision reflections, sharp rim lights, geometric perfection.
If Liquid/Glass: Caustics, refraction, transparency, high-gloss.
If Organic/Living: Subsurface scattering, natural textures, soft diffused light.
If Textile/Fashion: Micro-fiber detail, fold dynamics, matte/satin sheen.
COMPOSITION STRUCTURE
A single, high-resolution seamless image.
Style: Ultra-high-end Studio Photography / Editorial / Commercial.
Consistency: The subject's color, wear-and-tear, and design details must remain 100% identical across all 7 views.
Technical: 8k resolution, ray-traced
把它修成了一張高級(jí)的攝影棚拍圖。
![]()
接著,重頭戲來了。我選中修好的圖,打開 多角度 功能。
就像你在櫥窗里看這雙鞋一樣,我只需要輕輕拖動(dòng)鼠標(biāo)參數(shù)滑塊,鞋子的側(cè)面、背面、俯視圖、45度角展示圖,就一張張蹦出來了。
![]()
生成的過程極其簡單粗暴。而且出來的圖片細(xì)節(jié)非常經(jīng)得起推敲,放大看,鞋面麂皮材質(zhì)都一清二楚。這要是直接拿去上架,誰能看出來這是一張圖變出來的?
![]()
自拍角度調(diào)整
還可以拍一張自拍之后,調(diào)整各種不同角度的機(jī)位(而且非常方便,指哪打哪),一張照片瞬間變9宮格~
![]()
復(fù)雜光影人物寫真
接下來再上上強(qiáng)度,如果換成帶復(fù)雜光影的人物寫真呢?
這其實(shí)很有挑戰(zhàn),因?yàn)榻嵌纫蛔儯獯蛟谀樕系年幱拔恢靡脖仨毟儯蝗痪蜁?huì)顯得很假。
我找了一張攝影棚里拍的女生寫真,臉上的明暗對(duì)比非常明顯。
![]()
我用 多角度 功能生成了她微微側(cè)臉和俯視的角度。
結(jié)果讓我非常意外,AI 不僅正確重構(gòu)了她的五官透視,甚至連那束打在鼻梁和顴骨上的光,也隨著臉部的轉(zhuǎn)動(dòng),非常自然地發(fā)生了偏移。
這說明 AI 不是在簡單地貼圖,它是真的理解了這個(gè)場景里的光源位置。
![]()
矢量化
另外,Lovart 還有一個(gè)很nice的功能:Vectorize(矢量化)。
簡單說,就是把普通的 PNG 或者 JPG 等圖片,一鍵轉(zhuǎn)換成 SVG 矢量圖。
一些朋友可能不知道矢量圖有什么用。
你平時(shí)看到的那些圖,放大幾倍就會(huì)出現(xiàn)馬賽克一樣的像素點(diǎn)。
而矢量圖,無論你放大多少倍,邊緣永遠(yuǎn)是極其平滑銳利的。
比如你看,這個(gè)龍蝦的logo(你們猜猜看,哪一張是SVG圖,哪一張是原圖?)
![]()
可以看到,原圖的龍蝦logo放大之后,明顯不清晰了。
但是生成的SVG圖,放大到同樣的倍數(shù),還是非常清晰,且邊緣平滑銳利。
![]()
這對(duì)于做 Logo、做前端圖標(biāo)、做需要印刷的海報(bào)來說,是剛需。
如果你最近也在做電商設(shè)計(jì)、搞品牌視覺、畫插畫角色,或者是需要大量配圖的社媒運(yùn)營,可以去試試 Lovart
用下來,我覺得它最有意思的一點(diǎn)是:
一張圖,不再只是"一張圖"。
而是一整套設(shè)計(jì)素材的起點(diǎn)。
同時(shí),這個(gè)過程中,我們也再也不用像以前一樣,為了素材,反復(fù)抽卡了~
我是袋鼠帝,一個(gè)致力于幫你把AI變成生產(chǎn)力的博主。我們下期見~
能看到這里的都是鳳毛麟角的存在!
如果覺得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧~
如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?
謝謝你耐心看完我的文章~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.