網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

當(dāng)AI能從360°無死角看世界。。

2026-03-13 11:21:57　來源: 袋鼠帝

云南舉報(bào)

分享至

大家好，我是袋鼠帝。

我最近做了一個(gè)挺有意思的實(shí)驗(yàn)。

我給AI發(fā)了一張圖片，然后問了它一個(gè)問題：如果從別的角度看，這個(gè)東西會(huì)長什么樣？

比如，從左邊看，從右邊看，從背面看，或者從下面往上看。

這些常規(guī)角度，其實(shí)現(xiàn)在很多AI都已經(jīng)能做到了。

我又想到一個(gè)更極端的問題：如果不是這幾個(gè)固定的方位，而是從360度任意角度去看呢？

換句話說，如果我們像繞著一輛車走一圈那樣去觀察一個(gè)物體，AI能不能準(zhǔn)確推理出在每一個(gè)極其細(xì)微的機(jī)位下，它應(yīng)該呈現(xiàn)出什么畫面？而且，如果我們要讓AI生成這些特定角度的畫面，那個(gè)提示詞該怎么寫？

類似這樣的情況：

這件事情并不簡單，需要不斷調(diào)整提示詞，并反復(fù)抽卡。畢竟，AI接收到的輸入只是一張扁平的二維圖片，它沒有厚度，沒有背面的信息。

但沒想到，現(xiàn)在已經(jīng)有工具把這件事做成了，而且操作方式簡單到離譜。

先給大家看個(gè)效果，下面這段黑神話悟空的角色展示視頻，就是我用兩張靜態(tài)圖片，只花了大概5分鐘搞出來的。

不同角度的運(yùn)鏡，悟空頭上的毛發(fā)、衣服的粗糙質(zhì)感、盔甲的反光，甚至在做大動(dòng)作時(shí)的肌肉張力，都很不錯(cuò)。

但生成視頻我用的提示詞只有非常簡單的一句話：根據(jù)我的分鏡圖片，生成視頻（BGM是導(dǎo)入剪映配的）。

這個(gè)效果之所以能這么簡單實(shí)現(xiàn)，一個(gè)重要原因是AI現(xiàn)在可以從360度觀察一個(gè)物體了。

就像是一個(gè)攝影師，可以按照你的要求，調(diào)整機(jī)位、改變焦距，從不同方向去拍照。

我給大家拆解一下這個(gè)視頻的制作過程你就明白了

以前我們要展示一個(gè)IP角色或者模型，一般得靠建模師或者動(dòng)畫師一幀一幀地K關(guān)鍵幀。現(xiàn)在AI生視頻火了，大家開始用AI跑視頻。

但是，這里面有個(gè)坑：

你想用AI跑出那種帶絲滑運(yùn)鏡，比如鏡頭從全景推到臉部特寫，還要帶點(diǎn)廣角拉伸的視覺效果，你需要的提示詞寫出來絕對(duì)堪比一篇小作文。需要精準(zhǔn)地描述推、拉、搖、移的軌跡。

對(duì)于我這種不懂專業(yè)攝影、運(yùn)鏡術(shù)語的視頻小白來說，簡直是折磨。

腦子里有畫面，但手敲不出對(duì)應(yīng)的詞。如果你想改一下鏡頭軌跡，還得跟AI反復(fù)拉扯半天。

現(xiàn)在，我找到了一條邪修捷徑。不需要那些復(fù)雜的運(yùn)鏡提示詞

首先打開AI設(shè)計(jì)工具：Lovart

https://www.lovart.ai/

需要用到它的一個(gè)硬核功能：Multi-Angle（多角度）。

簡單來說，就是把一張圖，變成一個(gè)可以被多機(jī)位反復(fù)拍攝的立體場景。

接下來只要用 Lovart 的多角度功能配合一鍵廣角或一鍵特寫，先批量生成一各種角度、鏡頭的分鏡圖片，然后再把這些圖片打包丟給視頻生成模型，直接首尾相連就成了。

第一步，我先找了一張純黑背景的黑神話悟空標(biāo)準(zhǔn)站立照。

第二步，讓它做各種大透視動(dòng)作（科普一下大透視動(dòng)作），這一步是為了讓視頻畫面更有視覺沖擊力。

為了方便達(dá)到這樣種效果，我整理了一套大透視動(dòng)作模版，可以直接用。

我直接在 Lovart 里調(diào)用了 NanoBanana Pro模型，輸入提示詞：

讓附件1中的人物做附件2中的8個(gè)動(dòng)作。

Lovart 一次性就甩給了我 8 張不同動(dòng)作的高清大圖，每張圖的細(xì)節(jié)都拉滿了，連手掌心的紋路都沒糊。

第三步，也是最核心的一步：制作運(yùn)鏡分鏡頭。

我選中其中一張動(dòng)作圖，直接右鍵點(diǎn)擊多角度功能。

畫面上會(huì)彈出一個(gè)控制面板，它分兩種模式，一種是主體模式，你可以直接用鼠標(biāo)拖拽畫面里的猴子，就像手里拿著一個(gè)手辦在轉(zhuǎn)動(dòng)一樣；另一種是攝像頭模式，你可以像攝影師一樣，調(diào)整虛擬攝像機(jī)的角度。

你可以選擇推近給個(gè)臉部特寫，也可以拉遠(yuǎn)開個(gè)廣角。

只要找到你滿意的角度，點(diǎn)一下生成，一張完美的新視角分鏡圖就出來了。

完全不需要去想提示詞怎么寫，而且在調(diào)整角度的時(shí)候非常直觀，不用腦補(bǔ)

我用這種方法，迅速捏出了幾個(gè)不同角度的站立效果圖，以及幾個(gè)大動(dòng)作的不同視角圖。

每一張圖里，猴子的衣服紋路和毛發(fā)走向都保持著驚人的一致性，完全沒有因?yàn)榻嵌雀淖兌缐摹?/p>

最后，我把這組像連環(huán)畫一樣的分鏡圖扔給 Veo3.1（因?yàn)樗鼘?duì)毛發(fā)和臉部的把控比較準(zhǔn)）

一段還不錯(cuò)的運(yùn)鏡就這么誕生了。全程沒有寫一行復(fù)雜的運(yùn)鏡提示詞～

電商攝影：一張破圖變?nèi)罢故?/p>

既然它能這么輕松地生成多視角圖，那它肯定也能用在淘寶的商品圖上，豈不是連請(qǐng)攝影師拍白底圖的錢都省了？

我隨便找了一張普通的鞋子照片，準(zhǔn)備把它爆改成高級(jí)感拉滿的淘寶多角度產(chǎn)品展示圖。

為了讓質(zhì)感提上來，我先在 Lovart 里用了一段提示詞

大意是讓 AI 分析鞋子的幾何形狀、材質(zhì)、品牌標(biāo)志，然后應(yīng)用極具商業(yè)感的光影邏輯

CORE OBJECTIVE: Generate a professional studio editorial presentation based strictly on the [ATTACHED_INPUT_IMAGE]. The AI must perform a deep visual analysis of the subject's geometry, material, and brand identity to apply consistent logic across all 7 panels.

Step 1: DYNAMIC VISION ANALYSIS (INTERNAL)

Identify Subject: Detect the primary object in the [ATTACHED_INPUT_IMAGE].

Brand Detection: Identify the logo or brand associated with the subject. If no logo is visible, use the subject's name as a high-end typographic emblem.

Material Logic Synthesis:

If Industrial/Tech: Precision reflections, sharp rim lights, geometric perfection.

If Liquid/Glass: Caustics, refraction, transparency, high-gloss.

If Organic/Living: Subsurface scattering, natural textures, soft diffused light.

If Textile/Fashion: Micro-fiber detail, fold dynamics, matte/satin sheen.

COMPOSITION STRUCTURE

A single, high-resolution seamless image.

Style: Ultra-high-end Studio Photography / Editorial / Commercial.

Consistency: The subject's color, wear-and-tear, and design details must remain 100% identical across all 7 views.

Technical: 8k resolution, ray-traced

把它修成了一張高級(jí)的攝影棚拍圖。

接著，重頭戲來了。我選中修好的圖，打開多角度功能。

就像你在櫥窗里看這雙鞋一樣，我只需要輕輕拖動(dòng)鼠標(biāo)參數(shù)滑塊，鞋子的側(cè)面、背面、俯視圖、45度角展示圖，就一張張蹦出來了。

生成的過程極其簡單粗暴。而且出來的圖片細(xì)節(jié)非常經(jīng)得起推敲，放大看，鞋面麂皮材質(zhì)都一清二楚。這要是直接拿去上架，誰能看出來這是一張圖變出來的？

自拍角度調(diào)整

還可以拍一張自拍之后，調(diào)整各種不同角度的機(jī)位（而且非常方便，指哪打哪），一張照片瞬間變9宮格～

復(fù)雜光影人物寫真

接下來再上上強(qiáng)度，如果換成帶復(fù)雜光影的人物寫真呢？

這其實(shí)很有挑戰(zhàn)，因?yàn)榻嵌纫蛔儯獯蛟谀樕系年幱拔恢靡脖仨毟儯蝗痪蜁?huì)顯得很假。

我找了一張攝影棚里拍的女生寫真，臉上的明暗對(duì)比非常明顯。

我用多角度功能生成了她微微側(cè)臉和俯視的角度。

結(jié)果讓我非常意外，AI 不僅正確重構(gòu)了她的五官透視，甚至連那束打在鼻梁和顴骨上的光，也隨著臉部的轉(zhuǎn)動(dòng)，非常自然地發(fā)生了偏移。

這說明 AI 不是在簡單地貼圖，它是真的理解了這個(gè)場景里的光源位置。

矢量化

另外，Lovart 還有一個(gè)很nice的功能：Vectorize（矢量化）。

簡單說，就是把普通的 PNG 或者 JPG 等圖片，一鍵轉(zhuǎn)換成 SVG 矢量圖。

一些朋友可能不知道矢量圖有什么用。

你平時(shí)看到的那些圖，放大幾倍就會(huì)出現(xiàn)馬賽克一樣的像素點(diǎn)。

而矢量圖，無論你放大多少倍，邊緣永遠(yuǎn)是極其平滑銳利的。

比如你看，這個(gè)龍蝦的logo（你們猜猜看，哪一張是SVG圖，哪一張是原圖？）

可以看到，原圖的龍蝦logo放大之后，明顯不清晰了。

但是生成的SVG圖，放大到同樣的倍數(shù)，還是非常清晰，且邊緣平滑銳利。

這對(duì)于做 Logo、做前端圖標(biāo)、做需要印刷的海報(bào)來說，是剛需。

如果你最近也在做電商設(shè)計(jì)、搞品牌視覺、畫插畫角色，或者是需要大量配圖的社媒運(yùn)營，可以去試試 Lovart

用下來，我覺得它最有意思的一點(diǎn)是：

一張圖，不再只是"一張圖"。

而是一整套設(shè)計(jì)素材的起點(diǎn)。

同時(shí)，這個(gè)過程中，我們也再也不用像以前一樣，為了素材，反復(fù)抽卡了～

我是袋鼠帝，一個(gè)致力于幫你把AI變成生產(chǎn)力的博主。我們下期見～

能看到這里的都是鳳毛麟角的存在！

如果覺得不錯(cuò)，隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧~

如果想第一時(shí)間收到推送，也可以給我個(gè)星標(biāo)?

謝謝你耐心看完我的文章~

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.