文 | 字母榜,作者 | 涯角,編輯 | 肖陽
微軟將 Sora 免費了,但卻已經晚了。
前天,微軟 Bing 宣布在其應用程序中推出 Bing 視頻創作器(Bing Video Creator),該功能基于 OpenAI 的 Sora 模型,允許用戶通過文本提示詞生成視頻。這也是Sora 首次面向用戶免費開放。
就在昨天,Manus 推出原生文生視頻,嵌入進了自家 Agent 的工作流中。
一個是默默關注 Sora、OpenAI 背后的 " 大東家 ",另一個則是 AI Agent 里的 " 新秀 ",兩方在自家產品生態中上馬文生視頻的時間點幾乎是一樣的??梢?,微軟這一步棋到底慢了多久。
為什么說它是 Sora 的副產品?因為微軟上線的 Bing 視頻創作器從產品力和宣傳上來講,很難說得上是個完整的產品。
當微軟終于宣布將它免費向用戶開放時,這個消息并未掀起預期中的熱潮,反而透著一股尷尬的遲到感。網友對這款產品的 " 自來水 " 評價很差,甚至直言:我們已經有了可靈和 Veo,為何還用 Sora?
下面讓我們來看看,在微軟與 OpenAI 的復雜博弈中上線的 Bing 視頻創作器,到底體驗如何?
微軟的 Sora,這回表現如何?
當 OpenAI 首次官宣 Sora 時,"Sora 的誕生是牛頓時刻 " 的說法迅速刷屏網絡,甚至激發了諸多科技大廠的產品靈感與探索方向。當時的 OpenAI 用實際宣發告訴所有人:AI 得這么玩。
盡管如今文本生成視頻已經成了 " 爛大街 " 的常規功能,但在當時幾乎只有 Sora 成功出圈了。
雖然經歷了一次次延期,但 OpenAI 的深厚技術底蘊依然穩固,Sora 的視覺表現雖不能稱得上頂尖,仍舊處于業界第一梯隊。如今,這個備受關注的明星產品也終于免費上線微軟的 Bing 視頻生成器,用戶可以直接體驗。
不過,免費歸免費,微軟的 Bing 視頻生成器目前仍存在明顯局限:視頻長度僅限 5 秒,畫面比例只有 9:16 可選,且同時最多只能排隊生成三個視頻。更尷尬的是,其生成速度也頗為感人,Fast 模式尚需幾分鐘,Standard 模式甚至要耗費數小時,難免讓人懷疑微軟究竟獲得了 OpenAI 多少的資源支持。
沒錯,這個 " 產品 " 只有下面這 4 個可選項:
(1)羊駝穿西裝在冰上跳舞
提示詞:
一只羊駝穿著藍色的西裝,像人一樣雙腿直立,在中央公園的冰面上跳著動感舞曲
An alpaca wearing a blue suit and standing upright on its legs like a human being, dances a dynamic dance on the ice in Central Park
Bing 視頻生成器:
畫面主體羊駝辨識度低,背景 AI 感強烈,動作雖流暢,但整體質感回到了一年前。如果我不提誰能看得出來這是只羊駝?
緊接著,我同樣用 OpenAI 的 Sora 試了下一模一樣的提示詞。畫面的視覺效果明顯上了一個層次,無論是顏色的層次感、畫面主體的動作流暢度,甚至是冰面的陰影的顯示都很真實。
接下來就是可靈 2.1 大師版了。雖然用最新出的模型去對比 Sora 有點欺負人,但是 2.1 的普通模式無法文生圖,也就只能出出血,拿大師版試一下了。
可以看得出來,運鏡設計創意比較好,畫面連貫且風格統一,動作復雜性和自然程度也很高。
相比之下,即夢的效果就比較抽象了。風格略顯割裂,背景像是綠幕效果,動作重復且表情僵硬,整體表現不佳。我很懷疑是否是我的提示詞給錯了。
谷歌的 Veo3 效果依舊耐打,視頻整體視覺效果流暢,畫面連貫性比較好。色彩正常偏明亮,動作和表情也比較自然不僵硬。但是沒有運鏡,鏡頭語言比較單一。Veo 3 的真實感和流暢度確實都很好。
一個空的玻璃茶杯內有旋轉的彩色光芒,杯身放置在木桌上,木桌上映出茶杯明亮的倒影。鏡頭緩緩向茶杯靠近。
An empty glass teacup with a swirling colored glow inside is placed on a wooden table, which reflects the bright reflection of the teacup. The camera slowly moves closer to the teacup.
茶杯這個例子是我從 Bing 視頻生成器的官方推薦靈感庫里找到的,效果只能說勉強貼合提示詞,但色彩生硬,整體視覺感受奇怪。
我還放了幾個官方 Case,大家可以自行評判效果:
如今,圍繞 AI 下半場的討論熱火朝天,但無論爭論的焦點如何變化,"AI 下半場比拼的是產品能力 " 已經成為行業共識。然而,OpenAI 旗下的 Sora 產品因價格高昂和發布延期,幾乎已從主流 "AI 視頻工具 " 的競賽中 Out 了。
從 2024 年初開始,現象級別的 Sora 帶給所有關注者的不是驚喜,而是不斷的懵圈:不斷延期的同時,每隔一段時間就釋放一些新的令人驚艷的 " 小道消息 ",展示自身的強大能力。終于,在年末時,Sora 終于發布了,奧特曼甚至稱它為 " 視頻版的 GPT-1"。
但在這個等待的過程中,OpenAI 留給了一眾競爭對手追趕的生存空間,現在的它們早已完成了多次重大更新和迭代。像是快手的可靈、字節的即夢、通義萬相的 WanX、谷歌的 Veo 等新玩家都熬成了頂級老玩家。
媒體 VentureBeat 在一篇評論中直言:"Sora 上市時萬眾矚目,但不到一年,其光環已經大幅褪色。"Sora 的發布頻繁跳票,錯過了 AI 視頻產品的黃金發展期,其背后離不開大東家微軟與 OpenAI 之間錯綜復雜的博弈。
微軟與 OpenAI 在 AI 領域的合作關系,從一開始發展得非常要好到 " 心生嫌隙 ",幾乎貫穿了這款產品的研發周期。從 2023 年下半年開始,自 OpenAI 推出自有企業版產品之后,微軟就不再 " 完全相信 "OpenAI 了。
在那場圍繞 OpenAI CEO 奧特曼的宮斗風波中,微軟深度介入協調,但雙方管理層之間仍舊出現了很多矛盾:員工之間互相不爽,OpenAI 團隊依靠自有技術高人一等,微軟團隊也對分享前沿技術持保守態度。這個時候,微軟內部就已經有呼聲希望盡快將 Sora 整合進產品線了。
在 2024 年,微軟招攬 Mustafa Suleyman 負責自家 AI 業務,更加明確了 " 擺脫對 OpenAI 依賴 " 的意圖。Salesforce CEO Marc Benioff 更是爆料稱,奧特曼與 Mustafa Suleyman 的關系不睦。
此外,Sora 自身在安全性上的問題遲遲未能有效解決。YouTube 曾公開指責 Sora 侵犯其數據版權。雖然一番風波中,有槍打出頭鳥的嫌疑,但是自從 Sora 代號公布以來,麻煩確實不斷??偨Y成一句話:微軟想用 Sora 當王牌拯救產品線,OpenAI 則礙于一系列考慮不斷推遲。
微軟這回圍繞免費版 "Sora" 推出的一系列市場推廣動作,卻讓用戶好感度驟降。比如,微軟選擇在 Bing 平臺上線 Sora 而非旗艦 AI 平臺 Copilot,這是否是微軟游移不定的最佳證明?再有,Bing 上利用 Sora 視頻生成時還需要賺積分操作,生硬的推廣也讓大家 " 愣神一秒 "。
與此同時,市場上涌現了如 Kling、Vidu AI、即夢、PixVerse、WanX、谷歌 Veo、Luma 和 Runway 等一大批優秀的 AI 視頻生成工具。Kling 早在 2.0 版本時便宣稱在物理引擎和敘事連貫性上超過了 Sora;谷歌的 Veo 系列甚至支持了高品質 AI 配樂和音效。
反觀 Sora,承諾的單次 60 秒視頻生成至今未完全兌現,用戶實際最多只能體驗 20 秒的輸出效果。可以說,如今的 Sora 雖然免費,但在技術表現和用戶體驗方面已很難與競品保持競爭力。更何況,這一年中,中國廠商紛紛將成本壓到什么等級,所有用戶有目共睹 。
可以說,微軟這回搞的免費版 Sora,真的有點晚了。
中國廠商后來者居上,優勢能保持多久?
Sora 剛問世時,曾給國內 AI 視頻行業帶來了巨大壓力。如今,盡管微軟將 Sora 免費開放,但在文本生成視頻領域,黃金窗口期似乎已被錯過。不過,微軟畢竟是微軟,龐大的 Windows 和 Office 用戶生態,加上必應這一強大的入口渠道,能迅速放大 Sora 的影響力,觸達到數量巨大的普通消費者。
過去的一段時間中,中國的 Kling、Vidu AI、即夢、PixVerse、WanX 等一眾產品已經經過了無數次的迭代,其中像是 Kling 等產品都已經成功跑通商業化。
Sora 就像達摩克利斯之劍,一直懸在國內外眾廠商的頭頂上。沒人知道,Sora 的到來,是否會瞬間變革一切。Sora 本身的性能可以說仍在第一梯隊,其流暢性一直被人津津樂道。這回有了微軟這家 " 橫跨 PC 時代,移動互聯時代,云計算時代,并且在每一個時代都引領潮頭的超級巨廠 " 在產品端的下場,Sora 得到的助力將會遠超以往。
" 已經晚了 " 并不意味著沒有機會了。
可以預計,微軟開放 Sora 將迫使競爭對手們加速創新,推出更優服務。國內 AI 視頻廠商想必都感受到了一些沖擊。之前,他們通過快速迭代,從而在 AI 視頻效果的各個領域積累起來的優勢,儼然無法讓大家繼續安心前行。
AI 視頻生成領域可以說是一個 " 強技術、高變動 " 的賽道,這條路有多難走,國內大廠有話說。比如,百度 CEO 李彥宏就曾在 2024 年第三季度內部會上明確表示:" 百度不碰 Sora 類的視頻生成。" 他認為 To B 業務應盡量避免那種 " 吃力不討好 " 的定制項目,而應推出標準化產品。
阿里巴巴通義團隊的 AI 視頻生成模型 WanX2.1 的開源策略,也走出了一條獨特的道路,在開源的領域蠶食關注力。
Sora 會跑的多快?我們無法預測,但是中國廠商仍需提速。過去一年,谷歌 Veo2、Veo3 在性能上的領先幅度非常大,但高昂的成本令市場反應平淡;反而是價格適中、性能更均衡的 Kling 等產品大受歡迎,迅速積累了 2200 萬用戶。
" 免費 " 策略對用戶的心理沖擊是巨大的。盡管微軟的免費行動更像是被動追趕,而非主動創新,但在巨頭資源的加持下,Sora 仍可能引發新一輪行業競爭。
Sora 能否憑借免費重回巔峰?國產廠商們還能保持多久的領先優勢?或許答案并不遙遠。畢竟在 AI 時代," 誰跑得更快 " 比 " 誰先起跑 " 更為關鍵,先行者需要不斷提速,追趕者則希望彎道超車。