正當全世界玩ChatGPT4,玩得不亦樂乎的時候,短短一年三個月,OPEN AI再度拋出一個令人極為驚豔的震撼彈:Sora!!!這個以文字生成影片的人工智慧模型之名,源自日語「空(そら)」,即「天空」之意,因為無垠的天空讓人聯想到無限的創作潛能。儘管2023年底以前,以文字生成影音的大模型,已有超過20個以上的產品,為業界熟知者,包括Runway、Pika、Genmo及Stable Video Diffusion等,但這些傳統文生影片僅能產出幾秒鐘的影片,連貫欠佳,拼湊感強,在質量、分辨率、高寬比和穩定性,存在明顯不足。而Sora非但可生成60秒一鏡到底的影片,而且多角度影片一致性高,準確保留角色和影片風格。更甚者,Sora還能嘗試理解指令(Prompt)中的事物在物理世界中的存在方式。儘管尚未正式開放,目前只能看到一段逼真且鮮豔的demo影片,就已經震驚全世界,顯然技壓群雄,一枝獨秀,讓觀者無不深刻感受到影音創作已經來到一個歷史的分水嶺。
相關精彩報導,推薦以下兩則:
短短1句話就生成影片 Sora引爆影音革命!專家曝致命隱憂/賴宇萍(中時新聞網)
https://www.chinatimes.com/……/20240302000007……
「碾壓式」遙遙領先 Sora是如何練成的?/陳興華(聯合新聞網)
https://udn.com/news/story/7333/7784852