Sora來了,我們該如何應對

掃碼閱讀手機版

來源: 中國青年報 2024-02-27 17:14:11

  過去復雜的視頻制作過程,對Sora來說只是簡單幾句話的事。

  OpenAI發布Sora模型幾天後,360創始人周鴻禕表示,“AGI(通用人工智能)的實現將從10年縮短至兩三年”;國內視頻生成軟件Pika創始人郭文景,開始籌備對標Sora的新產品;Stability AI CEO埃馬德·莫斯塔克不由得贊嘆道,“阿爾特曼(OpenAI 首席執行官)真是一個魔術師”。

  Sora強在哪

  根據OpenAI的官方簡介,Sora可以制作長達60秒的視頻,視頻包括高清晰度的場景、復雜的鏡頭動作,並可支持多個角色的創作,是基於ChatGPT和靜止圖像生成器DALL-E所建立的視頻生成模型。

  視頻生成模型,並不是今年的新應用。早在去年4月,紐約一家名為Runway AI的初創公司推出了這項技術,人們只需在電腦屏幕上的框中輸入一句話,即可生成視頻,比如無人機航拍的山脈或者一個男人晚上走在紐約市中心的街頭。

  但Runaway AI的生成視頻僅有4秒,視頻模糊、斷斷續續、人物四肢扭曲。

  僅僅10個月後,OpenAI公司的Sora就解決了這一技術難題。該公司在Sora的官方介紹中稱:“該模型不僅了解用戶在提示中提出的要求,還了解事物在物理世界中的存在方式。”

  比如,當幾只巨大的毛茸茸的猛?象在白雪皚皚的草地上奔跑時,猛?象踏過的雪地隨之揚起巨大的雪浪,一個毛茸茸的小怪物跪在融化的紅蠟燭旁邊時,蠟燭隨之慢慢減少,變成蠟油。

  談到Sora最大的優勢,周鴻禕日前在社交網絡上分享指出,以往文字視頻軟件都是在2D平面上對圖形元素進行操作,可以把視頻看成多個真實圖片的組合,並沒有真正掌握這個世界的知識。但Sora產生的視頻裡,它能像人一樣理解坦克是有巨大衝擊力的,坦克能撞毀汽車,而不會出現汽車撞毀坦克這樣的情況。

  不過,Sora仍有缺陷。OpenAI公司公開表示,Sora是一項正在進行的工作,當涉及到現實世界中的空間細節和因果關系時,它可能具有明顯“弱點”。

  比如,在OpenAI公布的演示視頻中,一個在跑步機上反向跑步的人,手腳動作節奏並不合理。再者,當一群幼狼在碎石路上嬉戲玩耍,幼狼的數量會憑空增加和減少;當一位壽星老人在生日吹蠟燭時,蠟燭在吹氣後毫無反應。

  “Sora並不能替代抖音、快手等短視頻社交平臺”

  即使技術並未真正成熟,Sora的橫空出世仍在技術圈、影視圈,乃至全球互聯網引發了一定程度上的“AI焦慮”。

  有網友聲稱,抖音、快手等短視頻平臺要被“團滅”了;還有人說,明星和導演即將被取代;影視與廣告制作的相關從業人員似乎也感受到前所未有的職業危機。

  但與那些感到焦慮的從業人員不同,從事編劇工作七年之久、深耕抖音短視頻賽道的劉宇陽對Sora的出現感到興奮。在他看來,制作傳統影片涉及到的選址、選演員、分鏡構圖、架設機位、後期制作等復雜流程將被Sora簡化,降低了影視制作的周期與成本。

  他認為,Sora將減輕編劇的工作負擔,提高編劇的獨立性和自主性。“一直以來,編劇在影視制作過程中都處於弱勢地位。”原來編劇在完成完整劇本前,需要拿著相關策劃方案、劇情框架乃至已經初步完成的劇本和導演、資方進行項目溝通。

  劉宇陽解釋說,一個影視項目常常牽涉多方利益,開拍前的溝通工作費時且效率低。“以後用Sora,分鏡鏡頭、樣片都可以直接生成,我們可能還有獨立制作影片的機會”。

  盡管如此,他認為Sora無法真正替代演員和導演,獨立生成影片。“Sora是一個視頻輔助工具,它沒辦法體驗人的真實感受。”而在影視創業相關行業中,人在真實場景中的感受與體驗,對影視創作至關重要。

  以影視演員為例,一個合格的演員只有在充分了解所飾演角色的性格、背景、生活經歷的基礎上,纔能表演出擁有復雜情感的人物,甚至還有些演員需要去體驗生活,纔能更好地詮釋角色。

  而從編劇的角度來看,“使用Sora需要關鍵提示詞,它不能憑空制作出一個好故事片”。劉宇陽說,編劇與其他各行各業一樣存在二八定律,有能力的編劇只佔總體從業人員的百分之二十,甚至更少,而這些好編劇擅長的方向也不一樣。

  比如,有些編劇文筆好,劇本讀起來讓人舒服;而有些編劇可能框架做得好,故事概念設計得新穎;另外還有一些人是創造能力強、社會經驗豐富,可以構造出有深刻含義的好故事。

  “創意是最重要的,這也是目前生成式工具無法替代的。”在他看來,編劇的文筆、框架甚至邏輯思維能力都可以通過時間訓練,但想象力不行。“人有多少想象力,有多少社會閱歷,就會產生多少靈感,好的故事需要敏銳的觀察力和想象力支持。”

  與此同時,短視頻資深從業者、字節跳動旗下產品西瓜視頻的第一任負責人宋健從短視頻社交的角度提出相似觀點。他認為,目前生成式視頻的信息量遠不如真實拍攝大,短視頻平臺用戶更看重的是人與人之間的連接和情緒價值。因此,“Sora並不能替代抖音、快手,更不會取代此類社交平臺。”

  在宋健看來,抖音、快手等短視頻平臺的本質是“社交”,特效、動畫,甚至視頻本身只是個形式與載體。他解釋說,董宇輝長相並不優異,出身平凡,但仍有大量網友關注,這是因為他的語氣、表情、觀點的背後是積累了30多年的“經驗數據”總和,網友可以在他身上獲得情感價值和連接。

  不過新技術的出現也使一些人感到焦慮。劉宇陽也承認,“Sora面向用戶開放後,會對影視行業內一些工作產生威脅。未來受Sora影響最大的可能是玄幻類影片,因此特效制作團隊可能受到比較大的打擊。”

  同一時間,太平洋彼岸的美國好萊塢,也因Sora的發布引發強烈震動。美國《紐約時報》2月21日報道,部分技術人員稱,多數情況下,制作一部電影昂貴又耗時,經常需要數十或數百人,但Sora的出現,將降低影片生產成本,未來制作一部與“漫威大片”具有相同復雜視覺效果的電影,可能只需要一個特效制作人員。

  宋健說,相比於人力成本,圖片和視頻生成能夠節約大量時間和經濟成本,比如幫助公司的廣告客戶低成本、便捷地制作視頻。

  或許,低成本的設計、剪輯工作會被技術取代。

  “人們更需要知道技術是乾什麼的、如何適用於市場”

  技術在一路狂奔,人們要如何跟上技術發展的速度?技術又如何更好地服務人類?

  OpenAI公司很謹慎。截至目前,Sora並未對用戶開放使用,而是首先提供給被稱為“紅隊成員”(red teamers)的網絡安全教授,用以評估產品的危害或風險。

  不難看出,倫理問題仍是業界討論與商榷的重點。

  牛津互聯網研究所客座政策研究員穆塔勒·恩孔德(Mutale Nkonde)接受媒體采訪時表示,人們在未來將輕松掌握文本轉換視頻的技術,這令她感到振奮。但她也擔心,這些技術工具將會嵌入社會偏見,不經意間對人們的日常生活產生影響。

  她說,Sora這類工具的出現將對社會角色提出新的問題。比如,影視行業是否還需要人類臨時演員?“從政策的角度來看,我們是否需要開始思考如何保護人類?”

  北京師范大學新聞傳播學院學術委員會主任、教授,北京師范大學傳播創新與未來媒體實驗平臺主任喻國明早先接受中青報·中青網記者采訪時,從相似角度提出了思考。他認為,機器越來越像人一樣思考並不可怕,可怕的是人會像機器那樣去思考。算法技術的發展打破了人們之間智力的圍牆,但也會形成對人的個體價值的蔑視、貶低與馴化。“人們如何去形成自己個性的生存之地是首要問題。‍”

  喻國明說,在技術不斷革新的情況下,人們更需要知道技術是乾什麼的、如何適用於市場、怎麼進行技術的產品化。

  “隨著人工智能等新興技術逐漸滲透到社會生活的方方面面,我相信它們對於目前勞動崗位的替代並不是人類的危機,而是人類的福祉。”喻國明認為,工業革命發生以後,勞動強度的減低是歷史性的趨勢,未來人類勞動會得到某種程度上的強度遞減。

  他說,或許人們可以從現在的8小時工作制,轉變為未來4小時工作制甚至可能更短。“人類將從過去的物質生產壓力中釋放出來,擁有更多精神性的、文化性的和個性化的追求。”

  但宋健認為,當技術剛剛出現的時候,人們或許對這種新技術寄予厚望,甚至將它稱為實現社會平等、減輕人群分化的工具,然而技術也天然帶有不平等的力量。

  比如,美國一家非營利組織Common Sense Media曾發布研究報告指出,來自低收入家庭的青少年每天在電子屏幕上平均會花8小時7分鍾,而高收入家庭的青少年每天只會花4小時42分鍾。從這樣的對比來看,電子產品是這個時代最低廉的娛樂消遣方式,它可以用來替代其他如教育、陪伴等更“昂貴”的東西。

  此外,宋健擔懮地說,這些年,從DALL-E、Midjourney等靜止圖像生成器的發展中不難看出,短短一兩年時間人工智能就可以使機器生產的圖像與真實照片幾乎毫無差別。未來隨著生成式工具的發展,Sora是否會成為一種快速且低成本的深度偽造工具,加劇網絡信息的判斷難度和不平等,這個仍未可知。

  監管要如何發力

  當披著高科技外衣的生成式視頻讓互聯網中存在的問題更難被“看見”,監管變得尤為重要。

  在中國互聯網協會法工委副秘書長胡鋼看來,“文字生成視頻”大模型Sora標志著人工智能生成內容(AIGC)的跨越式發展,但它也存在一定濫用風險。

  胡鋼說,這項技術可能造成顯性風險與實質危害,損害個人和組織的人格和財產權益,甚至嚴重危害社會秩序和國家安全,必須全過程有效治理。

  “我國已經建構了人工智能多元化監管機制,實現了多維協同治理體系。”胡鋼說,未來我國需要及時響應即將生效的歐盟《人工智能法案》和美國系列人工智能立法的挑戰,強化國際立法競合與協調,促成全球防范和制止人工智能風險共識,推動普適性的高風險人工智能系統的監管措施。“特別是協同風險評估、安全測試、相互認證、透明度和可解釋性要求,以實現數據保護、隱私捍衛和國家安全的共同目標。”

  與此同時,版權問題仍在被討論。去年12月,《紐約時報》起訴OpenAI及其合作伙伴微軟,聲稱其侵犯了與人工智能系統相關的新聞內容的版權,此事還未有定論。

  值得注意的是,此次OpenAI公司並沒有透露用於培訓Sora有多少視頻,也沒有透露培訓視頻可能來自哪裡,只在采訪中向《紐約時報》透露,該語料庫包含的視頻既是公開的,也被版權所有者許可。

  Sora基本完成了對物理世界的模擬,在人工智能領域取得大踏步前進,使人們對中美之間的差距產生擔懮,但多位業內人士向記者表示,中國從很久以前就把人工智能列為發展重點,將不斷縮短中美之間的技術距離,未來在應用AI技術領域,完全有機會走在世界前列。

 

下載津雲客戶端關注更多精彩

推薦新聞

我來說兩句

關於北方網 | 廣告服務 | 誠聘英纔 | 聯系我們 | 網站律師 | 設為首頁 | 關於小狼 | 違法和不良信息舉報電話:022-23602087 | 舉報郵箱:jubao@staff.enorth.cn | 舉報平臺

Copyright (C) 2000-2024 Enorth.com.cn, Tianjin ENORTH NETNEWS Co.,LTD.All rights reserved
本網站由天津北方網版權所有
增值電信業務經營許可證編號:津B2-20000001  信息網絡傳播視聽節目許可證號:0205099  互聯網新聞信息服務許可證編號:12120170001津公網安備 12010002000001號