Home - 娛樂 - 侵權、搶功爭議不斷,Stability AI陷入​漩渦
文章分類

與好友分享

你可能喜歡

侵權、搶功爭議不斷,Stability AI陷入​漩渦

本文來自微信公眾號:矽星人 (ID:guixingren123),作者:光譜、杜晨,編輯:VickyXiao,頭圖來自:視覺中國

無數創業產品和業餘項目出現,谷歌、字節等巨頭公司也都紛紛入局——最近 AI 創作這條賽道有多擁擠,已經無需多言。

所有參賽選手當中,最火的一家莫過於 Stable Diffusion。該項目背後的公司之一 Stability AI,也成為了行業的當紅炸子雞。號稱“要讓10億人用上開源大模型”的它,前不久剛剛完成了1億美元融資,估值達到10億美元躋身獨角獸行列,

然而就在上周,Stable Diffusion 項目,以及這家風頭正勁的公司,突然接連卷入兩場爭議:

不僅被藝術創作者“群起而攻之”,還被合作夥伴“反水”,被質疑“搶功”……

偷風格,算偷嗎?

上周,美國媒體 CNN 采訪了多位藝術家。這些受訪者憤怒地表示:無法接受 Stable Diffusion 用他們的作品,卻砸他們的飯碗。

這些藝術家的作品,或者更準確來說,他們在作品中所體現的風格,都被 Stable Diffusion 用於訓練模型了。

受訪者之一是在藝術節有一定知名度的油畫家 Erin Hanson。她的油畫作品用色風格非常獨特,采用了更加多樣化、具有視覺沖擊力的色彩,且飽和度極高,已經在藝術圈內形成了個人特色。

前段時間 Stable Diffusion 爆紅之後,Hanson 註意到有人用這個模型生成的一些圖片結果,竟然有自己作品的味道。

經過進一步調查,她更加驚訝了:用戶甚至可以在生成圖片的時候,直接輸入“Erin Hanson 風格”作為文字提示的一部分。Stable Diffusion 生成的結果,和 Hanson 已經發表的作品幾乎一模一樣……

如果不註意畫中 Hanson 的簽名水印的話,你可能完全會以為兩張都是 Hanson 的親筆創作:

圖片來源:Erin Hanson(左)、Rachel Metz via Stable Diffusion(右)

但其實左邊有簽名水印的才是 Hanson 的正版作品 "Crystalline Maples";右邊則是 CNN 記者通過 Stable Diffusion 生成的結果,使用的文字提示包括:水晶油畫,光和影,背光的樹,強烈輪廓,彩色玻璃,現代印象派,Erin Hanson 風格等。

“如果我把它掛在我的墻上,應該毫不違和吧?”Hanson 對 Stable Diffusion 的“創作能力”表示相當驚訝。

但在仔細研究了 Stable Diffusion 工作機制之後,她才明白過來:這個 AI 模型根本沒有自己的創作能力。

因為它的風格,屬實是“抄”來的。

Stable Diffusion 是一個具備文字轉圖片/視頻能力的生成模型,可以用幾秒鐘時間就生成高分辨率、具備真實性和/或“藝術性”的視覺結果。在訓練方面,這個模型的初代版本采用了大約4000台A100顯卡集群,用了一個月的時間。

而它的訓練數據,則來自於德國AI非營利機構 LAION(全稱大規模人工智能開放網絡)。初代版本所采用的的訓練數據集,包括了近60億條圖片-文字平行數據。

很多和 Henson 一樣感到憤怒的藝術家們發現,原來是自己的作品,以及對應的文字平行數據(比如姓名),被收錄到了 LAION 相關數據集裡——才導致了自己的作品和風格,被這個爆紅的 AI 創作模型所“剽竊”。

從網上大規模搜集資料作為 AI 模型的訓練數據,早已不是什麼新鮮事。事實上,今天我們正在使用的很多基於 AI 的技術和產品,包括並不限於搜索引擎、短視頻推薦算法、翻譯、圖像識別等,背後的模型在訓練階段都重度使用了一些知名數據集。

這些數據集的內容,絕大多數是沒有版權/使用目的限制的,無論最終是商業還是非商業目的,任何人都可以使用,隻需要遵守相應的來源引用和使用規范即可。

一些比較常用的圖片數據集舉例 圖片來源:Triantafillou et al. in Meta-Dataset: A Dataset of Datasets for Learning to Learn from Few Examples

不過,隨著AI技術越來越先進,應用領域越來越多樣,新的使用場景(比如今天討論的AI文字生成圖片)就對更大規模的訓練數據集,更多來自公開網域的各種形式(文字、圖片、音頻、視頻等)的信息和資料,產生了巨大的需求。

當數據集從幾萬,幾十萬張圖片,“擴容”到幾億甚至幾十億張的規模時,這一過程當中,難免存在一些權利方面的漏洞。

而今天這些出離憤怒的藝術家們,就成為了權利漏洞,以及利用這些漏洞進行商業化獲益行為的受害者。

他們的憤怒並非沒有理由。

畢竟 AIGC(AI生成內容)這一或將導致藝術家們失業的新技術領域,已經成為現如今科技創業的大熱門,無數創業者、投資人瘋狂湧入。結果奪走他們工作的這個玩意兒,居然正是用他們的創作風格所訓練出來的。

本來藝術家們已經是一個普遍比較拮據的群體了。現在這些 AI 端了人家的碗,還要砸人家的鍋——你說他們能不生氣麼……

在藝術家和版權人士的呼籲和努力之下,現在已經有人開發出了一些工具,幫助權利人在大型數據集當中搜索自己主張權利的作品。

比如 LAION 自己做了一個網頁工具可以把文字轉換為 CLIP embedding,用於搜索描述相同或者相似的內容。

再比如還有一個取名很巧妙的網站,叫做“Have I Been Trained”,幫助創作者搜索 LAION 數據集,查看自己的作品是否被用於訓練了。

圖片來源:Have I Been Trained?

“Have I Been Trained” 的背後是一對居住在德國的藝術家和開發者,他們表示:在幫助藝術家確認自己的作品是否被大規模數據集收錄之餘,他們很快還將發佈一套新的工具,允許藝術家能夠自主選擇作品是否被數據集所收錄。為此,這兩位開發者已經和多家從事大規模 AI 模型研發的機構和公司進行了接洽。

對於“藝術家應該掌握作品是否被收錄控制權”這件事,Stability.AI 和 LAION 也表示同意。

然而即便如此,Stable Diffusion 也隻是眾多 AIGC 類模型的其中一個而已。還有更多模型/產品/項目處於未開源狀態,藝術家和權利人想要正當維護自己的權益,所面臨的挑戰和阻礙,隻會隨著時間變得更多和更艱難。

直到這一問題在全行業通過規范或制度解決之前,Stable Diffusion,以及包括 DALL·E 2、Midjourney 等在內的主流模型,仍將作為“AI侵權”指控的對象長期存在。

多方心血,一家獨占?

由於 Stability AI 這家公司在過去一直正面和側面將自己宣傳為 Stable Diffusion 項目幕後的功臣,像侵權這樣的鍋,也被該公司背上了。

然而侵權隻是 Stability AI 當前面臨的諸多煩惱之一。就在前不久該公司完成1億美元融資,正式晉升為獨角獸之際,它突然發現:

正因為攬了太多的功勞,過去一起做項目的好夥伴,對自己意見很大……

故事要先從上周四說起:一家名叫 Runway ML 的公司,在 Twitter 賬號上表示發佈了 Stable Diffusion 1.5 版本。

網友一下子懵了:

等一下,你們這是正式版嗎?為啥 Stability AI 沒有任何公開宣佈或者支持呢?

圖片來源:@ScottieFoxTTV

圖片來源:@buZztiaan

緊接著就在發佈當天,發佈網站 Hugging Face 透露,收到了來自 Stability AI 的刪除請求:

Stability AI表示這個版本屬於其“知識產權泄露”,並要求 Hugging Face 下架這一發佈……

就連 Hugging Face 自己也懵了,因為這樣的請求過去幾乎從沒有過。它在這個刪除請求下面加了一行字:為了保證過程透明公開,請這個repo的所有者(Runway)和Stability AI 提供更多資料……

圖片來源:Hugging Face

這究竟是怎麼一回事呢?

首先我們需要再回顧一下 Stable Diffusion 的來歷:

需要明確的是,Stable Diffusion 的技術本身,其實來自於慕尼黑大學機器視覺學習組,和 Runway 公司。

今年的CVPR22 大會上,這些研究者共同發表了一篇論文,研究的是潛伏擴散模型,論文的名字叫做 High-Resolution Image Synthesis with Latent Diffusion Models。正是這篇論文裡的研究,在後來成為了 Stable Diffusion 模型的理論技術基礎。

圖片來源:Rombach 等人

從論文署名可以看到,除了 Esser 是Runway 旗下研究部門的首席研究科學家之外,其他作者的隸屬單位均為慕尼黑大學——也就是說,至少在論文發表的時候所有作者當中,沒有一人屬於 Stability AI。

可要是這樣的話,Stability AI 又是怎麼跟這事兒攀上關系的呢?

Runway 公司的 CEO Cristóbal Valenzuela 透露了真相:

(1)基礎版本的技術,或者說論文,是慕尼黑大學和 Runway 一起搞的;

(2)Stable Diffusion,也就是對基礎版本進行重新訓練後得到發佈的正式版本,仍然是 Esser 和 Rombach(論文的兩位主要作者)二人主要開發的;

(3)這個模型早在去年就正式開源了;

(4)Stability AI 在整個過程中做出的貢獻僅限於:為正式版本的訓練提供算力。

圖片來源:cvalenzuila / Hugging Face

而結合行業流傳的比較靠譜的消息,以及 Stability AI 創始人兼 CEO Emad Mostaque 的表述,我們了解的情況是:

所謂的算力,就是 Mostaque 個人出錢買了四千張A100顯卡……

圖片來源:英偉達

以及,對於 Stable Diffusion 重新訓練所依賴的數據集 LAION-5B,Stability AI 也是這一其組織創建工作的出資人之一。

不管怎麼樣,總的來說,包括Runway、Stability AI、慕尼黑大學等在內的幾家參與方,大家在 Stable Diffusion 的發佈工作中的貢獻都是平等的。最一開始並不存在,也不應該存在一家獨大的情況……

但是比較遺憾的是,在後續圍繞整個 Stable Diffusion 項目的營銷、宣傳,以及運營工作當中,Stability AI 以及創始人 Mostaque,或多或少地突出甚至誇大了自己一方的貢獻和價值——對行業內外的用戶,以及媒體和公眾,都造成了不實的印象。

矽星人原文截圖 圖片來源:矽星人

事實上,Stability AI 這家公司,自己也在開源的 Stable Diffusion 基礎之上,開發了一個自己的網頁端應用 DreamStudio Lite——從這一維度,和其它也做了類似事情的公司和團隊相比,Stability AI 跟它們並無實質區別。

在 Valenzuila站出來“硬剛” Stability AI 之後,底下的留言也基本一邊倒向了 Runway 這邊……

網友紛紛表揚這位 CEO是“gigachad”(超級猛男)。

很快,Stability AI 也撤回了刪除請求。

但該公司並沒有“示弱”。公司新任首席信息官 Dan Jeffries 暗戳戳地寫了一篇文章,指責被合作夥伴“搶跑” 1.5 版本的做法非常不負責任。同時他又扔出了一套十分誇張的說法,大意是:

我們不發1.5版本,是因為我們收到了監管部門和公眾的意見,認為我們的模型不安全,會傷害到別人。所以我們接下來的主要任務是搞好安全。

Dan Jeffries 文章標題截圖來源:Dan Jeffries

這裡的“安全問題”主要指的是模型被用於制作 NSFW內容、Deepfake 等。而 Hugging Face 上討論此事網友對這篇文章表示:裝什麼大尾巴狼呢?前幾個版本都有問題怎麼你們照發不誤呢?如果真要打擊 NSFW 的話,那是不是 Photoshop 和視頻制作軟件都別發新版本了?

在 Hugging Face 的帖子被關閉之前,仍然有極少數人站在 Stability AI 這邊,大意是說 Runway 這個做法不體面,一個真正“穩定”的版本應該大家一起商量發佈,更何況 Stable Diffusion 這個命名,本身就印證著它跟 Stability AI 有巨大的關系。

然而現在來看,Stability AI 和 Stable Diffusion 這兩個名字,誰蹭誰的熱度還不好說呢。

推薦閱讀

前瞻:KD歐文對話波神庫茲馬 籃網欲擒奇才沖4連勝

體育12月12日報道:佈魯克林籃網隊(16勝12負)已拿到3連勝,他們13日將做客對陣華盛頓奇才隊(11勝16負)。杜蘭

健康

這類人,飯後確實不能馬上洗澡

吃完晚飯,接著洗個熱水澡,就可以安心拿著手機鉆進被子了。可是,很多人說吃完飯不能馬上洗澡,這是不是真的?答案是,有幾類人

健康

大藥廠“買買買”,一年“敗掉”62億美金

對於大藥廠來說,“買買買”是常規操作。有太多成功的例子告訴大藥廠們,沒有什麼增長煩惱,是收購一家Biotech解決不了的

全球

坦桑尼亞,中國老板的快樂福地?

很多人印象中的非洲大陸充滿貧窮與戰亂,現實中的非洲大陸還充滿財富與機遇。在非洲中南部的坦桑尼亞,就有數以萬計的中國人在這

健康

我們離治愈孤獨癥有多遠?

一直以來,人們希望建立神經或精神疾病的實驗模型,以便更深入地了解大腦或研發藥物。最近,神經科學家塞爾吉·帕斯卡(Serg

健康

怎樣才能健康地老去?

日本是全球范圍內老齡化問題最為嚴重的國家。“怎樣才能健康的活到100歲”,已經成為了1.2億日本國民的共同話題。通過這篇

全球

全球樓市泡沫一個一個爆了

在全球央行的加息潮下,全球樓市擊鼓傳花的遊戲進入尾聲,令人聞風喪膽的大崩盤或將重現。歐洲方面,英國房價出現了15個月來的

全球

去以色列做電商,前景如何?

一、國家概況以色列是一個相對年輕的國家,成立於第二次世界大戰之後。以色列也是一個發達國家,是中東最發達的國家之一,同時也

全球

天然氣倒貼錢白給,歐洲人還裹著電熱毯過冬?

歐洲能源危機已經有一陣子了,咱們大A的彩虹集團享受著歐洲人用不起暖氣,狂買中國電熱毯的紅利,13個交易日股價翻倍。在天然