AI藝術的發展:讓藝術通過人工智慧變得更具創造力和人性化

AI藝術的發展:讓藝術通過人工智慧變得更具創造力和人性化

,它甚至正在侵蝕我們的創造性追求。這是否代表著我們不僅要擔心AI失去工作

出品 | CDA數據分析研究院,轉載需授權

人工智慧和深度學習對大量領域產生了巨大影響,並在過去幾年中引發了很多破壞和進展,這一事實對於許多人來說並不會讓人感到意外。

然而,有些人可能會感到驚訝的是,即使是藝術和創意領域,一直被視為明顯是人類的領域,也不會受到這些最新進展的影響。

人工智慧取代工作的恐懼是圍繞這些技術最常見的問題之一。現在,它甚至正在侵蝕我們的創造性追求。這是否代表著我們不僅要擔心AI失去工作,還要擔心我們的人性?

雖然許多人擔心AI會取代或替代人類,或者認為人工智慧永遠不會具有創造性,並且人工智慧產生的任何東西在定義上都不是藝術,我想提出另一種觀點。我相信先進的人工智慧將使我們能夠專注於我們獨特的才能和優勢,為我們提供創造性探索和表達的新工具,讓我們享受更高品質的休閒時光。

最終它將使我們變得更加人性化。

在本文中,我首先想要向您介紹深度學習與藝術交叉的非常簡短(並且非常不完整)的介紹,並向您介紹一小部分採用神經網絡作為首選媒介的藝術家。

然後,我想向您介紹我目前公司Qosmo過去幾年一直致力於的一些項目,以及我自己的一些個人項目。

最後,我想與大家分享一個未來的願景,不僅是人工智慧和創造力,還有更廣泛的工作和人性。

我希望在本文結束時,我會說服你們,我們既不應該害怕人工智慧正在削弱或貶低我們的人性,也不應將其視為只影響日常工作但不會對我們的創造能力產生任何影響的東西。相反,我希望最終你會對AI的未來感到興奮,並且願意接受它而不是作為競爭者,而是作為重獲和鞏固我們人性的有力工具。

旁註:本文基於我在日本SciPy 2019和日經AI 201峰會的擴展版本中進行的一系列會談。如果您更喜歡觀看影片,可以在YouTube上找到SciPy演講。但是這篇文章既是最新的,也是更深入的,特別是關於知識工作和創造力未來的最後一節,我在SciPy談話期間沒有時間去討論。

AI藝術的一個非常簡短的歷史

人工智慧和創造力之間的聯繫第一次從相當深奧的圈子滲透到主流意識中,這可能是谷歌在2015年宣布推出DeepDream的時候。

。人工智慧取代工作的恐懼是圍繞這些技術最常見的問題之一。現在

想像一下盯著雲,過了一會兒,你會感覺到你可以在那裡看到一種模式,也許是一張臉。你盯著雲看的時間越長,你對臉部的想法越多,你就越能說服自己,雲中真的有一張臉盯著你看。

DeepDream本質上就是這種現象的神經網絡。

通過反覆增強神經網絡在圖像中拾取的圖案,最初非常微妙的圖案(或其想像的暗示)逐漸變成這些圖案的完整表現。通過這種方式,眼睛開始長出狗,蝸牛似乎從建築物中萌芽,風景變成奇異的城市景觀與童話塔。

從高中開始,一直到我的博士學位我偶爾會為樂隊製作音樂影片。我的第一個使用深度學習的項目是在2016年我的博士學位結束時,當時我使用DeepDream網絡在我為「The Void」字母和樹所做的影片中實現了一種有點新穎的視覺效果。

雖然今天沒有人會對此感到興奮,但你必須記住,2016年是史前的深度學習術語。那時候它是一個非常酷的效果(至少這是我的想法),這對我來說是一個很好的方式讓我熟悉TensorFlow(當時還處於初期階段)以及一般的深度學習。

最近,我們已經超越僅僅操縱現有圖像。特別是,我們已經看到神經網絡生成圖像的驚人突破。很大程度上,這歸功於一類稱為GAN生成性對抗網絡的網絡

GAN基本上是通過使兩個網絡彼此相互作用,生成虛假數據的生成器和必須判斷數據是真實的鑑別器或評論者還是由生成器網絡創建的偽造,已經達到了令人震驚的準確性和可信度。在他們可以產生的那種圖像中。

特別受歡迎(和奇怪的)是(半)真實面孔相互變形的幻覺圖像,導致令人著迷的影片。

由於最近實現了這種GAN偽造品的真實性,所以像thepersondoesnotexist.com這樣的網站的整個家庭手工業如雨後春筍般湧現。每次刷新該特定站點時,都會生成由神經網絡設想的新的照片級真實肖像。雖然玩起來很有趣,但它也是圍繞Deep Fakes日益增長的問題和近乎完美的AI偽造時代的真實數據可信度的焦點。

這是我將在下面再次回到的一點。雖然人工智慧藝術本身既有趣又有趣,但它也 - 就像其他形式的藝術一樣 - 使我們能夠突出問題並表達我們的關注。通過將這些問題或失敗點作為我們工作的基礎並將其置於極端,我們作為藝術家可以傳播意識和教育。

最好的藝術品不僅美觀,而且還邀請人們思考。

2018年10月,當法國集體「Obvious」能夠以432,500美元的價格在著名的拍賣行Christie's拍賣他們的GAN生成的藝術品「Edmond de Belamy」時,AI藝術首次成為主流。

藝術和創意領域,一直被視為明顯是人類的領域,也不會受到這些最新進展的影響

這引起了藝術和人工智慧社區的騷動,並提出了人工智慧能否真正產生藝術的問題。

然而,這遠遠不是它提出的唯一問題,拍賣結果的大部分注意力都集中在Obvious接近並實施該項目的路上。他們因為拿走別人的代碼,在一個結果有問題的簡單數據集上進行訓練,並在畫布上銷售生成的輸出而面臨嚴厲的批評。

我不想深入討論Obvious是否應該獲得金錢和關注(如果你感興趣,網上有很多討論,例如偉大出版物Artnome中的這篇文章)。然而,我想說,在我看來,無論我們是否將最終作品視為藝術,Obvious都不是我看到真正藝術家的藝術家。

非常有說服力的是,他們甚至沒有用自己的名字簽名,而是使用了GAN算法的關鍵方程之一。就好像他們想說「我們沒有這樣做,人工智慧成功了」。

這與真正的AI藝術家正在做的完全相反。

像畫家一樣研究他的畫筆和畫布,並改進他的筆畫,就像鋼琴家研究她的樂器的複雜性和練習她的技巧一樣,真正的AI藝術家深入研究他正在使用的網絡以及他需要操縱它們的方式為了實現他所想到的創造性成果。

從這個意義上說,AI和神經網絡不是創造者!它們是鋼筆,刷子,相機,小提琴,鑿子等。它們是工具。

由於它們的高度複雜性和新穎性,它們看起來像魔術一樣,像自主創作者一樣,但最終它們僅僅是(希望)熟練創作者手中的工具。

對我而言,Obvious做的非常巧妙地利用這種新穎性和高複雜性來做出好的銷售。無論你怎麼想他們的藝術天賦,他們肯定是聰明的企業家。

有點像有人在1985年推出它的邊緣,在MS Paint上做了一個簡單的草圖,將它印在一塊大帆布上,並將其拍賣下來。純粹的新穎性和(當時)看似高度複雜的創造它的過程可能會帶來很高的價格並給人們留下深刻的印象。但它可能不會是「好藝術」。而MS Paint肯定不會是創造者。

就像數位相機不再是模擬相機的創造者一樣,或者Photoshop不再是前數字圖形設計師的筆和紙的創造者,人工智慧和深度學習也是如此 - 至少我們可以實際想像它們的方式在可預見的未來 - 不是創作者,而是創作者使用的工具。

對於那些對真正的自主創造力感到興奮的人來說,這可能會讓人有點失望。但我對此感到高興,並認為這絕不會減少圍繞這些技術的興奮。它們為創作者提供了真正全新的創作表達方式。它們不僅僅是作為固定工具,它們幾乎是一個元工具,它使我們能夠不斷創造新的工具和流程,以實現我們的創造性願景。

有了這個關於我認為真正的AI藝術家不在乎的人的咆哮,讓我簡要介紹一下我認為屬於這一類的少數人。

這份清單絕不是詳盡無遺的,人工智慧藝術家社區也在不斷發展。開始研究更廣泛的人工智慧藝術的好地方是由Luba Elliott組織的創意和設計機器學習NeurIPS研討會的畫廊。

為了簡潔起見,我也不會深入了解任何藝術家的細節,但鼓勵你為自己檢查他們的藝術(和想法)。

認識AI藝術家

可能最成熟的AI藝術家是Mario Klingemann。

Klingemann就像Obvious一樣,把注意力集中在GAN相關藝術,尤其是肖像畫上。然而,與Obvious相反,他真正成為他們錯綜複雜的大師,確切地知道如何建造,訓練和操縱它們以達到他所希望和設想的精確藝術成果。

他的許多作品都具有令人難以置信的微妙之處,讓人聯想到更傳統的藝術形式,通常將藝術美學與更抽象的藝術形式混合在一起。

說並不會讓人感到意外。然而,有些人可能會感到驚訝的是,即使是

「神經小故障」; 正如他在接受藝術市場大師採訪時所描述的那樣,他對人工智慧藝術追求的動力在於尋找「有趣」 。

「我試圖找到一種有趣的東西,這種搜索永遠不會結束,因為一旦你抓住它就會像手中的雪花一樣融化。興趣隱藏在陌生的,不常見的和不可思議的之中,但是一旦你發現它並把它拖到聚光燈下,你看它越久,它就越熟悉或正常,最終失去它的趣味性。

我正在使用機器作為探測器來幫助我搜索不斷增長的信息,這些信息以加速的速度傳播到我們的世界。與此同時,我通過使用機器來生成有序的信息模式,而不是將其留給我自己的設備,從而增加了這一堆。有時在這個過程中,我決定並有時將其留在機器上。「

這種搜索方面是AI藝術中反覆出現的主題。

我們可以想像所有可能的藝術作品的抽象空間。這個空間是令人難以置信的高維度和巨大的(可能是無限的,取決於我們考慮的媒體)。傳統上,藝術家只能非常緩慢地探索這個空間中的無限小區域。

神經網絡本質上提供了工具,使我們能夠更快,更廣泛地探索這個空間。人工智慧藝術家的技能往往在於知道如何引導這種網絡化探索向「高度興趣」的地區。

克林格曼最近還在蘇富比拍賣了他的一件藝術品---記憶路人。這件作品不僅僅是一件靜態的藝術品,而是實際上包含了生成機制本身,導致了一個完全生成,無限期發展的裝置。

最終,該片獲得了「僅僅」32,000英鎊,這導致了一場廣泛的媒體風暴,文章名為「人工智慧藝術品拍賣,機器人大災難尚未到來」,宣稱短暫的AI藝術場景已不復存在而不是好奇心,基本上已經到了最後。

但是,我個人認為這對AI藝術界來說是一個好兆頭(我認為Mario Klingemann同意這一點)。32,000英鎊是一個合理且非常可觀的價格,而不是表明人工智慧藝術的終結,它標誌著人工智慧藝術炒作的結束以及對注意力/新奇經濟的利用。

這表明AI藝術已經成為一種嚴肅而受人尊敬的藝術形式,而不是過分誇大的好奇心。

與馬里奧·克林格曼的作品截然不同,但同樣有趣的是土耳其媒體藝術家Memo Akten的作品。

雖然克林格曼的作品非常「專注」(缺乏更好的詞彙)並且與美術相關,但阿克滕的作品更具概念性和多樣性。雖然他的最終結果可能看起來不那麼「精緻」,但它們都是基於通常非常簡單但巧妙和具有挑釁性的想法。

我非常鼓勵你看看他的作品目錄,但是我想與你分享我最喜歡的作品,他稱之為「學習」。

這個想法非常簡單,但結果既驚人又發人深省。

在訓練過程開始時,神經網絡通常是隨機初始化的,這代表著它們絕對沒有「現實世界」的概念。在訓練期間,通過反覆暴露於數據,他們然後形成世界的圖像(或至少是數據集中表示的世界)。如果此數據集存在偏差,那麼受過訓練的網絡的世界觀也是如此。

在學習中,Akten將這個想法發揮到了極致,並在非常不同的圖像數據集上訓練了各種神經網絡。

一個網絡只看到海洋和海岸線的圖像,另一個網絡只看到火災圖像,而另一個網絡只看到了鮮花圖像。

結果,一旦網絡完成了他們的訓練過程並在「真實世界」上發布,被展示出更多的通用圖像,他們只能根據他們學到的東西來解釋這些。

例如,「花卉網絡」並不知道如何解釋它在花朵方面所看到的一切,看到它看起來到處都是鮮花。

就好像一個孩子從孤立的環境中出生,只被花朵包圍,然後突然釋放到現實世界中。它的視覺皮層和模式識別系統可能會很難解釋新的模式,並且可能同樣看到各處的鮮花。

雖然這是一個思想實驗而僅僅是推測,但眾所周知,我們人類對視覺感知中的某些模式具有自然(且非常有用)的偏見,例如看到面部的偏見。

學習觀察提出了一個有趣的問題,即由於我們獨特的成長和文化背景,我們每個人可能有多少偏見。

我們所看到和感知這個世界有多麼不同?

雖然不太可能像Akten網絡的偏見那樣強烈,或者思想實驗中的孩子,但幾乎可以肯定的是,人與人之間存在微妙的差異。

算法的偏差在過去已經引起普遍關注。種族聊天機器人或性別歧視圖像識別/分類模型只是一些例子。它們實際上是數據驅動科學和深度學習中最基本的問題之一。

在某些情況下,偏見非常明顯。雖然這些案件肯定令人震驚和擔憂,但它們不太可能成為問題最嚴重的案例,僅僅因為它們非常明顯。隨著數據驅動技術變得越來越普遍,特別是微妙但全部存在的微小偏見既重要又難以發現和根除。

雖然我們可能沒有直接的解決方案,但作為藝術家,我們有能力在這個問題上引起關注,並讓外行人(以及經驗豐富的從業者)更容易接近,將其推向極致。

這就是我認為很多有趣的AI藝術生活的地方,特別是Memo Akten也參與其中的更具概念性的類型:採用完善的神經網絡,並將它們推向(或超越)它們的突破點或適用範圍。這不僅會帶來有趣和意想不到的結果,而且還可以讓我們更深入地了解這些模型在現實世界場景中盲目鬆散時可能會產生的問題。

我想在這裡介紹的最後一位藝術家是計算機設計講師Tom White。

他的項目Perception Engines,顧名思義,側重於感知在創造力中的作用。用他的話說,

「人類感知是創作過程中經常被低估的部分,因此設計一個將感知放在首位和中心的計算創造過程是一項有趣的練習。」

同樣,它本質上是一種欺騙神經網絡的做法,通過巧妙地改變應用它們的域來做它們最初不打算做的事情。

它使用了對抗性例子的概念,並對其進行了有趣的藝術轉折。特別是,White建立了一個反饋循環,網絡的感知引導創作過程,然後反過來再次影響感知。

簡而言之(並且有點簡化),懷特採用經過訓練的神經網絡來識別圖像中的對象,然後使用第二個系統,該系統可以生成抽象形狀並搜索可以「欺騙」網絡進入高確定性預測的結果一個特定的對象類。結果看似抽象的形狀(白色後來變成真正的屏幕列印)仍然說服網絡是某些對象的照片級真實表示。

產生了巨大影響,並在過去幾年中引發了很多破壞和進展,這一事實對於許多人來

有趣的是,一旦我們知道網絡認為它看到了什麼,我們就可以在大多數情況下突然看到大多數圖像中的對象(儘管我懷疑是否有人被欺騙與真實的東西混淆)。

白色使用的真正過程實際上比我在這裡給出的項目的縮略輪廓更加聰明和深刻。如果您對細節感興趣,我強烈建議您查看他的文章。

Qosmo:計算創造力和超越

現在您已經對AI藝術的內容有了一些了解,並了解了一些在這個新興領域工作的人,讓我簡要介紹一下我如何參與其中的故事。

我實際上是以物理學家的身份開始了我的學術生涯,在量子信息理論方面攻讀博士學位。但是在這樣做的過程中,我意識到我想做更多應用的事情。通過我共同創辦的初創公司獲得了一些創業經驗,我認為AI從純粹的學術角度來看似乎既有趣,也是解決一些非常酷的現實世界問題(並賺取一些錢)的非常有前途的工具。

因此,在我獲得博士學位後,我在一家創業公司工作了幾年,這家公司將人工智慧應用於廣泛領域的商業問題,例如金融和醫療保健。雖然在這些領域肯定有一些有待解決的問題,但我個人對AI的創意方面越來越感興趣。

最終,在2019年2月,我終於決定辭掉我以前的工作,並和他的朋友NaoTokui一起在他的Qosmo公司工作。

Qosmo是一個位於東京的小型創意團隊。該公司的核心理念是「計算創造力」,重點關注人工智慧和音樂(但當然不限於這些領域)。

在這裡,我想簡要介紹一下我們過去的三個項目。

AI DJ

到目前為止,Qosmo最著名的項目可能是我們的AI DJ項目。

AI DJ最初始於2016年,是人與人之間的音樂對話。

在DJ中,「背對背」的演奏代表著兩位DJ輪流選擇和混音。在我們的例子中,我們有一個人類與AI一起背靠背。

具體來說,人(通常是Nao)選擇一個軌道並混合它,然後AI接管並選擇一個軌道並混合它,依此類推,創造一個自然和連續的合作性能。

這種增強人類創造力和玩人與機器創造力關係的想法是我們在Qosmo所做工作的核心。我們對自主創意機器並不特別感興趣(我們也不相信它們在不久的將來是可能的),而是人類如何與人工智慧和機器進行交互以達到創造性目的。

AI DJ由幾個獨立的神經網絡組成。核心是一個系統,可以根據以前播放的曲目的歷史選擇一個曲目,以及一個可以進行節拍匹配和混音的系統。

至關重要的是,我們不是使用數字音頻而是使用實際的黑膠唱片。AI必須學習如何物理操縱光碟(通過使用強化學習訓練的微型機器人手臂),以便對齊節拍並獲得匹配的速度。

雖然該項目已有幾年歷史,但我們仍在不斷開發該系統。例如,使用相機來分析人群行為並嘗試通過調整此信息的軌道選擇來鼓勵人們跳得更多。

我們在過去的許多場地都採用了這種表現,包括本地和全球。到目前為止,我們最大的表現是在Google I / O 2019上,我們在主要舞台上進行了一小時的演出,在CEO Sundar Pichai的主題演講之前讓人群熱身。

您可以在我們的網站上閱讀有關AI DJ細節的更多信息。

虛構的Soundscapes

作為人類,我們將視覺和聽覺經驗聯繫在一起。看看海灘的圖像,你可以很容易地想像出海浪和海鷗的聲音。看著繁忙的十字路口可能會引起汽車喇叭聲和施工噪音。

Imaginary Soundscapes是一個讓人工智慧具有與圖像相關的類似想像聲音的實驗。這是一個基於網絡的聲音安裝,讓用戶可以探索谷歌街景,同時沉浸在AI夢寐以求的想像聲景中。

從技術上講,它基於跨模態信息檢索技術的思想,例如圖像到音頻或文本到圖像。

該系統使用影片(即視覺和音頻)輸入的兩個模型進行訓練:一個完善的,預先訓練的圖像識別模型處理幀,而另一個卷積神經網絡將相關的音頻作為譜圖圖像讀取,具有力的損失其輸出的分布儘可能接近第一個模型的分布。

經過訓練,這兩個網絡允許我們從我們龐大的環境聲音數據集中檢索特定場景的最佳匹配聲音文件。

生成的音景有時很有趣,有時很有趣,有時候會發人深思。其中許多符合人類的期望,而其他人則讓我們驚訝。我們鼓勵您自己迷失在想像中的音景中。

神經Beatbox

我們最近的藝術項目是Neural Beatbox,這是一個視聽裝置,目前在倫敦Barbican舉辦,作為「AI:More Than Human」展覽的一部分(其中還有Mario Klingemann和Memo Akten的作品)。

就像AI DJ一樣,這件作品以音樂對話為中心。然而,除了在AI DJ中,AI在這裡不是參與者而是僅僅是輔導員,並且對話發生在安裝的不同觀看者之間。

節奏和節拍是人類之間最基本和最古老的交流方式。Neural Beatbox使任何人,無論他們的音樂背景和能力如何,都能用他們自己的聲音創造複雜的節拍和節奏。

當觀眾接近安裝時,鼓勵他們錄製自己的短片,製作聲音和拉動有趣的面孔。使用該影片,一個神經網絡將觀眾的聲音分段,分析並分類成各種類型的鼓聲,其中一些然後被集成在當前播放的節拍中。

同時,另一個網絡不斷產生新的節奏。

通過以這種方式結合後續觀眾的貢獻,人們之間的直觀音樂對話展開,從而產生不斷發展的作品。

AI的輕微瑕疵,例如偶爾的錯誤分類或不尋常的節奏,實際上增強了創作體驗,並產生了有趣和獨特的音樂體驗。作為觀眾,試圖通過製作「非鼓聲」來推動系統超出其預期的領域可以產生非常有趣的結果,其中一些實際上是令人驚訝的音樂和鼓舞人心的。

目前,Neural Beatbox僅限於在巴比肯展覽等公共場所展出,但我們正在考慮將其打開為基於網絡的互動作品。我們只是擔心網際網路上的人們可能會為這種安裝做出什麼樣的聲音和影片...雖然結果可能很有趣和有趣,但他們可能還會很快包含一些NSFW內容。;)

生成模型和VAE

除了我(仍然是最近)在Qosmo的工作,我還做了一些我自己的藝術作品和更多與AI有關的一般創意相關項目。在向您展示其中的一些內容之前,我簡單地想要進行快速簡單的技術遊覽。

創作場景中使用的許多模型都屬於「生成模型」的廣泛範疇。上面介紹的GAN是其中的一種變體。

生成模型本質上是模型,正如其名稱所示,學習如何生成更多或更少的真實數據。物理學家理察·費曼(Richard Feynman)在一篇引述中非常清楚地概括了這背後的一般思想。

「我無法創造,我不明白。」 - 理察費曼

作為使用AI的研究人員和工程師,我們希望如果我們可以教我們的模型來創建至少模糊的數據,那麼這些模型必須對現實世界的樣子或行為方式有所了解。 。

換句話說,我們使用創造和生成有意義的輸出的能力作為智能的標誌。

不幸的是,這種「理解」或「智能」仍然常常如下圖所示。

研究院,轉載需授權人工智慧和深度學習對大量領域

雖然我們的模型肯定是在了解現實世界,但他們的知識領域往往受到嚴重限制,正如我們在偏見的例子中已經看到的那樣。

在我之前從事實際業務應用的工作中,這是個壞消息。您不希望您的財務或醫療預測看起來像上面的圖像!

然而,作為一名藝術家,我發現這令人興奮和鼓舞人心。事實上,正如已經指出的那樣,許多藝術家故意尋求生成模型的這些突破點或邊緣情況。

我個人最喜歡的生成模型類型是所謂的變分自動編碼器,或簡稱VAE。從信息理論的角度來看,我發現它們既非常多才多藝,又美麗而優雅。

簡而言之,VAE作為輸入饋送原始數據,然後必須通過信息瓶頸壓縮和傳輸該數據,並最終嘗試儘可能準確地重建它。

由於信息瓶頸(更具技術性:潛在空間的維度低於數據空間),模型不能直接傳遞數據,而是必須學習有效的抽象和概念。

例如,如果我們想將它應用於狗和貓的圖像,而不是簡單地傳輸每個像素值,模型就被迫學習抽象,例如「狗」和「貓」的概念,腿和耳朵的概念,毛皮顏色等,它允許更緊湊(儘管通常不是完全無損)的數據表示。

作為這個過程的一個簡潔的副產品,我們得到了一個緊湊的數學描述,我們的數據,一個所謂的潛在向量或嵌入。這允許我們做各種有趣的事情,例如有意義的數據比較以及數據點之間的實際插值,如上面的GAN面的示例中那樣。

如果你想更詳細地了解所有這些,我從兩個玩家之間的合作遊戲的角度寫了一篇關於VAE的深入討論。

個人項目

我想在下面向您展示的項目都以某種方式使用VAE。

潛在的脈動

當VAE初始化時,它的數據表示是完全隨機的,因為它尚未學習任何有關訓練數據的信息。隨著訓練的展開,網絡逐漸學會了不同的概念和抽象,類似數據的集群在潛在的空間中開始形成,隨著模型的收斂,越來越多地結晶出來。

潛在脈動可視化一個這樣的訓練過程,從初始隨機混亂,模型經歷變換階段嘗試不同表示的各個階段,到最終建立在表現出相當明顯的聚類的階段。

潛在空間中的每個點代表大約30萬個消費者投訴文本中的一個,該文本涉及由不同顏色代表的約12種不同的金融產品(例如「信用卡」,「學生貸款」......)。

除了自然的學習過程中,我還添加了一些周期性的隨機噪聲的嵌入物,以創建與軌道同步跳動模式「2個頭腦」的InsideInfo,時間拉長從原來172bpm到160bpm,以更好地匹配影片的幀速率。我選擇了軌道「2 Minds」,因為標題讓我想起了VAE的編碼器 - 解碼器關係。

通常在使用生成模型創建藝術時,我們會考慮模型創建的實際輸出。然而,潛在的脈動將這一概念轉移到它的頭部,表明潛在的空間本身可以具有固有的美感和藝術品質,即使模型訓練的數據顯然是枯燥的,例如在這種情況下使用的消費者投訴文本。

潛在的風景

另一個相關的作品更深入地描繪了隱藏在潛在空間中的優雅和美麗的潛在風景

我喜歡將這些視為神經網絡的「腦部掃描」。

出品|CDA數據分析

從技術上講,這些圖像是通過分析潛在空間的基本指標而生成的這件作品實際上是[我們正在研究的研究論文的副產品)。粗略地說,潛在空間不是「平坦的」,並且它們內的距離不均勻。潛在景觀可視化潛在空間中不同位置處的曲率,距離失真程度。

上述結果也基於在同一財務投訴數據集上訓練的VAE,顯示了提醒外星人景觀或宇宙氣體雲的抽象形態。

就像Latent Pulsations一樣,網絡本身,而不是生成模型的輸出,成為藝術品。

NeuralFunk

我想提到的最後一個項目是迄今為止我最大的個人項目。由於我之前已經在媒體上廣泛撰寫了這個項目我只想給你一個非常簡短的概述。

NeuralFunk是一個使用深度學習進行聲音設計的實驗。這是一個完全由神經網絡合成的樣本製成的實驗軌道。

同樣,神經網絡不是軌道的創造者,但它們是用於構成軌道的唯一工具。因此,結果不是AI製作的音樂,而是使用AI作為探索創造性表達新方式的工具製作的音樂。

我在樣本的創建中使用了兩種不同類型的神經網絡,一種是在頻譜圖上訓練的VAE和一種WaveNet(另外還可以用來自VAE的頻譜圖嵌入)。這些網絡共同提供了許多工具,用於生成新的聲音,從重新設想現有樣本或將多個樣本組合成獨特的聲音,夢想完全無條件的全新聲音。

然後將得到的樣品用於產生最終的軌道。

標題為NeuralFunk的靈感來自鼓和低音子類型Neurofunk,這是我最初的想法。但在整個項目過程中,它變成了更具實驗性的東西,與聲音設計過程本身的實驗性質相匹配。

如果你想了解這個項目的全部細節(包括代碼),請查看我的文章。

那麼下一步對我來說是什麼?

我對使用AI的擴展現場表演有一個很大的願景,它將與上面介紹的許多概念(和項目)相結合併將它們提升到一個新的水平,同時給我一種全新的音樂表現手段。

到目前為止,這只不過是一個願景,考慮到項目的規模,我甚至有點害怕開始。

然而,我現在非常積極和熱情地工作的是一本關於Time Off重要性的書。

雖然這似乎有些切合實際,但它實際上在幾個方面完全與人工智慧和創造力的關係聯繫在一起。

為了讓你相信這一點,讓我們繼續一下。起初看起來似乎是隨機的和無關的,但是請稍等一下,希望到最後你會同意我並對這個未來的願景感到興奮。

工作,休閒和創造力的未來

在人類歷史的大部分時間裡,工作的概念基本上等同於體力勞動。首先是田地和農場,後來是工廠。

在20世紀初,普通工廠工人每天工作超過10小時,每周工作6天。

這一切都在1926年發生了變化,當時亨利福特推出了8小時工作日和5天工作周(同時顯著提高了工資標準以上的工資)。

為什麼福特這樣做?這不是因為他只是一個好人。他可能已經,我不確定,但他這樣做的理由更實際,也更受商業驅動。

首先,他認識到如果他提供比其他任何人更好的工作條件,他就可以輕鬆吸引最優秀的人才。這正是發生的事情。最熟練的工人離開了他的競爭對手,並排隊到他的工廠工作。如果有人沒有表演,他就會放手。有足夠多的人願意接管這個職位。

其次,他認為如果人們沒有空閒時間或者太累,無法利用空閒時間,他們就不會在休閒活動上花錢。

「有更多休閒的人必須有更多的衣服。他們吃的食物種類更多。它們需要更多的車輛運輸。[...]休閒是不斷增長的消費市場中不可或缺的因素,因為勞動人民需要有足夠的空閒時間來尋找包括汽車在內的消費品的用途。「

這純粹是經濟的。

通過給予他的工人更多的休閒(以及更多的錢用於休閒),同樣的工人最終能夠和激勵他們購買他們正在生產的產品。更多的空閒時間不會傷害,但會提振經濟!

最後,最有趣的是我們在這裡的討論,他意識到他的工人將能夠在更短的時間內做得更好,原因有兩個。

對時間的限制將導致更多的創新和更好的方法。人們實際上會考慮如何工作,而不僅僅是研究。

「我們可以在五天內獲得至少與六年一樣的產量,我們可能會獲得更大的產量,因為壓力會帶來更好的方法。」 - 亨利·福特

此外,更多休息的工人通常更有效,更有動力,並且減少了代價高昂的錯誤。

從本質上講,福特認為,即使是手工勞動,將忙碌與生產力等同起來只能達到一定程度。

大約在福特縮短其工廠工作時間的同時,哲學家伯特蘭·羅素(Bertrand Russel)在1936年發表了他的精彩文章「讚美寂寞」(The Praise of Idleness)。

在這篇文章中,羅素指出,歷史上它不起作用,而是休閒的慶祝活動使我們能夠完成許多我們現在認為是文明最大成就的事情。

「過去有一個小型休閒班和一個大型工人階級。休閒階層享有的優勢是社會正義沒有基礎[...]它幾乎貢獻了我們所謂的文明。它培養了藝術並發現了科學; 它寫了書,發明了哲學,並改善了社會關係。甚至被壓迫者的解放也經常從上面開始。如果沒有休閒類,人類將永遠不會出現野蠻行為。「

他繼續爭辯說,前進的方向是重新發現我們對休閒和休假的欣賞(至少是高質量的休閒,如反思和沉思,而不是無休止地滾動我們的Facebook提要)。

並讓每個人都參加休閒課程,而不僅僅是少數人。

「我要嚴肅地說,通過對工作的良性的信念,現代世界正在造成很大的傷害,通往幸福和繁榮的道路在於有組織地減少工作。」 - 伯特蘭羅素

鑑於20世紀初的這種趨勢,我們現在應該生活在一種文化中,類似於古希臘和羅馬,它非常重視休閒,並認為忙碌實際上是一種懶惰,缺乏時間管理和深刻反思的思想。

但事實恰恰相反。我們發現自己處於一種文化中,經常將忙碌,壓力和過度工作作為榮譽的徽章,成就和驕傲的標誌。按時離開工作並在白天休息充足的人不可能像日復一日地長時間過度工作並且幾乎沒有離開辦公桌的人那樣富有成效,對嗎?

問題在於,即使我們已經從手工勞動轉向知識工作,工人仍然會受到工廠工作心態的智力影響!

在某種程度上,這可能是合理的,目前仍然存在相當於工廠工作的大量殘餘物。這是一種工作,其中更多的時間實際上與產生的更多輸出相關(至少在一定程度上,正如亨利福特所實現的那樣)。

這種工作真正證明了長時間工作和犧牲時間。但這也是最不值錢的工作。而且這個價值一直在進一步下降。迅速。這些正是人工智慧和其他生產力和自動化工具中斷和最終替代的成熟任務。他們的日子差不多了。

在我之前的工作中,我領導了人工智慧驅動工具的開發,該工具幫助金融分析師搜索大量新聞數據並從這些文本中獲取見解。藉助此工具,分析師設法縮短了搜索相關信息所需的時間,並為其經理生成了高達90%的報告!這可以減少90%的時間浪費在日常任務上,現在可以將其重新投入到真正重要且真正利用其技能和創造力的工作中。

或者,它可以投入到休假中。這是值得的投資。

人工智慧不會剝奪我們的工作,也不會威脅或削弱我們的人類價值觀。我的朋友和共同作者約翰·菲奇和我認為相反的情況也是如此。是的,人工智慧會破壞工作環境,但是那些將保留以及新創造的工作將圍繞人類技能,如創造力和同理心。

而且這些技能在時間上非常不線性。更多的時間絕對不對應更好或更高的輸出。事實上,很容易投入太多時間,忽略休息的平衡和滋養效果,從而減少一個人的產出。

在未來的工作中,休假不會被認為是「很好的」或者是慷慨的僱主為吸引和留住人才而提供的誘人利益。

相反,故意實行休假將是關鍵技能和競爭優勢之一。除了我們的職業道德,我們應該認真開始考慮我們的「休息倫理」。

約翰和我對這個未來感到非常興奮,我們正在編寫一本關於「休假」主題的書。

我們希望鼓勵更多的人重新發現這種似乎已被遺忘的古老藝術,並提供非常實用的技巧,以便如何培養和使用高品質的休閒,並分享歷史和現在令人難以置信的驚人故事。那些利用了時間的力量的人。

我們相信,專注於提升同理心和創造力的公司和個人,以及支持他們的休閒實踐和習慣,是企業或個人理念的核心,將會蓬勃發展。

很快,它可能是唯一可行的選擇。

繁忙的工作很容易實現自動化,沒有人,無論他們投入多少小時以及他們犧牲了多少生命,都會在這些任務上超越AI。

另一方面,創造力和同理心將在很長一段時間內保持明顯的人性。

那些了解這些技能以及新工具的人將不會將AI視為障礙或對手,而是將其人性提升到新的水平。

授權他們這樣做將是一種健康的工作和休閒節奏,以及故意的休假練習。

所以我們現在開始練習吧!

我希望這篇長篇文章讓你對AI藝術本身以及人工智慧對我們將來更多地關注創造力的廣泛影響感到興奮。

我也希望我能激勵你自己採取行動。

如果你是一名AI實踐者,希望你能夠使用自己的人工智慧藝術,也許首先要推動你的模型超越極限,看看它們的行為方式。

但無論你是否直接使用AI,我真的希望你會考慮練習更多,更好,休假。

這不是懈怠或懶惰。這是你自己可以做的最好的投資之一!

讓繁忙的工作留給人工智慧,變得更加人性化!

原英文標題:Next Level Art and the Future of Work and Leisure

聲明:文章觀點僅代表作者本人,PTTZH僅提供信息發布平台存儲空間服務。
喔!快樂的時光竟然這麼快就過⋯
繼續其他精彩內容吧!
more