- 封面故事
- 2023年
- 643期-生成式AI再進化(7月號)
文章專區
2023-07-07從草圖到草稿, 生成圖像如何改變創作特性?
643 期
Author 作者
李怡志/任教於政治大學新聞系, 研究方向包含資訊視覺化及生成圖像。
Take Home Message
• 人工智慧生成圖像讓人能以文字生成藝術,在演算法運作下具有「生成性」與「文字性」兩大重要特性。
• 圖像生成大量依賴文字提示,使過去的草圖修改轉變為文字草稿的累積,使用者可從中體會生成式人工智慧的隨機、偶遇、選擇等特性。
• 教學者可鼓勵學生以草稿生成圖像再回頭修改文字創作,在科學與教育上激發創造力,而非限制人類的想像。
只要寫一行文字,就可以讓電腦產生一張圖、一節音樂、一篇文章,甚至一段影片。從去(2022)年開始,這種受到人工智慧(artificail intelligence, AI)驅動的生成技術讓人類感到驚訝。雖然我們並不是第一次面對顛覆性新科技,但這次可以適應時間相對要短很多,難免令人焦慮。
人工智慧生成技術(generative AI, GAI),或稱生成式 AI,在過去幾個月以來,突然從少數幾個服務系統變成一個巨大的體系。本文試圖在這個巨大體系中,討論生成圖像的兩個重要特性:「生成性」與「文字性」。
演算法下的生成性
其實生成藝術或生成圖像的技術不算嶄新,從 1960 年代開始已經有 60 年的歷史,也累積了許多針對生成圖像特性的看法與研究。有些觀點雖然已經年代久遠,不過對應最流行的人工智慧生成圖像(AI generated art, AIGA)依然歷久彌新。
生成藝術包含了許多藝術形式,例如文字和音樂。生成藝術不一定要使用電腦操作,在目前 AIGA 發展的脈絡下,最重要的特性為「具有演算法」。創作者不一定要撰寫演算法,重點是演算法可以自主運行,而人類則必須學會適應演算法展現出來的抗性,也就是創作媒材展現出需要被控制與學習的特性。生成藝術的先驅、數學家那基(Frieder Nake)認為,適應演算法的抗性就像傳統繪畫必須適應物質的特性一樣。
(123RF)
在演算法之後,後續幾個特性都與演算法有關。第二個重要的特點為隨機性(randomness),在同一個演算法之下,每次生成的內容都會不同。若是生成工具在同樣的指令下,每次都生成一模一樣的作品,則無法稱之為生成。第三個特性為不可控,不像紙筆或電腦繪圖,沒有辦法每一筆的位置都如同創作者的規畫,但生成圖像必然有部分不受創作者控制。不論是1%還是99%,生成藝術的創作者必須讓電腦多少可以獨立完成內容,而不是全然由人類控制。
第四個生成的特性為迭代,因為圖像會隨機生成,創作者必須不斷修改提示或產出變異,直到自己滿意為止,在這個過程中,每一張圖都可以視為下一次生成的草圖。第五個特性則接續了前面四個特性,也是非常多文獻都會提到的特點,即為偶遇性(serendipity):創作者會在預期之外得到覺得很好的作品。研究電腦創意的馬赫(Mary Lou Maher)形容,偶遇來自於對焦距的改變,讓創作者可以重新分類自己對作品的架構,從而發現產出物的新價值。
最後兩個特點為選擇及策展,主要都在 AIGA 出現後才被學者提出。在生成工具大量生成圖片後,「選擇」成為創作者非常重要的主控權,同時大量的作品也能被創作者以策展的方式產出新的意義。
仰賴文字性的圖像生成
傳統的創作步驟大致上依循構思、草圖、局部修改直到成品誕生,雖然繪製草圖前可能有多種想法,但草圖通常與最終作品的差異不大,從草圖到作品可以視為一個偏向線性的過程。與傳統創作不同,圖像生成工具目前大量依賴文字提示社會科學的架構,將提示分為三個層次:本體、認識、方法。有趣的是,這樣的分類法教師通常立刻就懂,但學生需要時間理解。為了加速學生理解,這個架構可以再改成博物館參觀法:本體代表一個展間,通常展間都會有一個本體層次的主題,例如油畫、雕塑、19 世紀印象派等;認識層次則是當我們站在作品前面會看到的東西,代表作品主題,例如少女、靜物、觀世音等。最後的方法論則是我們詳細端倪作品時可以看到的細節,例如暈染、厚塗、散景、精細等。結合這三個層次,創作者即能寫出相當完整的文字提示給圖像生成工具。……【更多內容請閱讀科學月刊第643期】