Midjourney創作怎麼玩?專家揭密關鍵字技巧、AI繪圖工具的限制與發展潛力

Midjouney_AI繪圖_01

輸入「/imagine」和關鍵字, 一分鐘就能生成4 張圖,操作如此簡單的Midjouney, 甚至讓財經權威《經濟學人》在6 月都用它做封面。但台灣人為何特別瘋狂,甚至擁有全球最大的Facebook 社團?社群創始人林思翰與Vogue 藝術總監周青永,為你揭密Midjourney 這項AI 新繪圖工具狂潮。

AI技術早已不是新聞,尤其在2021年NFT熱潮下生成藝術(generative art)與機器學習(machine learning)更多進入大眾視野。投入這些大多需要coding基礎,但近期卻出現零基礎都能上手的AI繪圖工具。這也是Midjourney在今年5月推出beta版、開放公眾使用後,旋即引發全球關注的原因,《經濟學人》6月的「AI新境界」(AI's New Frontier)主題報導甚至直接用Midjourney製作封面。然而台灣人特別瘋狂,瞬間湧入一度癱瘓Midjourney伺服器,這源自5月20日Midjourney AI台灣社群創始人林思翰在Facebook如病毒擴散般的一篇貼文,「原本成立社團的初衷單純是大家聊天、交換邀請碼,沒想到變那麼大,連官方都嚇到說—你的社群比我們當時Discord上的人還要多。」100人成長為2萬多人全球最大的Midjourney社團,他訝異也開玩笑說台灣人「跟風」特別厲害。而帶領Vogue團隊賣出全球首個NFT封面的周青永,對新技術的關注也不落人後,認為台灣社群對科技的態度很開放,這或許是出自大眾對創作的嚮往。

Midjouney_AI繪圖_05
周青永為設計友人演算的未來感建築影像。

Q:Midjourney是兩位首次運用的AI繪圖工具?

周青永:我算是首次使用。印象中AI繪圖被廣泛注意首先是2016年淘寶雙11購物節時,號稱AI設計平台「魯班」做了1.7億個Banner,當下半信半疑,之後就沒有新報導曝光。2020年在臺北設計與藝術指導協會的活動中,曾看過叁式的藝術總監何庭安分享機器學習成果,我再次注意到AI,隔年2021年就是大家熟知的NFT浪潮,Art Blocks平台為首的生成藝術作品受到關注,台灣也出現許多演算藝術家。直到Midjourney,我看見林思翰分享的文章,覺得進入門檻較低,不需要特別去懂coding,就想說來試試看。 

Midjouney_AI繪圖_07
周青永的〈未來奧運會〉。

林思翰:之前最受關注的是Google跟NVIDIA,可是他們只展示挑過的成果圖,我對沒有真正釋出應用的工具都是保持觀望態度,軟體的實力要使用才知道。我有用過Disco Diffusion,算是容易上手但還是要一點coding基礎,而且成果只限定幾款繪圖濾鏡,還達不到我的要求。Google的Imagen超級難申請,DALL·E 2 AI我排了好幾個月都還沒排到,像Midjourney釋出給大眾使用,我才真正感受到其威力。

Midjouney_AI繪圖_09
林思翰〈史前高等文明〉。

Q:為什麼Midjourney能真正地引起大眾迴響?為何它讓那麼多人驚艷到?

林思翰:Midjourney引起社群迴響的最大關鍵在於簡單、幾乎零門檻,輸入關鍵字就能製圖,而且風格很廣、常常難以分辨是AI畫的,這讓人很興奮也很恐懼。社群、公開的性質讓Midjourney進步快速,新手不用埋頭自己算,可以(在Discord上)參考別人的算圖結果並複製關鍵字去改,大家可以不斷交流、研究如何優化關鍵字。而官方有投票機制每週判斷使用者喜歡哪些圖,以此更新演算法,可看作是大家日以繼夜努力優化出來的成果。

Midjouney_AI繪圖_10
Discord的操作介面,周青永嘗試運算符合時尚審美的作品。

周青永:用中國流行語來講就是「簡單粗暴」。你只要輸入關鍵字,就能快速模仿一些大家熟知的藝術風格,蠻震撼的。我覺得台灣人對創作有一種嚮往,很多人可能沒有創作技能,但這種工具可以幫助他們快速實現對創作的憧憬。

Midjouney_AI繪圖_04
林思翰〈不能共存的節日〉。

Q:現在最流行輸入哪些關鍵字?AI與人腦的邏輯畢竟不同,有什麼技巧能更容易得到理想的結果? 

林思翰:我什麼都算,覺得沒有一定好用的關鍵字,例如繪畫風格的圖輸入artstation可以幫助很多,但下在攝影風格上就很怪。如果只打廣義的形容詞像是beautiful,Midjourney會沒辦法定義精準,最好要指定藝術家、設計師等名稱,這非常考驗背景知識。台灣社群超愛新海誠、吉卜力兩個關鍵字,我想是因為風格強烈到難以忽視,例如同時輸入新海誠與多個藝術家,整張圖幾乎只顯現新海誠風格。不是說一些歐美藝術家不紅,我有嘗試輸入過,全部混在一起時反倒辨識度不高。

Midjouney_AI繪圖_02
林思翰讓Midjourney在台灣爆紅的十二生肖創作。

周青永:我一開始也想到新海誠,台灣偏愛唯美、夢境一般的風格,國外則不太避諱算強烈詭異的東西,但最近他們開始搭配FaceApp後製出穩定的人臉成果,唯美風格也逐漸增加,但我不偏好這種作法,這對優化Midjourney本身的機器學習沒幫助。我想演算出貼近攝影師拍出的人像,上傳過參考圖片看能不能縮短運算時間,但經常失敗,最後還是全憑調整關鍵字的內容與排序。算人臉用stunning或beautiful較容易得到美觀的成果,而輸入攝影師的名稱,其風格會對人臉有很大影響。跟AI溝通的邏輯很重要,想算出東亞臉孔,對AI來說亞裔範圍廣泛到中東、印度一帶,那就要縮小範圍,有人同時用日台韓三國作為關鍵字,我也嘗試把單眼皮加進去(有點刻板印象),會比較接近想像的東亞面孔。

Midjouney_AI繪圖_08
周青永發現人臉在畫面中比例越小,越難控制並克服恐怖谷效應,因此成功的人像作品大多以肖像為主體。

Q:像Midjourney這樣的工具,對產業有怎樣的衝擊?現階段的限制又是什麼? 

林思翰:目前與直接使用之間還有一段距離,但就創意廣告產業來說,確實是可以加速提案、找參考資料或繪製概念圖等流程。我想音樂工作者能利用平常累積的文字素材輔助繪製概念宣傳圖,插畫師、概念設計師這類具創作能力的人也能利用AI繪圖成果稍加修改,像角色插畫師就能生成背景節省不少時間。Midjourney的限制也很明顯,人與動物算是它的致命傷。再來是它只擅長畫複雜的東西,不適合算極簡風格,你可以想像它是拼圖的概念,叫它單純演算一個正圓、字母或漂亮漸層它做不到。取樣的資料庫也是個問題,像Artstation等都是國外素材庫,要找到亞洲或在地素材本身就很困難。現在解析度也有限制,但官方暫時沒必要開發這部分,產生更多細節破綻算再大也沒意義,反而優化演算法讓人臉不要歪掉比較重要。 

Midjouney_AI繪圖_11
周青永發現人臉在畫面中比例越小,越難控制並克服恐怖谷效應,因此成功的人像作品大多以肖像為主體。

周青永:做人臉確實會有這樣的狀況,解析度的確是下個階段才需面對的問題。有一件事很有趣,Midjourney會在演算加入一些變數條件,這是種可能性但有時輸出會不穩定,我之前嘗試了1,000多個結果後終於有滿意的成果,再算一次全部歪掉,瞬間懷疑人生。時尚產業面向很廣,目前還不到衝擊的程度。這在服裝設計師產出collection概念、我們用mood board跟攝影師溝通風格時或許有幫助,但Midjourney繪圖都有某種風格筆觸,還沒辦法擬真到攝影拍出的味道,除非想演算像德國新銳攝影師Elizaveta Porodina幫Zendaya拍Vogue Italia封面這種強烈藝術風格。此外我們經常需要拍時尚單品,但Midjourney無法精確還原某一單品,只能模仿大致風格,應用上就有困難。補充一下,我覺得社群小編礙於版權與預算時,可以善用這種工具。 

Q:最後,我們想問:AI繪圖工具會取代人嗎?AI生成的作品能算是個人原創的作品嗎?

周青永:我認為它還是停留在工具的概念上,現階段還不能取代人,前一陣子不是有報導爆出研究員聲稱Google的LaMDA擁有自我意識?現在AI能夠提供回饋式的結果,但不會主動溝通或給予意見,還沒辦法達到互相理解,但AI繪圖可能會是下一代的主流創作工具。至於原創問題,我認為爭議在Midjourney模仿其他作品風格去製圖,可是人在創作過程中也無法避免參考到他人,我想若運用算圖將這些風格內化並表達出概念,就不只是仿作。致敬跟抄襲的界線永遠受熱議,我們也沒有一條準則說作品裡有幾成原創性才能稱為你的作品。 

Midjouney_AI繪圖_06
林思翰〈蔘命之樹〉。

林思翰:我覺得不用太擔心,工業時代到現在人也沒被取代,未來對創意工作者的競爭力要求可能更高,但相信會找到新出路。像我作為導演控管品質不一定需要動手去做,大家還是會認為那些是我的作品,這跟AI繪圖很像,成果取決你的溝通、創意產出及後製調整能力。針對原創性問題,社團中有個律師分享法律上只保障人類創作的智慧財產權,國外就有案例以AI繪圖申請沒通過。法律之外的道德爭辯又見仁見智,但我們社團投票中有個共識,只要有對圖加工,不論比例多少都能聲稱有創作成分,邏輯在於你有無付出勞力,不能單純複製他人的關鍵字算圖就好。我自己在製圖後一定會有很大程度的修改,盡量讓人看出有調整過。

Midjouney_AI繪圖_03
周青永最近以宇宙終結為概念的演算新嘗試。

Hans Lin 林思翰

谷汩文化 Group.G 導演,從事廣告動畫設計工作多年,為ASUS、Acer、Samsung、Nespresso、Porsche、BVLGARI等客戶服務,曾受邀到Adobe與Apple擔任講師。

Jeter Chou 周青永

Vogue Taiwan藝術總監,擁有逾20年跨領域設計經驗,以臺北時裝週Fashion Gamer沉浸式AR街區體驗獲數位奇點獎肯定。身兼Condé Nast Taiwan數位產品設計主管,團隊曾於單季連續獲5項CSSDA S.Kudos,創下當時國內最多得獎紀錄,目前亦擔任CSSDA常駐評審。全球Vogue市場首個成功售出的NFT封面專案領導者與發起人。

文|吳哲夫

圖片提供|周青永、林思翰

一起透過La Vie 2022/8月號《職人與他的工具》,一窺工具與技術、人們之間的共創關係!

延伸閱讀

RECOMMEND

把手機殼反著裝,就能戒斷手機成癮?「​​Aperture」運用一個小動作,教你專注真正重要的事

把手機殼反著裝,就能戒斷手機成癮?「​​Aperture」運用一個小動作,教你專注真正重要的事

隨著科技發展,各品牌爭相推出充滿創新概念與功能的裝置,而與此同時,一項實驗計劃「Aperture」採取了與眾不同的策略。它很簡單地運用多數人已經擁有的物件——手機與手機殼,打破想像的框架,創造一款簡單、易上手,為健康意識而生的使用介面。

想使用Aperture,只需把手機殼拆下,然後反過來裝在螢幕那一面即可。這樣一來,螢幕的尺寸被限縮,如同一扇迷你的窗,而Aperture會以最極簡的介面,在這個小小的窗框裡,為使用者提供最極簡的手機功能,像是傻瓜相機、簡易版本的播放器與通訊軟體等。透過直觀的界面設計,Aperture提醒使用者思考:什麼是我當下真正需要的功能?什麼是我需要獲得的資訊?

把手機殼反著裝,就能戒斷手機成癮?「​​Aperture」運用一個小動作,教你專注真正重要的事
想使用Aperture,只需把手機殼反過來裝在螢幕面即可(圖片來源:Special Projects)

Aperture是創新設計工作室Special Projects的最新實驗,該團隊致力透過以人為本的設計,探索實體與數位體驗的交叉點。團隊表示,雖然市面上有許多「回歸基礎」的手機設備(如:The Light Phone),強調能幫助使用者減少智慧型手機帶來的負面影響,但如果不需為此購入新裝置,還能根據使用者當下心境做出修正,不是更好嗎?

把手機殼反著裝,就能戒斷手機成癮?「​​Aperture」運用一個小動作,教你專注真正重要的事
Aperture畫面示意(圖片來源:Special Projects)

幫你除去多餘資訊,只留下最重要的

Aperture的使用介面由AI人工智慧技術驅動,可以根據不同需求客製化生成式介面(generative UI)。要決定顯示哪些應用程式,你只需對手機說話:「幫我導航去Brick Lane,沿路標出唱片行。」或是:「幫我播放音樂,並且只允許Alba和Pearl的來電。」

把手機殼反著裝,就能戒斷手機成癮?「​​Aperture」運用一個小動作,教你專注真正重要的事
Aperture的使用介面由AI人工智慧技術驅動,可以根據不同需求客製化生成式介面(圖片來源:Special Projects)

除此之外,Aperture還能幫你簡化充斥著繁雜資訊、礙眼廣告的介面。比如,當你想閱讀一篇網站上的食譜,Aperture會自動切換成簡潔的「閱讀模式」,或為你製作AI生成摘要,將混亂的頁面轉換為乾淨、逐步引導的烹飪教學。

把手機殼反著裝,就能戒斷手機成癮?「​​Aperture」運用一個小動作,教你專注真正重要的事
Aperture能幫你簡化充斥著繁雜資訊、礙眼廣告的介面(圖片來源:Special Projects)
把手機殼反著裝,就能戒斷手機成癮?「​​Aperture」運用一個小動作,教你專注真正重要的事
Aperture將混亂的網頁轉換為乾淨、逐步引導的烹飪教學(圖片來源:Special Projects)

另外,如果你發現自己開始無意識地滑起手機,只要把手機殼反過來裝,Aperture也能啟用「專注計時器」,幫助你戒斷手機成癮,專注在真正重要的事上。反覆將手機殼拆下、重裝其實有點麻煩,也因此將大大減低使用者查看手機的頻率,鼓勵大家更有意識地使用科技裝置。

 

和親朋好友一起使用

Aperture還鼓勵多人一起使用。當大家在聚餐時一起翻轉手機殼,裝置便會自動識別彼此,在不同裝置間創造一些可愛的連動效果,然後才逐漸關閉螢幕,提醒眾人專注於彼此相處的時光。若你不是iPhone的使用者,也別擔心!Aperture非常彈性化,其介面會根據不同型號的螢幕形狀與設計做出調整。

把手機殼反著裝,就能戒斷手機成癮?「​​Aperture」運用一個小動作,教你專注真正重要的事
Aperture會根據不同型號的螢幕形狀與設計做出調整(圖片來源:Special Projects)

Aperture起初只是非常實驗性的概念,不過如今已逐步邁向成熟。Special Projects相信,無論是設計或是AI,其未來都不在於創造更多物品,而是從已有的物件中挖掘嶄新的可能;我們需要做的,或許僅是跳脫那些看似理所當然、習以為常的安排,並重新理解一切。

資料來源|Special Project

延伸閱讀

RECOMMEND

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流

現代人的生活不能沒有瀏覽器,我們使用瀏覽器工作、購物、娛樂,與網路世界連結。這款瀏覽器「Opera Air」,號稱第一款「為放鬆及紓壓而設計的瀏覽器」,內建正念練習、冥想引導、運動指導等,它不僅僅是瀏覽網頁的工具,更能幫助使用者管理壓力、提升專注力,並在一天當中保持清晰的情緒狀態。

一款為放鬆而生的瀏覽器

由挪威瀏覽器開發商Opera推出的最新產品「Opera Air」,是全球首款以正念為核心設計的瀏覽器。Opera Air以北歐極簡視覺與霧面玻璃介面呈現,其兼具一般瀏覽器的功能,並結合呼吸練習、冥想、雙耳節拍(Binaural beats)、伸展運動等一系列體驗,讓使用者在工作階段中感到更放鬆。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
Opera Air使用介面(圖片來源:Opera Air)

針對Opera Air的發表,Opera產品資深總監Mohamed Salah表示:「網路世界雖然美好,卻也容易讓人感到混亂與不知所措,所以我們決定運用科學方法,幫助使用者更有條理地探索網路世界,讓他們在瀏覽時感到更輕鬆、更高效。」

在工作間進行正念練習

Opera Air最有特色的功能,就是引導使用者進行正念休息。每個練習時長介於3-15分鐘,使用者可以自行調整音量、自然背景聲與背景音樂,也能設定定時提醒,確保自己不會忘記適時休息。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
Opera Air最有特色的功能,就是引導使用者進行正念休息(圖片來源:Opera Air)

其中,「Take a Break」模式提供呼吸練習、冥想以及身體掃描(Body scan),而「Boosts」模式則利用雙耳節拍技術,透過在左右耳播放稍有差異的頻率,進而影響大腦波動,促進 放鬆、專注或冥想狀態。藉由這些練習,使用者將能感受到創意力與專注度提升,並獲得深度的放鬆。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
「Boosts」模式利用雙耳節拍技術,進而影響大腦波動,促進 放鬆、專注或冥想狀態(圖片來源:Opera Air)

在Opera Air中,正念練習並不會影響網頁瀏覽體驗。使用者可以在瀏覽網頁或編輯文件時,開啟「Focused Calm」模式,透過背景音樂與大自然音效,建立深度專注的心流狀態。

除了正念練習外,Opera Air也提供其他實用功能如:

▎智慧運動

邀請使用者在3D模型的指導下,進行平衡運動練習,與身體重新連結、提高靈活性。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
(圖片來源:Opera Air)

▎引導式冥想

透過獨特的聲音引導,帶領使用者進入放鬆、寧靜的個人空間,在此暫停、深呼吸並重新專注於當下。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
(圖片來源:Opera Air)

▎Aria AI

無需付費或訂閱的內建AI助手,可即時對話、生成圖像、摘要文章、語音輸出。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
(圖片來源:Opera Air)

▎廣告攔截

內建廣告攔截功能,減少干擾,讓瀏覽體驗更流暢、無壓力。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
(圖片來源:Opera Air)

▎免費VPN

內建免費VPN,提供快速且穩定的連線體驗,並確保隱私安全與網路保護。

為放鬆而生的瀏覽器「Opera Air」:透過正念練習、冥想引導,幫助你從繁雜資訊中找到心流
(圖片來源:Opera Air)

延伸閱讀

RECOMMEND