發佈於

DALL-E 編輯圖片想法

作者
  • 作者頭像
    作者
    ChrisTorng
    Twitter

Editing your images with DALL·E

ChatGPT 的 DALL-E 可以編輯圖片 (先前只能改提示後再全圖重生)。

我要它生成中華電信寶寶,它拒絕了 (正常,避免版權問題),改生一個原創角色如下:

其自動生成提示文字如下 (已經不是一開始用 DALL-E 看到的英文):

一隻穿著中華電信品牌顏色衣服的可愛卡通動物,站在一片充滿科技感的城市中。這個動物看起來友好而且開心,手裡拿著一個智慧型手機,正在向觀看者揮手。背景中的城市充滿了未來感,有著飛行的汽車和高聳入雲的摩天大樓。

我塗掉左側高樓,要它生一個台北 101,它沒有拒絕,但試兩次都沒生出來。右側的文字要求它清掉倒是成功了。最後如下:

其他部份看起來完全沒變,還算是可以的編輯成果。

最後的提示文字如下:

一隻穿著中華電信品牌顏色衣服的可愛卡通動物,站在一片充滿科技感的城市中,沒有任何文字。這個動物手裡拿著一個智慧型手機,正向觀看者揮手。在這座城市中,有兩座特別突出的台北101大樓,其獨特的建築設計使它們成為背景中最顯眼的地標。城市中還有飛行的汽車和其他高聳入雲的摩天大樓,營造出一個未來感十足的景象,整體場景中沒有任何文字。

就我先前玩開源生圖模型的經驗來看上述提示文字,會覺得有點奇怪。原始的圖的提示不會變更,後續的每次編輯,其每次小範圍的 mask 會有各自的提示文字 (僅有「台北 101」或「沒有文字」),應該不會混入整個圖的提示文字,也不太可能整個圖全部重生才對 (特別是若要求未 mask 部位保持不變)。要不是 OpenAI 有自己的獨門技巧,要不就是上述提示文字只是給客戶看的一個版本,也不是內部執行生圖步驟中所用的。就好像提示文字變成中文,是否真代表底層生圖模型已能識別中文? 我也是存疑。