DALL-E 編輯圖片想法

Editing your images with DALL·E

ChatGPT 的 DALL-E 可以編輯圖片 (先前只能改提示後再全圖重生)。

我要它生成中華電信寶寶，它拒絕了 (正常，避免版權問題)，改生一個原創角色如下:

其自動生成提示文字如下 (已經不是一開始用 DALL-E 看到的英文):

一隻穿著中華電信品牌顏色衣服的可愛卡通動物，站在一片充滿科技感的城市中。這個動物看起來友好而且開心，手裡拿著一個智慧型手機，正在向觀看者揮手。背景中的城市充滿了未來感，有著飛行的汽車和高聳入雲的摩天大樓。

我塗掉左側高樓，要它生一個台北 101，它沒有拒絕，但試兩次都沒生出來。右側的文字要求它清掉倒是成功了。最後如下:

其他部份看起來完全沒變，還算是可以的編輯成果。

最後的提示文字如下:

一隻穿著中華電信品牌顏色衣服的可愛卡通動物，站在一片充滿科技感的城市中，沒有任何文字。這個動物手裡拿著一個智慧型手機，正向觀看者揮手。在這座城市中，有兩座特別突出的台北101大樓，其獨特的建築設計使它們成為背景中最顯眼的地標。城市中還有飛行的汽車和其他高聳入雲的摩天大樓，營造出一個未來感十足的景象，整體場景中沒有任何文字。

就我先前玩開源生圖模型的經驗來看上述提示文字，會覺得有點奇怪。原始的圖的提示不會變更，後續的每次編輯，其每次小範圍的 mask 會有各自的提示文字 (僅有「台北 101」或「沒有文字」)，應該不會混入整個圖的提示文字，也不太可能整個圖全部重生才對 (特別是若要求未 mask 部位保持不變)。要不是 OpenAI 有自己的獨門技巧，要不就是上述提示文字只是給客戶看的一個版本，也不是內部執行生圖步驟中所用的。就好像提示文字變成中文，是否真代表底層生圖模型已能識別中文? 我也是存疑。