人類的最後陣地!AI看不懂漫畫造就漫畫家鐵飯碗。
AI工程師的很大壹部分工作就是替AI“帶路”,然後告訴人類,妳們的這項和那項工作都要被AI替代了。
壹直以來,人類似乎都站在壹個毫無還手之力的弱勢地位,或許未來真的像壹些悲觀者想象中那樣,我們有AI司機、AI售貨員、AI詩人,但人類自己卻成了可憐的乞討者。
直到今天,他們第壹次發現有壹項工作AI在壹段時間以內都無法超越人類,而這次勝利屬於二次元——不會被AI代替的工作,是漫畫家。
連漫畫都看不懂,談什麽毀滅世界?
漫畫家不會AI代替的原因很簡單,因為馬裏蘭大學的壹位教授進行了壹項研究,最終發現AI根本看不懂漫畫。
以上是壹則非常簡單的四格漫畫,對於人類來說理解起來非常容易:小貓在思考創作素材,然後發現了小狗,要求小狗講個笑話,小狗說“妳很漂亮”導致小貓非常憤怒。
實際上,在最後壹個畫面中,小狗沒有入鏡,而“妳很漂亮”本來是表揚,要和上壹個畫面中的“笑話”連接起來,才能解釋出小貓的情緒。
對於AI來說,理解這些呈現在畫面之外的信息,簡直太困難了。
在馬裏蘭大學的實驗中,研究者搭建了壹個由120萬張漫畫畫格組成的數據集,並提取出了每個畫格中的文本,利用LSTM模型,希望AI能對漫畫進行壹個連貫的了解。
關於LSTM(長短期記憶網絡)此前已經介紹過很多,這壹模型的特點就是加入了記憶的概念,可以處理和預測時間序列較長元素。雖然在長文本、機器翻譯等等方面表現的都不錯,但在看漫畫這件事上,LSTM徹底挫敗了。
在經過大量訓練後,研究人員給了AI壹組以前沒見過的漫畫,要求AI理解並預測下壹個畫面中的文字信息或畫面內容,結果AI的成績壹塌糊塗。而人類的預測正確程度,通常能達到80%的正確率。
視覺敘事?何必強人工智能所難
嚴格來說,漫畫這種東西屬於“視覺敘事”——把信息隱藏於圖像之中。同樣是視覺敘事,AI理解電影就比理解漫畫容易的多,電影的主角是人,而人臉長的都是壹個樣子,想要訓練AI讀出人臉表情、識別情緒是件很簡單的事,更何況電影還會有詳細的劇本。
但漫畫最大的特點,就是視覺上不具有連貫性。就像上文的四格漫畫壹樣,第三張圖小狗還在畫面中,第四張圖就不在了。人類可以很快的理解到,名為淡定狗的小狗扔下壹句話就淡定的離開。可對於AI來說,讀出這種在畫面和文字之外的信息實在是強人工智能所難。
其次,不同漫畫的繪畫、敘事風格迥異,對於AI的訓練來說也是個難點。簡單的四格漫畫中,每壹格的場景都是相同的,可在其他漫畫中,可能這壹格是打鬥的場景,下壹格就是壹張憤怒的人臉。能看懂四格漫畫AI,再去看那種有鏡頭切換感的漫畫,也是壹頭霧水。至於畫風方面,不同漫畫家對於人臉描繪方式都有很大差異,換成AI來理解,難度又會加大了。
還有壹點,視覺敘事這件事是建立在“邏輯”和“常識”兩個概念基礎之上的。比如小貓說講個笑話,小狗說“妳好漂亮”,理解這個情節就需要“妳說我漂亮是笑話=妳說我醜”這壹基礎的邏輯。又比如哆啦A夢中常見的老鼠梗也需要“貓通常不怕老鼠”這壹基礎常識。這些東西對於人類來說都很簡單,可是AI是不具備這些常識和邏輯概念的,我們也不能像編百科全書那樣,把這些概念灌輸到AI的大腦之中。
圍棋界的大手,到了甄嬛傳裏也是壹集死
其實結合AI在圍棋領域的勝利和在漫畫上的失敗,我們可以看出,AI在完全信息信息領域中的表現和不完全信息領域中的表現完全不同。
完全信息本來是經濟學中的壹個屬於,意思是參與者可以理解整個市場的所有信息。在這裏,我們可以看做壹項工作的數據集。在圍棋這項工作中,所有的信息都可以歸納為數據集:遊戲的規則、每壹步的打法。可在漫畫中,我們最多能把畫面中做上詳細的標註,把文本信息都提取出來。可隱藏在圖片文字之外的邏輯關系、常識等等只可意會不可言傳的東西,是無法向AI提供的。
而AI做的最差的,就是read between the lines。
以此類推,AI在戲劇、歇後語、四國軍棋的暗棋(壹種包含了欺騙的軍旗玩法)包括談戀愛等等壹切充滿了不完全信息、欺騙與反欺騙、解讀意象、常識和邏輯的遊戲中表現都不會太好。
這麽看來,AI有點像《三體》裏初期的智子,不會隱藏自己的想法,也不能明白隱瞞、欺騙這種概念。所以,我們真的不必對AI的勝利感到恐懼,它會是辦公室裏人緣最差的那位同事和後宮裏壹集死的路人,某壹項能力的突出並不能彌補它在不完全信息方面的短板。更何況意象、類比、反諷、隱喻這種東西,是人類最擅長的手段。
我相信,未來世界最好的樣子壹定是人類和AI各司其職,做各自最擅長的事情。在視覺敘事這類AI特別不擅長的事情上,它們依然能給人類提供很多幫助。
比如用生成對抗神經網絡創造人物形象、用監督學習+卷積網絡來為線稿上色、甚至開發壹款會自動放大文字的漫畫閱讀App。這些並不是幻想,而是正在發生的現實。當這些繁復的機械勞動被AI代勞後,我們也就能更多的投入到自己擅長的事情中來:利用不完全信息環境講好更多故事,讓這個世界保持應有的趣味。