AI贏得填字游戲冠軍 比最快人類參賽者快兩分鐘

發(fā)布時(shí)間:2021-06-01 11:26:22  |  來源:智東西  

美國填字游戲錦標(biāo)賽上,一位人工智能選手從 1000 多名參賽者中脫穎而出,獲得勝利,它就是填字游戲程序“菲爾博士(Dr. Fill)”。

盡管在兩道題上出現(xiàn)了錯(cuò)誤,但 Dr. Fill 仍在一分鐘內(nèi)完成了游戲,比最快的人類參賽者快了整整兩分鐘。Dr. Fill 的背后有著加州大學(xué)伯克利分校(UC Berkeley)伯克利自然語言處理小組的強(qiáng)大支持,它會(huì)分析題目線索生成答案列表,并根據(jù)數(shù)據(jù)庫中的 800 多萬組線索和答案來解謎。

一、神經(jīng)網(wǎng)絡(luò)與數(shù)據(jù)庫加持

Dr. Fill 是由計(jì)算機(jī)科學(xué)家馬特?金斯伯格(Matt Ginsberg)制作的,他同時(shí)也是一名填字游戲制作者。

自 2012 年以來,金斯伯格就開始讓 Dr. Fill 非正式地參加 ACPT,并在每年的比賽中對它的軟件進(jìn)行改進(jìn)。

而在今年,金斯伯格與加州大學(xué)伯克利分校(UC Berkeley)的伯克利自然語言處理小組合作,該小組由教授丹?克萊恩(Dan Klein)領(lǐng)導(dǎo)的研究生和本科生組成。

克萊恩是自然語言處理和無監(jiān)督學(xué)習(xí)領(lǐng)域的專家,他曾獲得 2016 AMiner 自然語言處理領(lǐng)域十大最具影響力學(xué)者獎(jiǎng)。AMiner 是由清華大學(xué)創(chuàng)立的新一代智能型科技情報(bào)平臺(tái)。

就在 ACPT 開始前兩周,他們共同為 Dr. Fill 開發(fā)了一個(gè)混合系統(tǒng)。其中,伯克利小組用神經(jīng)網(wǎng)絡(luò)的方法來幫助 Dr. Fill 分析線索,而金斯伯格編寫了用來填寫游戲網(wǎng)格的代碼。

Dr. Fill 還有一個(gè)包含 800 多萬條線索和答案的訓(xùn)練數(shù)據(jù)庫,這些數(shù)據(jù)來自以往在各種媒體上出現(xiàn)過的填字游戲。為了解決謎題,它的程序會(huì)參考以往的線索和答案。

和人類一樣,當(dāng)面對新的挑戰(zhàn)時(shí),Dr. Fill 必須依靠經(jīng)驗(yàn),尋找新舊問題之間的聯(lián)系。

例如,ACPT 2021 中第二題的答案,就是一個(gè)長單詞后加上后綴 - ITY 構(gòu)成的新詞。不過幸運(yùn)的是,類似的題目曾出現(xiàn)在 2010 年《洛杉磯時(shí)報(bào)(the Los Angeles Times)》發(fā)表的一個(gè)填字游戲中,Dr. Fill 的數(shù)據(jù)庫當(dāng)中包含了這道題,所以它順利地解出了答案。

二、會(huì)分析題目線索,還能篩選答案

盡管 Dr. Fill 的數(shù)據(jù)庫十分龐大,但它并不能靠“抄作業(yè)”拿第一。

在實(shí)際的解題過程中,Dr. Fill 會(huì)分析題目線索,并生成與題目線索匹配的候選答案列表,根據(jù)可能性對它們進(jìn)行排序,并檢查它們是否能填字游戲網(wǎng)格中和其他單詞恰當(dāng)連接。只要題目給出了足夠的上下文語境,Dr. Fill 就能最終解出正確答案。

例如,對于“imposing groups”這個(gè)線索,Dr. Fill 將正確的答案“ARRAYS”列為首選詞。“imposing”一詞從未出現(xiàn)在與正確答案相關(guān)的線索中,但這些線索中出現(xiàn)過其他同義詞,如“impressive”,這使 Dr. Fill 可以推斷出語義上的聯(lián)系,并解出正確答案。

Dr. Fill 還會(huì)將字母進(jìn)行交叉比對來篩選正確答案。比如,在五個(gè)字母的答案中,知道第二個(gè)字母是 O,答案的線索是“Aw, that’s a shame!(太可惜了!)”,它就可以找到正確的答案“SO SAD”。

題目中涉及雙關(guān)語或其他文字游戲的線索會(huì)比較麻煩,不過,伯克利的神經(jīng)網(wǎng)絡(luò)系統(tǒng)使 Dr. Fill 能夠識(shí)別出這類線索??巳R恩解釋說,雖然這些語義上的把戲無法明確地教給 Dr. Fill,但通過機(jī)器學(xué)習(xí),它能明白要尋找沒有常規(guī)線索那么直接的選項(xiàng)。

三、人腦仍勝在跳躍性邏輯

《紐約時(shí)報(bào)》的填字游戲編輯威爾?肖茨(Will Shortz)指出,今年的 ACPT 可能發(fā)揮了 Dr. Fill 的優(yōu)勢,因?yàn)?ldquo;每一個(gè)答案都是語義簡單,很好理解的”。肖茨說,他對 Dr. Fill 的獨(dú)創(chuàng)性感到敬畏,但他認(rèn)為人類參賽者在很多方面仍有優(yōu)勢。

他說:“現(xiàn)在,仍然是人類更擅長像填字游戲這樣非邏輯的現(xiàn)實(shí)世界問題。”在他看來,即使是在比較簡單的題目中,Dr. Fill 仍然會(huì)犯一些人類不會(huì)犯的錯(cuò)誤。

克萊恩也看到了這一點(diǎn),同時(shí)他也提到,在自然語言處理領(lǐng)域經(jīng)常會(huì)出現(xiàn)類似的挑戰(zhàn)。例如,人類的大腦經(jīng)常進(jìn)行所謂的“多跳推理”,就是說,人腦會(huì)利用很多不直接相關(guān)的知識(shí)完成一個(gè)跳躍性的推理。

而要教會(huì)人工智能遵循這樣的邏輯跳躍,就意味著人們要從很多間接表意的語言中提取并歸納出表達(dá)的邏輯。但在當(dāng)下,Dr. Fill 仍然難以理解這些不是“大白話”的語言。

克萊恩認(rèn)為,Dr. Fill 這次的表現(xiàn)只是我們從填字游戲的線索中解讀自然語言意義的第一步。當(dāng)涉及到表意特別委婉的語言樣本時(shí),克萊恩說:“那些難倒人們的語言更會(huì)難倒 Dr. Fill。”

結(jié)語:AI 自然語言處理進(jìn)階,從輸出到“思考”

Dr. Fill 在 APCT 中的勝利標(biāo)志了人工智能在自然語言處理方面的進(jìn)步。也就是說,人工智能已經(jīng)不僅可以實(shí)現(xiàn)簡單的自然語言交流,而且還能“理解”比較復(fù)雜的語義、“思考”如何解謎。

在未來,隨著科學(xué)家們對自然語言的意義拆解更加深入和系統(tǒng)化,這些人工智能的“思考”能力或許還會(huì)更接近人腦、更加強(qiáng)大。

關(guān)鍵詞: AI 填字 游戲 冠軍

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號(hào):京ICP備2022016840號(hào)-16 營業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com