国产情侣酒店自拍,一区二区三区四区日韩,美女拍拍拍免费视频网站

Facebook 的研究人員推出了一種新的 AI 模型，該模型可以從網(wǎng)上任何未標記圖像的中學(xué)習(xí)，這是一項突破，盡管該團隊的研究仍處于早期階段，但他們希望給計算機視覺領(lǐng)域帶來一次 “革命”。

該模型被稱為 SEER(SElf-SupERvised)，被饋入了10 億張公開可用的 Instagram 圖像，這些圖像未經(jīng)過手動標記。但是，即使沒有通常在 AI 算法訓(xùn)練中使用的標簽和注釋，SEER 仍能夠自主地訓(xùn)練數(shù)據(jù)集，不斷進行學(xué)習(xí)，并最終在諸如對象檢測之類的任務(wù)上達到最高的準確性。

這種被稱為自監(jiān)督學(xué)習(xí)(self-supervised learning)的方法在 AI 領(lǐng)域已經(jīng)很成熟：它由可以直接從給定信息中學(xué)習(xí)的系統(tǒng)組成，而不必依賴經(jīng)過仔細標記的數(shù)據(jù)集來教他們?nèi)绾螆?zhí)行諸如識別照片中的對象或翻譯文本之類的任務(wù)。

自監(jiān)督式學(xué)習(xí)近來引起了很多關(guān)注，因為這意味著需要手工標記數(shù)據(jù)的工作要少很多，這對大多數(shù)研究人員而言是費時費力的工作。無需管理數(shù)據(jù)集的同時，自監(jiān)督模型可以處理更大，更多樣化的數(shù)據(jù)集。

在某些領(lǐng)域，特別是自然語言處理中，該方法已經(jīng)取得了突破。在數(shù)量越來越多的未標記文本上訓(xùn)練算法已使諸如問答、機器翻譯、自然語言推理等應(yīng)用程序取得了進展。

相反，計算機視覺尚未完全進入自監(jiān)督的學(xué)習(xí)革命。正如 Facebook AI Research 的軟件工程師 Priya Gopal 解釋的那樣，SEER 是該領(lǐng)域的首創(chuàng)。她告訴 ZDNet：“與現(xiàn)有的在 ImageNet 數(shù)據(jù)集上訓(xùn)練的計算機視覺的自監(jiān)督模型相比，SEER 是第一個可以隨機訓(xùn)練互聯(lián)網(wǎng)上圖像上的完全自監(jiān)督的計算機視覺模型。”

ImageNet 是一個大規(guī)模數(shù)據(jù)庫，包含研究人員標記的數(shù)百萬張圖片，并向較大的計算機視覺社區(qū)開放，以促進 AI 的發(fā)展。

該項目的數(shù)據(jù)庫被 Facebook 的研究人員用作評估 SEER 性能的基準，他們發(fā)現(xiàn)自監(jiān)督模型在諸如低空拍攝、物體檢測、分割和圖像分類等任務(wù)上優(yōu)于最新的監(jiān)督 AI 系統(tǒng)。

Goyal 說：“通過僅對隨機圖像進行訓(xùn)練，SEER 優(yōu)于現(xiàn)有的自監(jiān)督模型。這一結(jié)果表明，我們不需要像 ImageNet 這樣的高度精選的數(shù)據(jù)集，對隨機圖像的自監(jiān)督學(xué)習(xí)就可以產(chǎn)生非常高質(zhì)量的模型。”

隨著自監(jiān)督學(xué)習(xí)復(fù)雜度的提高，研究人員的工作并非沒有挑戰(zhàn)。在文本方面，AI 模型的任務(wù)是為單詞賦予含義。但是對于圖像，該算法必須決定每個像素如何與一個概念相對應(yīng)，同時考慮到其在不同圖片中拍攝角度、視圖和形狀的差別。

換句話說，研究人員需要大量數(shù)據(jù)，并且需要一個能夠從這種復(fù)雜的信息池中推導(dǎo)出所有可能的視覺概念。

為了完成此任務(wù)，Goyal 和她的團隊從 Facebook AI 在自監(jiān)督學(xué)習(xí)中的現(xiàn)有工作中改編了一種新算法，稱為 SwAV，該算法將顯示相似的圖像聚集到單獨的組中?？茖W(xué)家還設(shè)計了卷積網(wǎng)絡(luò)，也就是一種深度學(xué)習(xí)算法，算法對人腦中神經(jīng)元的連接模式進行建模，根據(jù)重要性分配給圖像中的不同對象。

至少可以說，借助 Instagram 的 10 億張圖片的數(shù)據(jù)集，該系統(tǒng)的規(guī)模很大。Facebook 的團隊使用了具有 32GB RAM 的V100 Nvidia GPU，并且隨著模型尺寸的增加，必須將模型放入可用的 RAM 中。但是 Goyal 解釋說，進一步的研究將對確保計算功能適應(yīng)新系統(tǒng)很有用。

“隨著我們在越來越多的 GPU 上訓(xùn)練模型，這些 GPU 之間的通信需要快速進行?？梢酝ㄟ^開發(fā)軟件來解決給定的內(nèi)存和運行時間帶來的挑戰(zhàn) .”她說。

盡管仍有許多工作要做，但是，在可以將 SEER 應(yīng)用于現(xiàn)實世界的用例之前，Goyal 認為不應(yīng)低估該技術(shù)的影響。她說：“借助 SEER，我們現(xiàn)在可以通過大量隨機的互聯(lián)網(wǎng)上的圖像訓(xùn)練大型模型，在計算機視覺方面取得更大的進步。”

“這一突破可以實現(xiàn)計算機視覺的自監(jiān)督學(xué)習(xí)革命，類似于我們在自然語言處理文本中所看到的。”

在 Facebook 內(nèi)部，SEER 可用于各種計算機視覺任務(wù)，從自動生成圖像描述到幫助識別違反政策的內(nèi)容。在公司外部，該技術(shù)還可用于圖像和元數(shù)據(jù)有限的領(lǐng)域，例如醫(yī)學(xué)成像。

Facebook 的團隊呼吁開展更多工作，以將 SEER 推進到其下一階段的開發(fā)。作為研究的一部分，該團隊開發(fā)了一種基于 PyTorch 的全能庫，用于自監(jiān)督學(xué)習(xí)，稱為 VISSL，該庫是開源的，鼓勵更多的 AI 社區(qū)成員對該技術(shù)進行測試。

關(guān)鍵詞： Facebook AI 圖像