脈脈網(wǎng)友爆料 字節(jié)跳動實習生刪除公司所有輕量級別機器學習模型

發(fā)布時間:2021-08-06 15:32:30  |  來源:雷鋒網(wǎng)  

脈脈上有網(wǎng)友爆料,字節(jié)跳動一位實習生刪除了公司所有輕量級別的機器學習模型!

什么是 lite 模型?

該樓主表示,lite 模型就是公司內(nèi)幾乎所有 GB 大小以下的機器學習模型,且全部被刪除了,實習生直接刪除的是父目錄且加了 skip trash (刪除文件時臨時禁用回收)操作,導致被刪除模型無法被恢復。

當晚全公司通報,直接被列入 P0 事故等級(嚴重事故):

據(jù)樓層討論,光是處理問題的群就進了接近三百人,其殃及業(yè)務之廣可想而知:

大家都在討論這位實習生的去留,我們搜了一下,據(jù)說,“只要不是主觀故意的”就不會被開除:

所以說一定要穩(wěn)住別慌,問題不大。

1、網(wǎng)友熱議

有網(wǎng)友表示這是實習生給你們這幫人出了一道 hard 題,不過沒有標準答案,考驗你們解題能力的時候到了。

還有網(wǎng)友表示實習生不能有權(quán)限操作這么重要的東西,這鍋 80% 應該判給管理者,實習生反倒是暴露了問題,換個角度來看,實習生立功了。

我們知道,字節(jié)跳動最出名的文化之一,就是扁平化管理。實習生與正式員工有同樣的文檔權(quán)限,這也是字節(jié)能夠在與 BAT 等大廠競爭中保持靈活高效的秘訣,從這個角度上來說,說實習生立功倒也不能算錯。

而別的對手就權(quán)限不一了。

到底刪除了多少模型?

根據(jù)字節(jié)網(wǎng)友后來發(fā)到網(wǎng)上的疑似截圖顯示,被刪除的只是:“Lagrange Lite 全量 Batch 模型的備份”,且顯示為「被誤刪」。

又有字節(jié)的工程師網(wǎng)友表示刪除的都是離線數(shù)據(jù),影響不大。

該樓主好像對此事非常熱衷,全程在線跟帖,表示“確實影響不大但是麻煩,重新訓練模型和延遲上線理論上都會對指標有負向只是不那么明顯了”。

實習生“立大功”

2018 年據(jù)英國《金融時報》報道,谷歌內(nèi)部一位實習生無意中犯下一個“小”錯誤,導致一則沒有意義的廣告投放到“大量”網(wǎng)頁和應用中,持續(xù)了大約為 45 分鐘,相關(guān)費用和清理成本達到 1000 萬美元,真可謂小手一抖,千萬元沒有。

2、字節(jié) AI

字節(jié)都有什么出名的機器學習產(chǎn)品?

字節(jié)跳動最早是以今日頭條來闖蕩江湖,在今日頭條以及后來的抖音和火山等產(chǎn)品上肯定用到了不少機器學習推薦算法,這就先不提了。

此外,在抖音這款“有毒”的產(chǎn)品上,也時不時見到各種運用 AI 算法來做人臉變化的技術(shù)應用,比如最近的在抖音上比較火的重返 3 歲的 AI 特效等等。

據(jù) AI 科技評論 所知,字節(jié)還開源過一個名為 LightSeq 的序列推理引擎,它對以 Transformer 為基礎的序列特征提取器(Encoder)和自回歸的序列解碼器(Decoder)做了深度優(yōu)化,早在 2019 年 12 月就已經(jīng)開源,應用在了包括火山翻譯等眾多業(yè)務和場景。

據(jù)了解,這應該是業(yè)界第一款完整支持 Transformer、GPT 等多種模型高速推理的開源引擎。

LightSeq 可以應用于機器翻譯、自動問答、智能寫作、對話回復生成等眾多文本生成場景,大大提高線上模型推理速度,改善用戶的使用體驗。

相比于目前其他開源序列推理引擎,LightSeq 具有如下幾點優(yōu)勢:1. 高性能;2. 支持模型功能多; 3. 簡單易用,無縫銜接 Tensorflow、PyTorch 等深度學習框架。

據(jù) AI 科技評論 所知,字節(jié)跳動 AI Lab 最近計劃要開源「新版訓練加速引擎」,可以讓模型訓練加速 3 倍以上。

最后,據(jù)這次的誤刪除事件來看,1GB 的模型其實不算大,大概只有幾億的參數(shù)量級,反觀現(xiàn)在 AI 江湖動則千億萬億起步的模型,1GB 以下的模型真的不算大,算不上是決定性的模型。

或許此次事件對字節(jié)只是一件不痛不癢的小事,字節(jié)的高層或許壓根不知道此事,畢竟這又不是刪庫跑路。

雖說如此,但程序里的 bug 是個玄學,有時哪怕某個小 bug 產(chǎn)生的影響往往也是難以預料的,有時會牽一發(fā)而動全身,若是趕巧也可能影響整個產(chǎn)品線。

但是,還是希望各位公司謹記「天干物燥,小心火燭」。

關(guān)鍵詞: 脈脈網(wǎng)友 字節(jié)跳動 實習生 機器學習 模型

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com