字節(jié)跳動(dòng)大模型遭內(nèi)部實(shí)習(xí)生攻擊 知情人士透露“損失被夸大”
近日,社交平臺(tái)上有消息稱:“字節(jié)跳動(dòng)實(shí)習(xí)生田某某因‘團(tuán)隊(duì)資源分配不均’,在模型訓(xùn)練過程中投毒,導(dǎo)致8000多張H100訓(xùn)練一個(gè)多月都是錯(cuò)誤的,損失超千萬(wàn)美元?!?br/>
據(jù)字節(jié)跳動(dòng)知情人士對(duì)記者透露,確實(shí)有破壞模型訓(xùn)練一事,不過傳聞也有夸張和虛構(gòu)的信息。該人士表示,這件事情其實(shí)發(fā)生在今年6月底,田某某是在商業(yè)化技術(shù)團(tuán)隊(duì)實(shí)習(xí),因?yàn)閷?duì)團(tuán)隊(duì)資源分配不滿,使用攻擊代碼破壞團(tuán)隊(duì)的模型訓(xùn)練任務(wù)。
據(jù)悉,田某某利用了Huggingface(HF)平臺(tái)的漏洞,在字節(jié)跳動(dòng)公司的共享模型中寫入了破壞代碼,導(dǎo)致模型訓(xùn)練效果忽高忽低,無(wú)法產(chǎn)生預(yù)期的訓(xùn)練成果。
一位從事互聯(lián)網(wǎng)安全的人士對(duì)記者表示:“公司內(nèi)部一般都有人專門負(fù)責(zé)測(cè)試審計(jì)代碼,但通常不會(huì)看全部代碼,如果隱藏得很好的話,即使看了也未必能發(fā)現(xiàn),這種情況很難防范,如果不是實(shí)習(xí)生,就是正式員工如果想在代碼中隱藏一些別有意圖的代碼,也很難發(fā)現(xiàn)。所以對(duì)技術(shù)團(tuán)隊(duì)來說,招人很關(guān)鍵。”
從成本的角度上,上述從事互聯(lián)網(wǎng)安全的人士補(bǔ)充道:“軟件開發(fā)上公司通常會(huì)信任同事不會(huì)有惡意,如果個(gè)個(gè)都懷疑,公司會(huì)承受不了成本壓力。”
北京大數(shù)據(jù)協(xié)會(huì)理事、北京融信數(shù)聯(lián)科技有限公司CTO張廣志對(duì)記者表示,技術(shù)的發(fā)展和應(yīng)用,需要受到法律法規(guī)、倫理道德和管理規(guī)程的約束。從安全視角看,信任基(Trust Base)需要持續(xù)重視。無(wú)論硬件、軟件如何設(shè)計(jì)完善,仍不免需要人來操作。無(wú)論大模型或其他領(lǐng)域,信任基最大薄弱環(huán)節(jié)最終還是人。
其實(shí)互聯(lián)網(wǎng)公司發(fā)生過一些從內(nèi)部對(duì)公司進(jìn)行攻擊或破壞的案例,從內(nèi)部攻擊造成的影響和損失都不算小。例如,2020年2月微盟研發(fā)中心運(yùn)維部的核心運(yùn)維人員通過VPN登錄服務(wù)器,并對(duì)線上生產(chǎn)環(huán)境進(jìn)行了惡意破壞,刪除了數(shù)據(jù)庫(kù),導(dǎo)致微盟平臺(tái)約300萬(wàn)個(gè)商家的小程序全部宕機(jī),事件從發(fā)生到數(shù)據(jù)全面找回歷時(shí)一周。該事件當(dāng)時(shí)導(dǎo)致微盟市值蒸發(fā)超過30億港元,直接虧損0.87億元人民幣。此外,微盟還準(zhǔn)備了1.5億元的賠付撥備金。
傳聞此次字節(jié)跳動(dòng)遭內(nèi)部實(shí)習(xí)生攻擊,損失可能超過千萬(wàn)美元。但上述字節(jié)跳動(dòng)知情人士表示“損失并沒有傳聞中那么嚴(yán)重”。并且,該人士表示,受影響的業(yè)務(wù)其實(shí)不是豆包大模型,而是商業(yè)化技術(shù)團(tuán)隊(duì)的模型訓(xùn)練任務(wù),也就是影響了廣告部門的一些技術(shù)工作。
對(duì)于該事件當(dāng)中的實(shí)習(xí)生田某某,傳聞稱“被送進(jìn)去”,但上述字節(jié)跳動(dòng)知情人士透露,處理方式是“辭退+同步行業(yè)聯(lián)盟+同步情況給學(xué)?!薄?/p>
如今大模型蓬勃發(fā)展正在逐漸融入千行百業(yè),加上此次字節(jié)跳動(dòng)發(fā)生的內(nèi)部攻擊事情,大模型的安全問題無(wú)疑會(huì)得到更多的重視。張廣志認(rèn)為:“大模型的安全,除了法律法規(guī)、企業(yè)管理或是軟硬件約束,還可以從群防群治、群策群力的視角進(jìn)一步完善。大模型最終面向用戶,在用戶側(cè)建立更完善的反饋機(jī)制,讓AI在陪伴用戶的同時(shí),能夠反向約束發(fā)揮監(jiān)管作用,是一個(gè)探索的方向?!?/p>