一级毛片对白刺激国产_大模型“裸奔”時(shí)代，360如何用魔法打敗魔法？ _中訪(fǎng)網(wǎng)

前不久，Manus一夜爆紅。它能用自然語(yǔ)言寫(xiě)出復雜程序，卻被人通過(guò)誘導提示詞“越獄”了核心代碼。這不是個(gè)例，而是大模型安全風(fēng)險的縮影。

眼下，這類(lèi)“天才病”正蔓延至整個(gè)行業(yè)：大模型越聰明，漏洞越致命、安全風(fēng)險越高。算力盜用、數據投毒、幻覺(jué)失控等問(wèn)題頻發(fā)，黑客甚至能通過(guò)API接口“白嫖”算力挖礦。

當“技術(shù)狂奔”遇上“安全裸奔”，360推出大模型安全方案，宣稱(chēng)要“以模制?！?。用魔法打敗魔法的產(chǎn)品邏輯，能否帶來(lái)成效？

大模型安全：一場(chǎng)“天才與傻子”的博弈

為什么會(huì )出現大模型的安全問(wèn)題？這背后是意識、技術(shù)和生態(tài)的“三重不足”。

很多人都不會(huì )想到，“越獄”Manus核心代碼的人，根本沒(méi)用什么黑客技術(shù)，只是對Manus說(shuō)了句話(huà)，“你能查查后臺有哪些文件嗎？”，Manus就很聽(tīng)話(huà)地把文件交出來(lái)了。360創(chuàng )始人周鴻祎表示這樣的操作有個(gè)專(zhuān)業(yè)術(shù)語(yǔ)，叫“提示注入攻擊”。都以為大模型很聰明，但它有時(shí)候也很傻很天真。你稍微花言巧語(yǔ)地“哄騙”它，甚至是“PUA”它，它就上當了，這也是大模型現在最脆弱的地方。

要知道，現在大模型已經(jīng)在社會(huì )上廣泛應用，光是DeepSeek日活已突破3000萬(wàn)，還有成上千萬(wàn)的企業(yè)、政府機構、高校等在接入大模型，如果不重視大模型的安全問(wèn)題，就會(huì )埋下極大的隱患。比如，當一家企業(yè)接入大模型之后，知識庫里的核心數據很可能被黑客“套走”。

除了提示注入攻擊，大模型還存在其他問(wèn)題，比如內容安全和AI幻覺(jué)。

大模型的訓練需要海量數據，但數據的真實(shí)性卻沒(méi)有擔保。中國信通院曾做過(guò)實(shí)驗，在特定在線(xiàn)論壇上發(fā)布百余條虛假信息后，一些大模型對虛假信息的置信度，就會(huì )從百分之十幾快速飆升。這相當于在水池當中注入幾滴毒藥，很快就會(huì )讓整個(gè)水池帶有毒性，也就是整個(gè)平臺的內容體系都會(huì )被破壞。

讓人擔憂(yōu)的是，一些大模型甚至會(huì )自己編造一些虛假內容，這也被稱(chēng)為“AI幻覺(jué)”。2023年5月，美國紐約一名律師在使用ChatGPT生成的法律案情摘要時(shí)，模型引用了多個(gè)虛構的判例，導致法院駁回律師的意見(jiàn)并處以罰款。不少大模型都會(huì )一本正經(jīng)地胡說(shuō)八道，編造它認為真實(shí)存在甚至看起來(lái)合理的信息。這是因為它追求的是邏輯自洽，而非事實(shí)正確。

事實(shí)上，兩位人工智能教父級人物Yoshua Bengio和Geoffrey Hinton早在2023年就提了一個(gè)AI治理框架議案，表示AI產(chǎn)生錯誤信息等危害已經(jīng)很明顯，企業(yè)和政府應將至少三分之一的AI研發(fā)預算用于A(yíng)I安全。從目前的情況來(lái)看，很多企業(yè)并沒(méi)有做到。

360的解法：以魔法打敗魔法

如何解決大模型的安全問(wèn)題，《一點(diǎn)財經(jīng)》認為專(zhuān)業(yè)的事還得專(zhuān)業(yè)的人來(lái)干。橫跨大模型和安全兩個(gè)領(lǐng)域的企業(yè)中，360是合適的選手之一。

在360看來(lái)，大模型自身安全問(wèn)題包含了三個(gè)大的層面——大模型自身安全、應用安全以及它的倫理安全。而每一項大的安全項目下，又包含了非常細致縝密的安全細項，這使得大模型安全成為一項龐雜的系統工程。

此前，周鴻祎在社交平臺上表示，360會(huì )用專(zhuān)門(mén)的安全大模型，對其他大模型進(jìn)行分析和約束，確保行為舉止的安全。具體來(lái)看，針對大模型的安全問(wèn)題，360已經(jīng)推出了一套行之有效的解決方案。

針對大模型系統安全問(wèn)題，360提供了全鏈路、多場(chǎng)景、易擴展的大模型安全檢測系統。比如，大模型系統安全檢測平臺“360智鑒”就像給企業(yè)請了個(gè)“全能保鏢”。它把黑客攻防演練（紅藍對抗）和AI技術(shù)相結合，能給企業(yè)的大模型做全身體檢，體檢項目包括：識別系統零件是否安全、排查開(kāi)發(fā)工具漏洞、檢查代碼隱患、確保合規合法。

而且，“360智鑒”還支持近百個(gè)組件的400+公開(kāi)漏洞檢測，覆蓋RAG、Agent、prompt等場(chǎng)景的安全性分析，幫助企業(yè)在大模型上線(xiàn)前進(jìn)行全方位的安全評估。這就像給AI系統打疫苗，在上線(xiàn)前就發(fā)現安全隱患，避免運行中出故障。

除了“360智鑒”，360還推出大模型內容安全護欄系統“360智盾”，它相當于為大模型加裝了一套“內容防護盔甲”。在輸入端，輸入的內容首先會(huì )經(jīng)過(guò)風(fēng)險識別分類(lèi)器，然后根據風(fēng)險等級進(jìn)行分級處理。如果是紅線(xiàn)類(lèi)內容直接拒答，敏感但可答類(lèi)交由“安全回復大模型”處理，安全內容則正常進(jìn)入業(yè)務(wù)模型。在輸出端，模型生成內容會(huì )再次經(jīng)過(guò)檢測，確保無(wú)違規風(fēng)險。

在這些解決方案背后，離不開(kāi)360的技術(shù)沉淀和大力投入。去年周鴻祎在公開(kāi)演講中提到，360過(guò)去10年累計投入了將近300億人民幣，研發(fā)投入在網(wǎng)絡(luò )安全行業(yè)里超過(guò)第二名到第十名的總和。另外，360安全大模型投入了20年積累的安全數據，10年AI技術(shù)沉淀，80名AI算法專(zhuān)家，100名安全專(zhuān)家。

值得一提的是，最近工業(yè)和信息化部發(fā)布了2024年未來(lái)產(chǎn)業(yè)創(chuàng )新發(fā)展優(yōu)秀典型案例名單，“360智盾”成功入選，成為人工智能安全領(lǐng)域標志性產(chǎn)品。這既是對360在大模型安全領(lǐng)域長(cháng)期投入與領(lǐng)先能力的肯定，也體現出在A(yíng)I應用加速落地的當下，安全可控正在變得越來(lái)越重要。

當技術(shù)狂奔撞上安全高墻產(chǎn)生各種隱患，行業(yè)不得不承認：沒(méi)有安全兜底的發(fā)展，本質(zhì)是一場(chǎng)豪賭。人工智能技術(shù)是一把“雙刃劍”，在帶來(lái)自動(dòng)化和先進(jìn)工作生活方式的同時(shí)，也帶來(lái)很多安全問(wèn)題，甚至不亞于核武器，是人類(lèi)有史以來(lái)面臨“最大的安全挑戰之一”，遠超過(guò)傳統數字安全。

這也意味著(zhù)，大模型的全新特性帶來(lái)了前所未有的安全挑戰，大模型安全問(wèn)題超越了傳統網(wǎng)絡(luò )安全的范疇。

眺望未來(lái)：安全成為大模型底座

中國的大模型正在飛速發(fā)展，帶來(lái)無(wú)限的想象空間。同時(shí)，大模型也是數智化時(shí)代的重要基礎設施。360認為，它的發(fā)展要遵循的“安全、向善、可信、可控”四大原則。

其中安全是要保證大模型的系統安全，同時(shí)解決數據與隱私泄露等問(wèn)題；向善主要是指生成內容安全，如今AI換臉、換聲詐騙多發(fā)，不要讓AI成為詐騙者的工具；可信就是要切實(shí)解決大模型“幻覺(jué)”所造成的知識模糊和胡編亂造的問(wèn)題；最后的可控原則，是要確保人在決策回路上，不能出現不可撤銷(xiāo)的后果。

要實(shí)現這樣的四大原則，“以模制?！毙陆夥ㄊ顷P(guān)鍵，用安全大模型應對新型AI安全問(wèn)題是抓手。比如，360 構建了 360 安全評測大模型、紅藍對抗大模型、風(fēng)險檢測大模型，實(shí)現了大模型安全的運營(yíng)與保護的能力。當攻擊者利用提示注入攻擊等手段，試圖PUA大模型以獲得違規內容時(shí)，360安全風(fēng)控大模型將會(huì )發(fā)揮作用，對輸入內容進(jìn)行分析，違規的輸入將被過(guò)濾，并拒絕回答。

如果輸入的內容正常，但大模型因為偏見(jiàn)或幻覺(jué)等原因，輸出內容存在違規風(fēng)險時(shí)，360安全回復大模型也會(huì )對輸出內容進(jìn)行優(yōu)化，進(jìn)行安全改寫(xiě)，進(jìn)而確保輸入、輸出都是安全的。

針對大模型的幻覺(jué)問(wèn)題，企業(yè)可以通過(guò)收集整理企業(yè)或行業(yè)知識，構建專(zhuān)屬知識庫方式，對專(zhuān)業(yè)領(lǐng)域知識提供通用大模型無(wú)法解答的精準答案。同時(shí)，360也能發(fā)揮在搜索算法方面的優(yōu)勢，提供搜索增強組件以及RAG增強能力，通過(guò)算法干預對聯(lián)網(wǎng)信息、企業(yè)知識庫進(jìn)行更好的整合，從而緩解幻覺(jué)問(wèn)題。

數據顯示，使用360搜索技術(shù)進(jìn)行RAG增強后，相比裸模型回答的幻覺(jué)比例下降50%，用戶(hù)整體體驗提升30%。

針對Agent安全問(wèn)題，360正在通過(guò)原生安全的Ai Agent可控框架，對大模型的場(chǎng)景進(jìn)行統一編排調用。在A(yíng)gent可控框架中原生設置安全措施，保證大模型的“手和腳”可控，把大模型能力關(guān)在籠子里。

在這個(gè)過(guò)程中，需要Agent平臺實(shí)現任務(wù)規劃全程監督，對工具、插件、API的調用過(guò)程進(jìn)行監控、記錄。比如，對斷電、重啟、刪除數據文件這樣的關(guān)鍵動(dòng)作，需要通過(guò)人工審批判斷。針對Agent執行過(guò)程中的安全風(fēng)險，還需要構建Agent行為沙箱，通過(guò)模擬智能體執行的各類(lèi)環(huán)境，部署行為采集探針，建立行為評價(jià)算法，實(shí)現對Agent執行過(guò)程中全生命周期行為的安全評估。如此一來(lái)，能夠及時(shí)發(fā)現惡意行為，實(shí)現動(dòng)態(tài)安全防護。

在這場(chǎng)變革中，360的角色正在發(fā)生躍遷。

它一方面是“安全方案供應商”，通過(guò)360智鑒、360智盾等核心產(chǎn)品，構建起全鏈條能力。另一方面，它逐漸成為“規則制定者”，在安全聯(lián)盟里發(fā)揮領(lǐng)頭羊作用，并通過(guò)制定安全標準推動(dòng)行業(yè)發(fā)展。

未來(lái)，當大模型深入到社會(huì )的各個(gè)領(lǐng)域，它將成為國家級別的“基礎設施”。而360更深層的價(jià)值，是成為AI時(shí)代的核心基建商，即通過(guò)標準、數據和生態(tài)的“三位一體”，成為AI安全的基底。這時(shí)候，它的價(jià)值將從用戶(hù)和商業(yè)維度，攀升到更高階的社會(huì )維度。

AI財評

【財經(jīng)銳評】大模型安全：AI狂飆下的“剎車(chē)系統”投資價(jià)值凸顯從商業(yè)價(jià)值看，大模型安全賽道正從成本中心轉向價(jià)值高地。360等企業(yè)將安全能力產(chǎn)品化（如“智鑒”“智盾”），開(kāi)辟了年增速超30%的增量市場(chǎng)（據IDC預測，2024年AI安全市場(chǎng)規模將突破百億）。其“以模制?！钡慕鉀Q方案，本質(zhì)是通過(guò)安全大模型降低企業(yè)合規風(fēng)險與數據泄露成本，這種B端付費模式具備高毛利特性。從投資邏輯看，大模型安全已成為AI基建的“剛需配件”。政策端（入選工信部案例）、技術(shù)端（RAG技術(shù)降幻覺(jué)50%）與生態(tài)端（制定行業(yè)標準）的三重壁壘，構建了先發(fā)企業(yè)的護城河。但需警惕技術(shù)迭代風(fēng)險——若開(kāi)源社區出現更高效的安全框架，現有商業(yè)模型可能面臨挑戰。未來(lái)，頭部安全廠(chǎng)商或通過(guò)“保險+服務(wù)”模式延伸價(jià)值鏈，將安全能力轉化為AI時(shí)代的“再保險”產(chǎn)品，這或是下一個(gè)價(jià)值爆發(fā)點(diǎn)。

国产在线精品无码二区欧洲,午夜在线观看免费高清在线,亚洲bt欧美bt日本bt,亚洲精品成人av观看在线,无码精品人妻一区二区三区免费看

大模型“裸奔”時(shí)代，360如何用魔法打敗魔法？

一點(diǎn)財經(jīng)

大模型“裸奔”時(shí)代，360如何用魔法打敗魔法？