在中央網(wǎng)信辦網(wǎng)絡(luò)安全協(xié)調(diào)局指導下,中國網(wǎng)絡(luò)安全產(chǎn)業(yè)聯(lián)盟 (CCIA) 主辦“2024年網(wǎng)絡(luò)安全優(yōu)秀創(chuàng)新成果大賽”。在大賽中,永信至誠“春秋AI大模型測評「數(shù)字風洞」平臺”憑借技術(shù)創(chuàng)新能力、行業(yè)應用價值榮獲網(wǎng)絡(luò)安全創(chuàng)新產(chǎn)品優(yōu)勝獎。
本次大賽旨在挖掘具備國際或國內(nèi)領(lǐng)先技術(shù)水平、應用前景廣闊、符合行業(yè)發(fā)展方向的網(wǎng)絡(luò)安全創(chuàng)新產(chǎn)品和解決方案,激發(fā)網(wǎng)絡(luò)安全企業(yè)加強自主創(chuàng)新能力,推動網(wǎng)絡(luò)安全產(chǎn)業(yè)高質(zhì)量發(fā)展。
春秋AI大模型測評「數(shù)字風洞」平臺是永信至誠針對通用大模型產(chǎn)品綜合能力測評打造的技術(shù)平臺。平臺以春秋AI大模型為核心,基于動態(tài)問題檢測與海量測試題庫,能夠針對大模型的智能度、安全度、匹配度三個維度進行能力測試,精準評估大模型在智能水平、應對安全攻擊以及任務匹配上的表現(xiàn),幫助用戶識別潛在風險并優(yōu)化系統(tǒng)性能。
智能度測評:平臺針對不同場景下的任務表現(xiàn)進行智能性測試,涵蓋基礎(chǔ)認知、邏輯推理等方面,衡量模型在復雜任務中的認知能力,并支持與市面主流大模型進行智能水平的橫向?qū)Ρ葴y評;
安全度測評:平臺從攻擊者視角出發(fā),基于安全行業(yè)垂直語料數(shù)據(jù)集和測試載荷,實現(xiàn)對通用大模型基礎(chǔ)設(shè)施安全、內(nèi)容安全、數(shù)據(jù)與應用安全等方面深度體檢,及時發(fā)現(xiàn)AI大模型的脆弱性及數(shù)據(jù)缺陷;
匹配度測評:平臺通過對AI大模型在特定應用場景下的任務執(zhí)行效果進行深入分析,確保模型的輸出與業(yè)務需求匹配,避免大模型在應用過程中偏離業(yè)務目標或在關(guān)鍵任務中失效。
隨著AI等新技術(shù)在各行業(yè)的廣泛落地,安全風險與能力評估的需求也不斷攀升。作為數(shù)字安全測試評估賽道領(lǐng)跑者、網(wǎng)絡(luò)靶場和人才建設(shè)領(lǐng)軍者,永信至誠依托「數(shù)字風洞」產(chǎn)品體系,持續(xù)為行業(yè)用戶提供專業(yè)測評服務和專有人才支撐,推動新技術(shù)與新產(chǎn)品安全應用,共同助力行業(yè)生態(tài)健康發(fā)展。
評論