明敏 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
上一秒收到“XX信貸”得詐騙短信,下一秒警察蜀黍得溫馨提醒就到了。
如此迅速得出警速度,這背后其實還有AI默默助力。
只要NLP識別到用戶短信中得“客戶、拖欠、信貸”等關鍵字,手機中得反詐預警系統就會被觸發,用戶此時就能收到風險提醒。
維護網絡安全,AI已經成為了非常重要得角色之一。
該如何更好利用AI,是網安人員們現在更加得話題。
在CCF C3第八次活動中,來自學術界和工業界得科技大咖們就深入探討了這個問題。
這一次,他們齊聚綠盟科技,就知識圖譜與語義分析得關鍵技術及應用實踐,做了細致得分享交流。
讓網安知識沉淀下來在數字化變革越來越快得今天,網絡安全也顯得愈發重要。
從前,維護網絡安全依賴人工攻防對抗演練、依賴可能,可以知識沒有沉淀下來,技術發展也相對緩慢。
隨著網絡發展越來越快,數據量飛速增長、攻防對抗越來越頻繁,依靠人力顯然變得不再可行。
CCF CTO Club成員、綠盟科技集團首席技術官葉曉虎博士就表示:
在今天,網絡安全必須依賴人工智能技術!
而利用AI得關鍵,是對整個網絡環境中得知識整理。
由此,多源異構數據融合需求也變得非常迫切。
數據融合有助于數據得統一消費和利用,關聯復雜且隨時空演化得數據,找出隱藏在數據下得知識。
與此同時,還要從數據融合走向知識融合。
這將不同于傳統主要基于字符串得檢索,而是真正理解數據資源背后得知識。
如何做到這一點呢?
這就要依靠知識圖譜技術。
它可以自下而上自動挖掘知識,根據不同語義關系進行融合,一改從前過分依賴可能、應用封閉得局面。
讓知識真正沉淀下來,加速技術發展得速度,解決網絡安全人才得巨大缺口。
不僅如此,它還能讓安全分析變得更加智能,通過語義理解、動態關聯、智能檢索、機器推理等技術,自動獲取知識構建流程和技術。
從海量異構文件中三元組自動抽取,基于規則匹配或自然語言,根據模式庫、實體庫、安全語料庫作出判斷。
這在實際網絡安全中已經有了應用:
UC伯克利和清華大學就已經從GPT等預訓練模型中無監督地構建出知識圖譜。
無需人工進行額外訓練,只需語料和預訓練好得模型,就可以從頭建立出知識圖譜,甚至挖掘出人類發現不了得新關系。
事實上,用知識圖譜+人工智能構建新型網絡信息體系,在國外也早已經有相關項目。
美國已經啟動“深綠(Deep Green)”計劃以及Insight、XDATA等基礎智能技術研究項目,探索從文本、圖像、聲音、視頻等不同類型多源數據中自主獲取、處理信息、提取關鍵特征、挖掘關聯信息得相關技術,加速人工智能在軍事領域得應用。
具體到實際應用上,葉曉虎表示,我們可以通過半自動結合人工方式提升知識圖譜得自動化構建水平,助力安全分析實現認知智能,滿足語義理解、動態關聯、智能檢索和機器推理得業務需求。
只看一個日志就能解決問題事實上,攻防對抗變得更加高頻、激烈并不是危言聳聽。
今年5月,美國蕞大輸油管道被黑客攻擊中斷,17州陷入緊急狀態;
同月,比利時政府網站遭到大規模DDoS攻擊癱瘓。
面對這樣得惡意攻擊,除了做好防衛,事件后續溯源、取證和分析也至關重要。
但還是老問題,現在得網絡數據量太龐大了,每天都能生成百萬量級得日志。
靠人力肉眼來看?
非常不現實。
北京航空航天大學網絡空間安全信息學院信息對抗系系主任毛劍博士就表示:
通過系統,自動提取日志中得高階行為語義,并對語義進行量化聚類,提取表征性行為,可以大幅減少工作量。
通過語義提取,安全人員只需要在一個大類中看一個日志文件,有效避免了大量重復得查找工作。
雖然知識圖譜和語義分析能夠讓網絡安全維護變得更加智能,但在實際應用中還有很多亟需解決得問題。
活動現場,各位科技大咖就這些相關問題進行了深入探討。
如何應對碎片化知識給構建知識圖譜帶來得挑戰?這是知識圖譜得一個大難點。
中科院自動化所研究員、博士生導師趙軍就表示:
在信息表達層面來說,知識超越一切。
因此,在各個模塊上信息或許存在差異,但是知識不會。
知識圖譜本來得工作就是整合不同模塊、得信息,但是在具體情況中,如果信息有問題,那么在自動抽取過程中也會存在錯誤,知識圖譜得可信度就會大大降低。
面對這一問題,選擇合適得表示方式、圖譜算法,以及對應得技術和平臺非常重要。
而對于知識圖譜得實際應用,毛劍表示基于公開數據集構建得知識圖譜,實際得模型有時并不好用。因此生成圖譜后,再融合新得知識至關重要。
趙軍認為,必須補充新知識、淘汰舊知識。保持大得知識框架不變,不斷進行增量式學習,讓知識圖譜不僅僅是一個知識倉,也要進行自主進化。
浙江大學計算機科學與技術學院教授/博導陳華鈞則認為,知識圖譜在應用上很難有共性。很多工作和所在領域密切相關,必須要根據領域得特點來選定適合得圖譜,這是使用知識圖譜得一個準則。
CCF C3以上精彩內容,全部出自CCF C3得第8期活動,主題為“知識圖譜與語義分析”,由綠盟科技承辦。
C3活動是由華夏計算機學會CCF CTO Club發起得,旨在聯結企業CTO及高級技術人才和資深學者,每次以一個技術話題為核心,走進一家技術領先企業。
目前為止已經舉辦7期,承辦企業與主題分別是:
京東-智能客服;小米-智能家居;搜狗-深度語義學習與網絡搜索;百度-AI+開源;亞馬遜云科技-云計算;阿里巴巴淘系技術-內容化驅動;知乎-如何擁抱開源。
下一次活動將移步上海,由聯想上海承辦,具體時間是8月13日周五下午14:00-17:30。
— 完 —
量子位 QbitAI · 頭條號簽約
我們,第壹時間獲知前沿科技動態