人工智能在 2017 年中的表现是不平凡的,国务院关于印发《新一代人工智能发展规划》的通知、工业和信息化部关于印发《促进新一代人工智能产业发展三年行动计划(2018-2020)》的通知,明确我国新一代人工智能发展的指导思想、战略目标、重点任务和重点支持行业、重点应用。业内信息技术发展趋势的指向标 Gartner 发布2017新兴技术成熟度曲线,认为未来10年,人工智能将成为最具颠覆性的技术。DeepMind发布最新成果 AlphaGo Zero将 AlphaGo、Master 远远甩在身后,让人工智能在大众心中也留下了浓重的一笔。
AI 也搅动了安全行业的“一池春水”。不过,在启明星辰集团助理总裁、核心研究院院长周涛看来,对AI 的一些误解也可能让人工智能搅乱网络安全。以下内容为周涛在北向峰会上的演讲精要。
一、安全行业对人工智能理解的误区
人工智能的前景很大,现在政策已开始推动,相关分析机构的行业预测都给了市场信心,但在刨除火热的概念,从应用场景的角度出发,业内对人工智能的理解是存在一些误区。
目前行业对人工智能理解上主要有三大类误区,第一大误区是认为人工智能等于深度学习,好像深度学习能够一统江湖,而传统机器学习应用不算人工智能。事实上深度学习并不适合所有的应用场景,深度学习只是人工智能领域分支之一。
第二大误区——削足适履,放弃安全领域的经验积累,生搬 NLP、图像识别领域的成功用例。但实际上攻防对抗会导致检测对象的统计特征失效,NLP等领域算法完备性不强,与此同时深度学习的黑箱特性导致检测结论可解释性低。
对网络安全应用环境的复杂性估计不足是第三大误区,某些时候人们往往会以AlphaGo、图片识别、机器翻译等其他领域的成功经验,乐观预测网络安全领域的应用前景,而忽略了同图片识别、机器翻译等典型人工智能应用相比,网络安全分析的人工智能应用环境复杂度更高。
二、如何在在安全业务中应用 AI
首先,要认清上限。以深度学习为例,其本质上是一种基于统计的学习方法,可适用的场景是相对模糊、非精确匹配,比如垃圾邮件识别、恶意域名识别、异常行为检测。相反像二进制级恶意代码识别和数据包特征识别这类需精确匹配的场景就不太可能适用。
其次,了解局限。学习类算法对于判断结果往往无法给出精确解释,传统特征匹配虽然对未知威胁几乎没有检测能力,但对已知威胁的检测结果的解释性最强。深度学习对未知威胁的检测能力较强,但检测结果的可解释性最差,因此不同的场景、不同的业务,要用适合的检测方法。
最后,要跳出深度学习的束缚,考虑人工智能领域其他的技术流派。深度学习适合的是解决“知其然,不知其所以然”的问题,但现阶段对于网络攻击,我们是可以通过了解攻击手段,而了解如何预防的。即对于网络安全分析,一旦“知其然”,就基本“知其所以然”。人工智能领域符号主义的技术流派,在网络安全分析中的价值可能会更大。