人工智能在网络流量安全智能分析系统中实现和验证人工智能

本文主要对网络流量安全智能分析系统中的AI关键技术应用及系统的实现和验证进行全面的阐述。本文通过研究实时流量的采集、存储、分析过程,构建安全数据分析模型,将智能化的分析方法应用到网络流量采集与分析中,提高网络威胁与违规行为的精准识别研判能力,从而能够及时发现并追踪溯源潜伏周期更长、攻击手段更加隐蔽的威胁,为应急响应与预警处置提供有力的数据支撑。

1AI在安全领域的应用

AI在安全领域的应用是当前国内外企业技术创新和应用创新的重点。中国工程院院士方滨兴指出了新技术和安全之间存在的两种关系:第一种是新技术服务于安全即新技术赋能安全,既可以服务于防御,也可以服务于攻击;第二种是新技术引入新的安全问题,即新技术和安全是伴生关系。AI作为新技术,既可以赋能网络安全,提升网络防护能力,也可以被恶意利用,增强攻击性和破坏影响力。同时,AI技术自身存在脆弱性,如果被攻击者利用,可能会引发新的安全风险。

2AI在安全领域应用的现状

3AI在网络流量智能分析中的应用

3.1系统功能架构

通过对积累的异常行为和网络攻击的数据特征进行深入研究,将研究结果用于网络流量深度检测,可以突破目前的瓶颈,增强对未知威胁的识别能力和上报能力。按照流程,网络安全流量智能分析系统需将采集到的数据进行处理后入库,然后从数据库中提取要分析的数据,使用智能分析模块进行分析,最终提供异常行为监测、威胁监测,以及数据共享配置管理。系统功能架构如图1所示。

图1功能架构

3.2系统软件架构

按照体系架构的设计,软件实现上划分为数据采集、数据汇入、存储计算、数据智能分析、安全应用5个部分。软件架构如图2所示。

图2系统软件架构

数据采集层通过探针实时接收全流量数据,并实时进行流量智能识别。收集到的数据,通过数据接入接口,进入数据汇入层。在数据汇入层实现数据的预处理、数据入库,并进行相应的数据治理,比如提供数据源的管理和监控。

存储计算层,提供分布式的存储与计算环境,以及资源调度机制。

数据智能分析层可以提供检索分析、智能安全分析和调查分析。其中的智能安全分析,可以在智能模型的基础上,提供关联分析、深度分析、行为分析、机器学习等分析类型。同时可以对模型进行统一的任务管理、调控和智能修正等操作。

安全应用层使用基础的智能分析工具,提供专项监测,如异常行为监测、威胁监测、安全监测,并提供数据共享的配置管理。

3.3系统关键技术

网络流量安全智能分析中,主要结合并应用的AI关键技术如下文所述。

3.3.1基于自学习的网络威胁特征轮廓扫描技术

流量自学习扫描是为了扫描出正常状态下的网络基线,在流量学习中最重要的是学习配置结构。学习配置结构是描述学习方式及学习结果应用方式,主要包含配置学习周期时长、学习次数(包括无限次)、扫描策略生成方式、扫描策略自动生成条件等。

3.3.2隐蔽恶意流量检测技术

很多恶意攻击者对安全规则、内控措施非常了解,他们很清楚哪种操作实施到哪种程度会触发报警。因此,恶意人员会通过降低非法操作行为的次数和规模,潜藏在正常流量中以避免被传统安全系统检测到,达到隐蔽攻击的目的,而传统的检测方式难以检测此类隐蔽威胁。隐蔽恶意流量检测技术通过利用长周期分流量行为进行构建,将行为特征进行横向与纵向对比,检测长期低频等隐蔽恶意流量行为。

3.3.3基于隐马尔科夫的行为序列建模技术

基于隐马尔科夫的行为序列建模技术首先提取网络流量数据中的行为特征作为当前被检测用户的行为特征;其次提取训练序列的行为特征,建立正常序列库,并训练序列的马尔科夫链状态集,计算该马尔科夫链状态的转移概率矩阵,以此来描述用户的正常行为;最后将被检测用户的行为特征与历史行为特征进行对比,判断当前行为是否为异常行为:如果两者的偏离超过一定阈值,则认为是异常的;如果两者的偏离在正常范围内,则认为正常。

3.3.4异常登陆行为检测技术

针对账号的异地登陆、频繁登陆进行检测,通过对安全域过滤、维度过滤、条件过滤等算子的研究,对异常登陆行为进行识别。

3.3.5恶意链接检测技术

常见的网络攻击中,恶意链接经常扮演着重要角色,并被广泛应用到各种类型的攻击中,如钓鱼、垃圾邮件、SQL注入以及恶意软件。传统的识别方法是基于黑名单检测和规则检测,但黑名单具有漏判严重、时效性低的缺点,而规则检测容易被攻击者绕过。恶意链接检测技术基于机器学习算法,通过分析恶意链接的特点提取关键特征进行训练,可以弥补黑名单和规则检测的不足。

3.3.6基于大数据的分布式关联分析技术

将异常流量、异常行为、潜在威胁等分析结果作为输入数据的同时,接入各种其他类型的数据,如安全日志、流量数据、资产数据、漏洞数据、威胁情报数据等,并使用基于大数据的分布式关联分析技术、图计算技术等,实现追踪溯源,以及实现高级持续性攻击、定向攻击等场景分析。

4系统的实现、演示和验证

4.1演示验证环境

为了验证网络流量安全智能分析系统的数据采集、存储、深度分析、智能识别威胁和实时监测异常流量的能力,需对网络流量安全智能分析系统进行功能验证与安全场景的演示验证。网络流量安全智能分析系统在实际验证过程中,部署于单位网络出口处。网络流量安全智能分析系统在演示验证环节,使用系统最小部署模式,如图3所示。

图3网络流量安全智能分析系统演示验证部署

4.2系统分析模型

通过针对网络特点进行安全场景的构建和对数据分析模型的研究,并综合运用通用的智能分析方法和威胁识别技术,如表1所示,构建了网络流量安全智能分析系统中常用的网络安全场景下的数据分析模型、实现思路和运用的智能算子的对应关系。

表1数据模型、实现思路和运用的智能算子对应表

4.3关键指标验证

5应用场景

本系统的研究成果可应用于以下场景:(1)面向大规模网络的全维流量智能分析。可进行分布式的、多网络节点的全维流量采集,由系统生成分析模型,自动感知网络明文流量中的异常行为、异常流量并及时报警,识别非法应用协议、网络攻击行为,提升用户应对应用系统异常行为的处理效率。(2)面向网络空间作战的未知威胁深度检测。利用该系统可提升未知威胁的发现能力,并且可以灵活扩展威胁识别算法,从而提高检测的准确性,并能够告警上报未知的恶意代码和异常行为。(3)面向高级持续性威胁的网络攻击溯源分析。系统使用智能化的数据模型从全流量数据中分析出攻击者的路径和所处的攻击阶段,对持续性威胁进行追踪和溯源分析。(4)全局网络安全预警。系统可对网内各个关键节点中的潜在恶意行为、攻击行为综合监测,对监测结果及时响应和上报,通过协同防御手段进行安全预警,实现全局防护。

6结语

本文将智能化分析方法应用到网络流量采集与分析中,可以提高复杂网络的实时监测能力,提高网络威胁与违规行为精准识别研判能力,能应对潜伏周期更长、攻击手段更加隐蔽的威胁。本文设计的网络流量安全智能分析系统能够及时发现安全威胁并追踪溯源,可以为应急响应与预警处置提供有力的数据支撑。本文方案的应用目标是达到网络流量分析的智能化,通过建立网络流量安全智能分析模型,自动感知网络明文流量中的异常行为、异常流量并及时报警,识别非法应用协议、网络攻击行为。

THE END
1.2024最全大数据学习路线(建议收藏)注意:在这个阶段,Scala 语言可以先不学,可以在学习 Spark 之前学习! 数据结构与算法:强烈推荐左神的视频,他讲的内容基本上和企业面试相关,通俗易懂。我当时看的是一个在牛客网上讲视频:其中包括算法初级和进阶。在听这个视频前,最好去了解下基本的数据结构!可以从下面百度网盘中获取视频资料和课件!看完视频后,具https://blog.csdn.net/2401_84181801/article/details/138851968
2.从零开始学大数据15让你一看就懂的数据挖掘四大经典算法上一讲,我们从流程上介绍了数据挖掘,而在整个数据挖掘实施的流程中,数据挖掘算法可能是我们的算法工程师最关注的环节。在常见的数据挖掘过程中,通常会用到什么类型的算法,不同的算法又应对什么样的问题?在实际工作中遇到的问题,该如何转化成算法可解决的问题呢?带着这些疑问,让我们开始这节课吧。 数据挖掘算法有什https://zhuanlan.zhihu.com/p/550336239
3.最全解析:大数据和机器学习有什么区别小码哥0520大数据的核心是利用数据的价值,机器学习是利用数据价值的关键技术,对于大数据而言,机器学习是不可或缺的。相反,对于机器学习而言,越多的数据会越 可能提升模型的精确性,同时,复杂的机器学习算法的计算时间也迫切需要分布式计算与内存计算这样的关键技术。因此,机器学习的兴盛也离不开大数据的帮助。 大数据与机器学习两者https://www.cnblogs.com/kylinsblog/p/7760256.html
4.经验之谈:零基础学大数据算法怎么学?六年码农告诉大家,零基础学大数据算法怎么学?零基础学大数据算法怎么学?现在学习大数据的人越来越多,如果你有编程基础,自学也是可以的。但如果你是零基础的学员,建议跟着专业老师进行系统学习,能够更快的掌握专业知识,具备足够的能力,那选择报班的帮助作用会更大。机构有专业的老师,有系统的课程安排,学起来要https://baijiahao.baidu.com/s?id=1782011330946569097&wfr=spider&for=pc
5.不懂这25个名词,好意思说你懂大数据?本文先介绍了25 个基本大数据术语,帮助你温故知新,那么开始吧~ 01 算法(Algorithm) 算法可以理解成一种数学公式或用于进行数据分析的统计学过程。那么,「算法」又是何以与大数据扯上关系的呢?要知道,尽管算法这个词是一个统称,但是在这个流行大数据分析的时代,算法也经常被提及且变得越发流行。 https://gxq.guiyang.gov.cn/zjgxq/zjgxqxyzs/zjgxqxyzsdsjqy/201710/t20171013_17120534.html
6.量子计算应对大数据挑战:中国科大首次实现量子机器学习算法中国科学技术大学潘建伟教授及其同事陆朝阳、刘乃乐等组成的研究团队在国际上首次实现量子机器学习算法。日前,国际权威物理学期刊《物理评论快报》发表了这一论文[Phys. Rev. Lett. 114, 11050https://news.ustc.edu.cn/info/1055/56642.htm
7.观点有一种说法,算法工程师的薪酬只有三档(附大数据工程师本文从当前炙手可热的算法工程师就业开始讲起,详细的和朋友们探讨一下,普通程序员如何转型成为算法工程师? 先谈钱。 有一种说法,算法工程师薪酬区间基本就是三挡: 薪酬范围人才背景能力特征 15~30W科班毕业的数学系硕士研究生或有ACM铜奖以上熟悉通用的模型,知道如何用合适的模型去做数据 https://blog.itpub.net/69903766/viewspace-2286314/
8.人工智能的深度学习算法建立在大数据的基础上目前人工智能的深度学习算法是建立在大数据的基础上的,人工智能在工作过程中首先要对大数据进行挖掘,然后再利用大数据训练人工智能模型。 对于图片数据来说,这一工作说起来好像很简单,但实际上整个工作过程并不智能,这背后隐藏着一个赚钱十分辛苦而且工作内容非常枯燥的劳动密集型的产业。 https://m.hqew.com/tech/fangan_2009016
9.大数据学习心得(通用16篇)10月23日至11月3日,我有幸参加了管理信息部主办的“20xx年大数据分析培训班”,不但重新回顾了大学时学习的统计学知识,还初学了Python、SQL和SAS等大数据分析工具,了解了农业银行大数据平台和数据挖掘平台,学习了逻辑回归、决策树和时间序列等算法,亲身感受了大数据的魅力。两周的时间,既充实、又短暂,即是对大数据知识https://www.ruiwen.com/xuexixinde/5805944.html
10.科学网—[转载]联邦学习算法综述关键词:联邦学习;算法优化;大数据;数据隐私 论文引用格式: 王健宗,孔令炜,黄章成, 等. 联邦学习算法综述[J]. 大数据, 2020, 6(6): 64-82. WANG J Z, KONG L W, HUANG Z C, et al. Research review of federated learning algorithms[J]. Big Data Research, 2020, 6(6): 64-82. https://blog.sciencenet.cn/blog-3472670-1280769.html
11.新手学大数据技术,可以按照什么样的流程来学习?很多人了解到大数据发展的前景和空间很好,适合发展自己的职业生涯,那么零基础的新手想转行学习大数据,可以按照什么样的流程来安排学习呢? 1、首先,0基础入门大数据,先从一门编程语言入手。如果你想往大数据开发方向走,学习Java,想学数据分析或者数据挖掘,那就选Python。 https://cloud.tencent.com/developer/news/596827
12.机密计算差分隐私全搞清楚了!亿信华辰同态加密是一种允许在加密之后的密文上直接进行计算,且计算结果解密后和明文的计算结果一致的加密算法。 这个特性属性对于保护信息的安全具有重要意义,利用同态加密技术可以先对多个密文进行计算之后再解密,不必对每一个密文解密而花费高昂的计算代价;利用同态加密技术可以实现无密钥方对密文的计算,密文计算无须经过密钥方https://www.esensoft.com/industry-news/dx-5995.html
13.大数据常用分聚类算法区别大数据聚类分析方法大数据常用分聚类算法区别 大数据聚类分析方法 1.聚类的基本有关概念 聚类分析:将物理或抽象对象的集合分成相似的对象类的过程称为聚类。 簇:数据对象的集合,对象与同一簇中的对象批次相似,而与其他簇中的对象相异。 无监督学习:没有事先定义好的类 典型应用:①作为获得数据集中数据分布的工具②作为其他数据挖掘https://blog.51cto.com/u_16099196/10583387
14.大数据&人工智能学习总结(一)·学习地图虽然在理论研究上没进展,但是自从有了大数据和规模运算能力之后,就对人工智能有了更具体的应用上的诉求:如何用机器对数据进行识别、提取和分析?对应到的技术就是人工智能中的一个分支叫“机器学习”,即从数据中习得学习算法,进而解决实际的应用问题。 认知4:机器学习是怎么工作的 https://www.jianshu.com/p/a77951458d43
15.深度学习高手笔记卷1:基础算法本书通过扎实、详细的内容和清晰的结构,从算法理论、算法源码、实验结果等方面对深度学习算法进行分析和介绍。本书共三篇,第一篇主要介绍深度学习在计算机视觉方向的一些卷积神经网络,从基础骨干网络、轻量级 CNN、模型架构搜索 3 个方向展开,介绍计算机视觉方向的里程碑算法;第二篇主要介绍深度学习在自然语言处理方向的https://www.epubit.com/bookDetails?id=UB7d8623610d375
16.零基础学大数据算法高清pdf完整版[98MB]电子书下载零基础学算法下载 投诉报错 书籍大小:98.2MB 书籍语言:简体中文 书籍类型:国产软件 书籍授权:免费软件 书籍类别:其它相关 应用平台:Windows平台 更新时间:2019-08-30 购买链接:京东异步社区 网友评分: 360通过腾讯通过金山通过 98.2MB 详情介绍 《零基础学大数据算法》是通俗易懂的大数据算法教程。通篇采用师生对话的https://www.jb51.net/books/690828.html
17.大数据分析建模有哪些算法帆软数字化转型知识库大数据分析建模有多种算法,包括决策树算法、支持向量机(SVM)算法、随机森林算法、K-means聚类算法、线性回归算法、逻辑回归算法、神经网络算法和贝叶斯分类算法。其中,决策树算法是一种使用树状模型对数据进行分类和回归的方法。决策树算法通过递归地将数据集分成更小的子集,同时相应地构建树结构,使其能够对未知数据进行https://www.fanruan.com/blog/article/71906/
18.干货一文读懂工业大数据的算法与模型基本知识与应用工业大数据分析面对的数据不仅包括传统统计学中的结构化数据,也包括非结构化和异型数据。 传统的统计学方法在对大规模数据进行处理时的效率较低,因此神经网络和遗传算法等机器学习和人工智能算法是工业大数据经常采用的方法。 常见算法及分类介绍 01.预测算法 https://www.evget.com/doclib/s/14/10645
19.cv算法工程师和大数据工程师有什么区别3、负责虚拟数字人驱动相关算法的研发工作,包括但不限于视频生成(动作、表情、口型)对话机器人等方向; 4、基于图形学,深度学习等技术进行模型训练以及性能优化,将前沿算法理论转换为原型并落地产品,达成业界竞争力目标。 职位要求: 1、计算机、数学、统计学或相关专业,有数字人直播方向的项目研究方向优先; 2、https://www.jobui.com/gangwei/pk/cvsuanfagongchengshi-dashujugongchengshi/
20.大数据处理的五大关键技术及其应用——CDA人工智能学院数据挖掘算法。图像化是将机器语言翻译给人看,而数据挖掘就是机器的母语。分割、集群、孤立点分析还有各种各样五花八门的算法让我们精炼数据,挖掘价值。这些算法一定要能够应付大数据的量,同时还具有很高的处理速度。 预测性分析。预测性分析可以让分析师根据图像化分析和数据挖掘的结果做出一些前瞻性判断。 https://bbs.pinggu.org/jg/kaoyankaobo_kaoyan_8513784_1.html