识别与控制
电子科技术语
识别又称归类和定性,广泛应用的有模式识别。识别是信息科学和人工智能的重要组成部分。
DPI与DFI流量识别与控制系统的设计
以高性能的流量识别与控制技术为主要的研究对象,在深入分析现有流量识别与控制技术的基础上,对使用DPI(Deep Packet Inspection,深度报文检测)技术与DFI(Deep Flow Inspection,深度流检测)技术相结合的流量识别技术及更快速的流量控制技术进行了详尽的讨论和研究,并设计和实现了基于以上这些技术的流量识别与控制系统。
系统架构设计
系统分为前台和后台两个部分,后台负责数据包的识别和处理,并对处理情况作记录,由特征库、流量识别模块、数据库模块、流量控制模块,日志模块五部分组成;前台负责下发用户策略,及流量识别与阻断情况。
系统各个模块之间的交互关系如下:获取所有经过服务器的数据包并进行解析,将数据包的应用层负载、包长、发包频率,发包方向等信息进行记录,并传入流量识别模块。在此之前,识别模块载入特征库,通过模式匹配的方法得出识别结果,同时将识别结果存入数据库,将数据包及识别结果送入流量控制模块,流量控制模块将数据库模块中的识别策略取出来,根据策略决定数据包下一步的处理方式。
前台
前台提供了系统的显示功能,主要实现三个功能:用户登录、导入特征库、用户下发策略、查看流量识别及控制情况。
用户下发策略,用户可以选择受控主机的IP地址,控制的协议,及控制类型(阻断或是干扰),若是限流则填入限流的速率。然后,前台将策略信息存入数据库中。查看流量识别及控制情况,通过前台用户可以看到实时流量识别结果,及协议对应的流量大小,占总流量的百分比等信息。与前台有交互关系的模块只有数据库模块,前台只需要将用户策略存入数据库中,同时可以将数据库中存储的流量识别与控制数据在前台显示。
流量识别模块
流量识别模块的功能是将通过流量识别模块的流量分类识别,最终确定每条流对应的协议及应用。介绍了多种流量识别技术,这里需要根据流量的特点选择不同的识别技术,有些协议通过与存储在特征库中的规则进行模式匹配就可以识别出来,有些协议需要考虑包长,发包速率,或是对负载内容进行深度解析,如提到的应用层网关识别技术,要为这些协议提供针对性的代码识别方法。为了更好的达到识别效果,采用DPI与DFI两种技术进行流量识别,并采用四种不同的识别引擎,并在识别引擎中加了代码识别的接口。数据流通过流量识别与控制系统时,识别引擎将捕获的数据包一层层剥离开,将应用层负载的内容或流特征与特征库中的内容进行模式匹配,从而得到识别结果。
流量识别模块为系统的核心模块,与流量识别模块有数据交互的模块也较多,分别为特征库,流量控制模块,数据库模块。
综合特征的阶流量识别与控制系统
提出的系统解决方案就是针对运营商的迫切需求而设计的,通过对P2P业务识别与控制设备现网测试、P2P流量管控策略和实施步骤的研究,综合当前主流管控技术的优点,即DFI识别技术的高效性和DPI识别技术的精细性,提出更高效的管控系统的设计方案。系统重点在于通过流的行为来感知用户,感知网络,提供灵活的控制策略,以确保各种服务都能获得所需的最佳带宽;同时系统还可以对P2P流使用DPI技术进行精细识别,提高了系统的识别能力,以实现网络的“按需分配”,迎合运营商未来精细化运营的迫切需求。
P2P流量识别与控制系统定义和功能
P2P流量识别与控制系统是为运营商解决前述问题所出现的具有高数据流处理能力的,能够进行业务识别和流量管理的,可部署在IP网络的骨干层、城域网和企业内部的网络设备。
主流的P2P流量识别与控制系统是依据“基于数据流状态(包括数据流行为和数据流特征)的深度报文检测”技术,工作在OSI模型4层(传输层)到7层(应用层)的一类业务识别和流量管理设备,应具备如下功能:
对数据流的四层信息(协议、端口号)进行检测识别;
对数据流的七层信息(类型、特征、内容)进行检测识别;
对数据流的特定封装进行检测和识别,如VLAN(Virtual Local AreaNetwork,虚拟局域网)、 PPPoE(Pointto Point Protocal ove Ethernet,以太网点到点协议)、MpLS/VpN (Multiprotocol Label Switching/Virtual private Network,多协议标记交换的虚拟专有网络)等;
对数据流实施流量管理功能(丢弃、整形和QoS保证);
用户行为分析;
网络流量统计(类型、行为、趋势);
高数据流处理能力。
P2P流量识别与控制系统主要解决了传统的二、三层设备(如路由器、交换机和宽带接入服务器等)无法对7层应用进行检测的问题,是对传统的网络设备的一种补充和增强。
P2P流量识别与控制系统组成和应用前景
P2P流量识别与控制系统通常包括几部分功能模块:数据流识别模块、数据流控制模块、业务特征信息库、控制策略库、统计模块等。
1)数据流识别模块:即通过解析数据包的应用层协议或者分析数据流的行为特征或判断某些特征字的方式来识别数据流,其目的是区分宽带网络中混杂的数据流,并识别出某类业务的数据流,在此基础上才能完成对业务的下一步操作,是整个系统的核心之一。
2)数据流控制模块:是在识别出具体业务的基础上对某些业务采取相应的控制策略,比如为优先级不同的业务分配不同的带宽策略、直接阻断非法业务等等,最终实现网络服务差异化和公平化。
3)业务特征信息库:与数据流识别连接,存储和管理数据流识别过程中涉及的识别规则,提供实时业务识别功能的支持。业务特征信息库可实现于业务识别点内部,亦可单独实现。
4)控制策略库:是数据流识别模块和数据流控制模块之间的桥梁,存储和管理数量流控制过程中涉及的控制规则。控制策略库可位于业务控制点内部,亦可单独实现。
5)统计模块:统计模块是对系统实时和历史的数据流识别和数据流控制信息的呈现和保存,能够帮助用户更好的进行网络流量统计,网络流量趋势分析等。P2P流量识别与控制系统的基础是数据流识别功能,在识别的基础上进行数据流控制。P2P流量识别与控制系统能够二层透传的串联在链路中,也能够配置有三层IP地址串联在链路中;或者通过分流设备,将数据流量引入到系统。系统将数据流Hash到内部的多个通道中,由专用的芯片或者CPU,通过数据流识别技术对数据流进行并行检测识别,将识别结果放入到配置好的管道(Pipe)中,或者记录相关数据流的IP五元组和业务类型信息,这些信息将保存在后台数据库中,并以一定的形式(曲线、饼图、柱状图、表格等)呈现于管理界面上。策略控制库将配置发送给数据流控制模块,数据流控制模块根据接收到的控制策略,在识别结果中进行查找,然后根据控制策略进行数据流控制。
概括讲,P2P流量识别与控制系统有如下应用场景:
流量分析和网络规划;
网络资源管理;
抑制非法业务;
安全防护;
区分服务;
内容计费;
用户行为分析和增值业务;
用户定制服务等。
参考资料
最新修订时间:2022-08-25 16:06
目录
概述
DPI与DFI流量识别与控制系统的设计
参考资料