轨迹数据就是时空环境下,通过对一个或多个移动对象运动过程的采样所获得的数据信息,包括采样点位置、采样时间、速度等,这些采样点数据信息根据采样先后顺序构成了轨迹数据。例如具有定位功能的智能手机,轨迹数据反映了手机持有者某一时间段的行动状况,移动互联网络可以通过无线信号
定位手机所在位置,进而采样记录,通过连接采样点形成手机持有者的运动轨迹数据;GPS定位终端,固定采样频率的记录终端所在位置的经纬度信息,通过无线网络将数据收集到服务器上;RFID标签技术,对物体进行标记,将物体的移动线路通过RFID识别器完成定位和位置数据记录,形成物体的移动轨迹。
轨迹挖掘是数据挖掘的一个新兴分支,其研究热点集中于轨迹聚类、轨迹分类、离群点检测、兴趣区域、隐私保护、位置推荐等方面。如果将时间看做是一维数据,大多数传统高维数据聚类算法可以很好的适应于当前的轨迹聚类。多维数据距离测量和有效计算方面的研究已经展开。将轨迹数据看做为混合约束模型生成的有序点序列,并应用统计学方法进行研究也已展开。而所有这些轨迹聚类方法都是以轨迹作为整体进行的,并没有对子轨迹聚类给及足够重视。韩家炜教授提出一种“划分-合并”聚类模型,试图解决这个问题。该模型首先将轨迹划分为多条轨迹段,之后对这些轨迹段进行密度聚类。聚类结果中,除去聚类簇以外,还获得大量的离群点。这些离群点一般来讲,都远离任意一个聚类簇中心。最近,针对更加复杂情况下的聚类方法也被提出,比如多维信息集成和离群点检测方法等。当前,虽然有大量聚类和离群点检测算法,但应用于移动对象模式的分类算法还不是很多。在根据时间序列分类的关联区域研究中,单一最近邻对象方法得到了广泛的应用,而一种基于Shapelet的分类方法也被证明非常有效。时间序列研究主要用于解决一维数据,而移动对象分类研究面对的往往是二维空间数据,所以前者的研究方法应用于后者有一定的局限性。基于区域和轨迹聚类的分类方法,将区域和聚类结果作为轨迹的特征进行分类研究,可以得到更为有效的结果。