4 建模算法 以面向对象数据模型为导向,通过数据预处理导入基础数据源——“基站数据”,对数据进行标准化建库处理,按照模型结构体系建立空间数据库,通过邻区分析运算、邻区站间距运算、泰森多边形运算获取全网站点、邻区多边形、邻区多边形重心、邻区站间距数据以及泰森多边形数据成果,对初次获取的数据成果进行二次分析利用,通过泰森多边形对资源站点实施检索,关联邻区站间距离构建资源站点的邻区站间距离数据,再利用聚合统计算法对邻区站间距离、资源站间距离进行运算以获取站间距离的统计数据。 4.1 邻区分析算法 邻区分析算法的关键是狄洛尼三角网方法的应用,狄洛尼三角网是泰森多边形的对偶图,通过判读离散点位的最邻近信息将空间划分为若干单元区域,是对空间邻近原则的一种剖析方式。对基站建立的狄洛尼三角网具备以下特征: 三角网中每一个三角形端点分别对应了一个基站站点; 三角网中每一段边线(三角形边线)连接了最邻近站点。 根据上述特征,三角网数据中可扩展获取4种信息,分别是基站相邻关系、邻区范围、邻区范围重心以及相邻基站距离,这些信息可从邻域形态、邻区距离的角度辅助分析选址合理性。数据提取算法主要有三角网数据处理、邻区多边形构建及重心提取、邻区站间距离运算三个环节。 (1)三角网数据优化 由于边缘区域缺少邻接点控制,三角网数据边缘出现拉伸变形的三角形,此类三角形不能正确地反映邻区信息。需要对三角网进行边缘优化,这既能保证三角网的完整性,又能正确反映邻区信息。采用叠置分析中的裁剪运算,结合关联对比获取三角形在行政区内的面积比例,设置选取比例容限值,清除小于容限值的三角形对象。 设A为行政区面,T0为初始三角网,T1为行政区对初始三角网裁切后的数据,T1=T0-A,r1i为T1中的多边形T1i(T1i∈T1)的面积,r0i为T1i被裁剪前的三角形T0i(T0i∈T0)的面积,采用公式r0i_ra=(r0i-r1i)/r0i计算T0i在行政区内面积比例,设置面积比例的选取容限值x,在T0中清除r0i_ra (2)邻区多边形构建及中心点提取 以站点数据为运算单元,利用三角网节点与站点重合的特征,通过叠置运算、空间融合运算获取站点邻区多边形数据,再对其进行重心提取,获取邻区多边形重心。 目标站点B对三角网数据T采用一对多的点-面合成叠置运算获取三角形集合T2(T2T),对T2根据站点编码信息执行融合运算,对同一站点对应的的三角形进行合并,产生站点的邻区多边形数据N,对N执行重心提取运算,获取邻区多边形重心P。 4.2 邻区站间距运算 邻区站间距的数据等同于三角网T的边线数据,对T提取边线D0,D0对站点集合B采用一对多的叠置运算获取边线D1(D1D0),D1存在重叠,D1中的每一组重叠线分别记录了两端的站点编码。D1分两路展开运算,一方面,对D执行空间融合运算,融合过程采用取最大、最小值的统计方法,在合并线的同时,将线首尾结点对应的站点编码(b1,b2)一并记入距离线对象中,获取邻区站间距离D,保证线对象的空间唯一性,也获取了对应的站点编码信息;另一方面,对D1根据站点编码一致性进行距离的数据统计,获取每一个站点Bi与邻区站点集合B1i={B1i1, B1i2, B1i3, …, B1ix}的距离汇总信息,包含平均值Di_avg、总体标准差Di_sd(视为偏离值,单位为m),为了增加偏离信息的可读性,以Di_avg为标准值,采用Di_sd /Di_avg方式计算站点Bi的距离偏离度Di_sdd(单位为%)。 4.3 泰森多边形运算 泰森多边形常用于模拟基站覆盖范围,对目标站点B执行泰森多边形运算,获取B的泰森多边形S,S继承B的站点编码,采用点被面包含的拓扑特征,用全网站点Ba(BaB)对S执行叠置运算,对Ba中的每一个站点Bai映射包含自身的Si(Si∈S)的编码,通过判断Ba编码与S编码的一致性,区别泰森多边形覆盖区域中的目标站点Bi与资源站点B2i集合,统计Bix集合的数量,作为B面向泰森多边形覆盖范围的资源站点数量。泰森多边形成果及应用示例如图4所示。 4.4 资源站点邻区间距离运算 邻区分析算法与泰森多边形算法已获取了邻区信息与资源信息,通过对成果的进一步利用,可获取资源站点邻区站间距离,通过对目标、资源站点与邻区站点距离统计成果的对比,辅助评估目标区域的资源可利用性。 (1)算法思路 资源站点邻区站间距离运算原理是筛选出包含有资源站点的泰森多边形数据,检索区域内的资源站点以及邻区站间距离数据,复制站间距离数据作为新的线状对象,把线元素中与目标站点一致的结点修正为资源站点的坐标,从而获取资源站点与目标邻区站点的距离线,再对该线型数据赋予目标站点、资源站点、线结点对应的站点、长度信息,构建资源站点邻区站间距离建库数据。为了保留目标站点信息、资源站点信息与线型结点对应的站点信息,设置线对象具备有向性特征,起点编码统一设置为资源站点编码,终点编码对应线型另一端站点编码,另设目标编码指向目标站点信息,此设置有利于实现面向目标站点进行资源站点邻区距离的汇总运算,扩展多维度的数据挖掘空间。 (2)运算步骤 算法设计存在三重循环嵌套关系,依次是泰森多边形(S)→资源站点(B2)→邻区站间距离(D),对成果进一步组合运算,获取新的数据资源,主要步骤如下: 1)从S中提取资源站点数量大于0的泰森多边形S1(S1S),循环获取S1i(S1i∈S1)的编码x(泰森多边形的编码规则决定了x等同于目标站点编码); |