电信网运营数据挖掘方法探讨
2022-12-23
来源:爱问旅游网
嚣 中国电信CDMA网络优化与运营”专题i; 电信网 挖掘方 魏鸿 马洁 中国 【摘要】文章首先阐述全业务运营对运营商的传统运营数据分析方法提出挑战,然后具体分析网络运营数据挖掘的工 作流程,并进一步提出其在寻找目标用户、新业务增长点等方面的应用思路。实践证明,该方法可在较短时间内向市 场、客服等部门提供有效信息,有力支持和推动业务发展,对电信运营管理有较高的参考价值。 【关键词】电信网运营管理数据挖掘用户行为业务增长点话务模型 全业务运营时代,三大运营商不断提升网络质量, 力图充分发挥全业务网络优势,针对不同用户群提供范 围更广、内容更丰富的业务,以提高用户满意度、增加 运营数据分析,如单纯的话务量、通话时长、掉话率等 的分析,无法满足要求。必须有新的分析方法为网络运 营提供更加丰富的信息支持,如哪些业务是热点业务、 哪些业务是僵尸业务,哪些用户是高流量用户、哪些用 户是休眠用户、不同业务的忙时时段分别是什么、不同 类型区域的话务模型有何差异、同种类型用户的使用情 况有什么不同等。 要解决上述问题,需要我们采用新的网络运行数 据分析挖掘方法。在正常情况下,虽然网络设备多种多 用户黏性,并进一步增加收益。本文重点研究了如何运 用数据挖掘的思路和方法,掌握不同网络的运行特点以 及不同用户群的业务使用特点等信息,来支撑网络的维 护管理、目标客户的发掘以及新的业务增长点的发现 等,从而提升运营效率和效果。 1全业务集中运营对信息的需求 目前,三大运营商均已在一定程度上实现全业务的 集中运营,如何利用新的网络架构和运营模式,及时掌 握各项业务的使用情况,挖掘新的业务增长点,快速锁 定目标客户,抢占市场先机,无疑是运营商迫切需要解 样,各个设备厂家的设计和实现方式也有所不同,但都 有最基本的业务使用记录数据,用户每使用一次业务, 就会在相应网络设备上留存有相关的记录。网络运营维 护部门掌握着大量的网络运行数据,包括用户的通话时 长、通话质量、接入地点、接入方式、使用的业务、使 决的问题。在这种情况下,传统基于网络网元的粗粒度 用的质量等,只是不同的设备,记录的范围和详细程度 略有差别。因此,只要确定了数据挖掘的目标,就可以 收稿日期:2011-05-30 从海量的网络运行数据中挖掘相应内容,然后通过分析 38 l 薯 ・:: 费仔编辑林菊tinjt{@n ̄bcorn.CR i“中国电信CDMA网络优化与运营”专题 i; 转换为有用的信息。 调整和优化数据挖掘分析方法。 网络运营数据挖掘工作过程详见图1。 2网络运营数据挖掘的方法 数据挖掘(Data Mining)就是“从存放在数据库、 数据仓库或其他信息库的大量数据中获取有效、新颖、 潜在有用的、最终可理解的模式的过程”。数据挖掘在 很多行业中都有应用,笔者从工作总结出电信网络运营 2、建立数据仓库,收集数据并 清洗 1、确定数据挖掘的目标 数据挖掘的过程,即从网络运营数据中获取有用信息的 闭环的工作过程。具体步骤如下: (1】确定数据挖掘的目标,即挖掘数据想要达到什 么目的。 (2)收集可用的数据源及相关资源,纳入数据仓 库,并根据需要进行数据清洗。为适应后期的数据挖掘 需求,必须事先建立全专业跨系统的集中的数据存储仓 库,并不断添加清洗后的数据。以加大wi~Fi业务发展力 度可能带来的影响的分析为例,其涉及到的原始数据就 包括分别从不同支撑系统获取的用户资料、wi—Fi网络设 备资料及业务使用量资料、用户wi—Fi业务使用详单等。 这些资料中,很多信息(如用户资料中的用户姓名、住 址等,用户wi—Fi业务使用详单中的通话参数等)对下一 步的数据分析来说,属于保密信息或无用信息,因此, 需要在数据入库前进行数据清洗,以提高数据查询速 度,降低数据复杂度,节省存储空间。 (3)确定数据挖掘的模型和算法。这一环节是数 据挖掘工作的核心,针对不同的数据挖掘目标和数据特 性,可以采用不同的挖掘算法建立模型,常用的挖掘分 析有相关分析、回归分析、时间序列分析、分类分析、 聚类分析等。不同的分析有不同的算法模型,如决策 树、神经元网络和回归等。在实际应用中,经常是根据 数据挖掘的目标以及数据的特征,综合使用上述多种建 模方法。 (4)抽取数据对所采用的模型和算法进行检验。如 果存在问题,继续步骤(2)~(4),直至获得预期结 果。 (5)使用校验后的模型和算法对运营数据进行挖掘 分析,并将分析结果发布展示给决策者。 (6)根据决策者对数据挖掘结果的使用反馈,继续 责任编辑.林菊linju@mbcom CR==:.==:.::: 3、确定数据挖掘模型和算法 4、校验数据挖掘模型和算法 5、发布运营数据挖掘分析结果 6、根据决策者反馈调整优化 分析方法 图1 网络运营数据挖掘工作过程 3几个有效的数据挖掘应用思路 按照上述方法,在电信网络中,可以通过对不同类 别用户的使用模型和使用量信息、不同网络和不同业务 的使用模型和使用量信息等进行细分,通过数据挖掘获 取有效信息。常用的应用思路如下: 3。1通过数据挖掘获取目标用户 从用户账单或单从用户业务清单进行分析,对目标 客户进行寻找、识别与分类的传统做法,已逐渐显出局 限性,而将多个维度的信息结合起来,效果要好得多。 运营商可通过支撑系统收集静态数据(如网络架构及位 置信息、用户的属性信息等)和动态数据(如用户使用 话音、数据、漫游、增值等业务的话单或清单等),然 后综合运用各种方法进行数据挖掘,获取相应的目标客 户。譬如,可通过话单筛选出只使用2G上网的用户并 进行流量分档,同时结合其使用地点的信息,进一步筛 选出移动性强、流量较高的用户,这类用户就是市场部 f'J3G业务营销的目标用户。又如对于某类用户行为特征 明显的地区,可在网络资源配置上给予不同的考虑。举 例,可以通过网元粒度的数据分析,筛选出3G网络中 高流量、高负荷的基站,结合用户上网清单,进一步找 秒201 1年第1蔫l1期l 39 u 珏 中国电信CDMA网络优化与运营”专题 ; 到通过该基站接入且使用业务量较高的用户,对其进行 络设备的数据采集粒度为1 5分钟及以上,特殊情况也会 使用更小的时间粒度,此处不讨论)、小时维度、日维 度、周维度、甸维度、月维度、季度维度、年维度等, 不同情况需要用不同维度的话务模型进行分析。另外, w{一Fi业务的宣传和营销,并根据其使用行为的变化,调 整3G基站和WiFi热点的资源配置,在改善用户业务体验 感受的同时,实现对资源的合理有效利用。 3.2通过数据挖掘寻找新的业务增长点 在全业务运营背景下,除了传统语音、数据接入 等简单业务竞争,增值业务的竞争日趋激烈,各种新 应用层出不穷,谁赢得 应用的竞争,谁就赢得 未来。在此种情况下, 节假日或者一些特殊事件发生日,由于其特殊性,一般 要单独建立相应的话务模型。图2是某地移动网平时及节 假日24/J',时话务模型,节假日话务明显增长,且话务高 ∞ 峰后移。 O 0 O 0 0 0 O 0 O 0 0 黝枷蜘 期 对新业务、应用增长点 的寻找和判断,尤显重 要,通过运营数据的挖 掘分析和获取信息就成 为一种必然。如将用户 稿 醇 4,- ̄B话务量趣甩)、5磷 -●・节信日话务量(ERL) 信息、应用类别、接入 方式、用户使用情况等 信息进行关联,对用户 进行分类,并分析出热门应用,然后对用户群进行有针 对性的宣传和推送,对白领推荐理财、休闲、新闻、微 图2 某地移动网络平时及节假日的24小时维度话务模型 (3)用户群维度。通过数据挖掘,把具有类似特 征的用户进行分群,进而建立针对各类用户群的话务模 型。 博等应用,对在校生推荐求职、游戏、交友等应用,对 月消费能力较强客户推荐交通视频、家居监控等应用, 诸如此类。再通过后续对用户使用行为的持续跟踪、分 析,比较与预期设计的差距,寻找影响用户行为的因 素,在网络、资源支撑能力上进行评估,不断进行动态 调整,就可实现运营商与用户的良性互动,形成新的业 务增长点。 除此之外,还有很多分析维度,如流量流向维度 (如长途、本地或漫游通话等,或者到电信、移动、联 通等不同运营商)、终端维度(如以常用的终端进行分 类)及接入方式维度(如使用2G接入方式还是3G接入方 式)等。 可以根据需求,在实际话务模型的建立过程综合 考虑从各种维度将搜集到的信息关联起来,进行数据挖 掘。例如,对不同业务或不同用户群,分区域建立日、 3.3通过数据挖掘多角度全面掌握话务模型 我们通常提到的某个网络的话务模型,并不仅仅是 一个简单的话务随时间变化的曲线图,对于覆盖范围较 周、月等时间维度的业务模型。图3是某两个业务的分地 区日维度业务量模型,其中X业务属于固定使用模式的业 务,每日业务量恒定,但不同区域业务量存在差异;Y业 务属于分散业务模式,工作日业务量变化不大,周末业 大的复杂网络,往往还需细化成多个维度进行分析。常 见的分析维度包括: (1】网元或地区维度。由于网元覆盖范围不同,如 覆盖办公区、校园区、住宅区、商业区的网元,话务各 务高峰业务量翻倍,同样存在发达地区业务量较大的情 况。 有特点,相应的话务模型也必然不同。 (2)时间维度。时间维度又分为分钟维度(通常网 通过数据挖掘,从多个角度全面掌握话务模型,就 40 J 警 薯 ・ ・ ・:==责饪编辑,林菊tinju@mbcom CI3