论文部分内容阅读
【摘要】衡量一个企业发展情况如何,一方面可以从利润的角度来直观地看出,另一方面也可以从各运营商市场占有率中得出。为此,从深入挖掘及利用企业信息化数据的角度出发,利用数据库处理分析数据,建立了本地网乡镇级移动业务市场占有率分析系统,实现了对本企业及竞争对手市场占有率的清晰掌握。
【关键词】数据库;固网;移动网;关口局;首次话单;归属原则
一、实施背景
近年来,随着市场竞争环境的不断加剧,各运营商迫切需要准确了解自身发展情况及在竞争中所处的位置。在同行业竞争的情况下,要想直接获取到竞争对手体现出明确归属的用户详细资料非常困难。为了分析市场占有率相关情况,以话务数据为基础,讨论合理的设计思路,建立合适的模型,最终完成了乡镇级移动业务市场占有率分析系统。
二、建设目标
乡镇移动业务市场占有率分析系统,以深入挖掘为设计理念,从‘全’、‘准’、‘细’三个方面集中体现了开发的精髓。全,则为数据全。准,则为定位准。细,则为颗粒度细。基于以上思路,该成果实现了新增市场占有率、当月过网用户数、累计到达数、总体市场占有率等统计数据的清晰展现,形成了对市场经营的有利支撑。
三、项目方案
1、确定口径:根据市场需求,拟定了新增市场占有率、总体市场占有率两个关键市场占有率指标,即新增市场占有率(指本统计周期内我方新增移动用户数占各运营商新增移动用户数的比)和总体市场占有率(指截止本统计周期3个月内我方过网累计用户数占相同统计周期内各运营商用户数之比)。要实现到乡镇级的市场占有率统计,最为关键的环节是确定他网用户的归属。根据用户首次开户后的拨打习惯以及可能经常拨打所在地的行为习惯,制定了以下两种归属地定位方案:
首次呼叫形成归属地:首次与我方号码通话的话单中我方号码的归属,做为他网用户归属地。呼叫次数最多统计归属地:与我方号码通话次数最多的,我方号码归属的乡镇,做为他网用户归属地。
2、数据挖掘:在“数据挖掘”环节实现的是数据采集,获取所需完整信息。采取如下步骤进行了数据挖掘及整理:
首先,明确过网话单抽取范围。为做到没有遗漏,过网话单均取自于我方移动网和固网关口局。其次,抽取所需信息并整理。按照首次话单归属及呼叫次数最多归属两个原则,分别对不同数据进行了抽取。抽取过程中充分考虑了数据来源于两个关口局,信息需要重新分类汇总;数据量大可能造成空间不足;用户只拨打特服号码;本地移动H码不全等复杂因素,在对庞大的原始数据进行分类整理的过程中逐一核对,找出原始数据在实际使用中存在的问题,并针对问题分别设置了程序控制点,实现了程序的全过程控制。
按首次呼叫归属原则提取及整理所需数据如下:
(1)提取所有过固网关口局的他网用户话单信息。提取过程中首先缩小提取范围,将数据源提取范围限定为关口局,然后以此范围中主叫或被叫号码为他网手机号码头(例如,187、188、133、135、136等)的标准进行相关话单详细信息的提取。信息包含主叫、被叫、起始时间等内容,形成他网主被叫话单基础信息表。
(2)为了节省数据库空间和加快处理速度,对数据库表建立索引,并剔除了话单中主叫(或被叫)不为7位的无效话单。为之后关联归属地时可能存在的,无法关联有效信息的问题提前做好数据处理准备。
(3)为了减少每次操作的数据量,先将主叫话单和被叫话单分别保留每月首次通话话单,末次通话话单,和倒数第二张通话话单,并把其余冗余话单全部删除。实际操作时,为了加快速度(drop表操作较delete语句快速),可以生成一个新表,将原表删除。
(4)合并固网的主叫话单和被叫话单,将在不同字段上记录的他网手机号码信息进行字段统一,用类似的方法保留首次通话话单,末次通话话单,和倒数第二张通话话单。
(5)将我方固网号码与固网集中计费系统中用户资料想关联,根据固网集中计费系统相应号码的营业区及支局信息,更新至他网基础信息表的相关字段中,暂时做为两网数据合并前单方面过固网关口局的他网号码归属地的初步定位。
(6)提取过移动网的他网手机主、被叫话单信息,同样可以用与上面类似的方法取出每月的首次通话话单,末次通话话单,和倒数第二张通话话单。
(7)将我方移动网号码关联移动网BSS系统用户资料,据此进行县区和开户地更新,暂时做为两网数据合并前单方面过移动网关口局的他网号码归属地的初步定位。
(8)再次按照话单起始时间进行排序,得到最终的他网号码与我网通话的首次通话话单,末次通话话单,和倒数第二张通话话单,以及所属县区及乡镇。
(9)根据网管提供的H码,将不是本地的他网号码话单删除。
(10)由于数据源分别取自固网和G网,可能有重复话单,再将话单按照规则进行排重。
按照以上过程执行后,则依据首次话单归属原则形成了所需的他网号码基础信息表,并初步对每个他网号码进行了归属定位。
按通话次数最多的乡镇作为归属乡镇的划分方式与首次话单归属原则类似,目标就是找出他网每一用户与我方通话次数最多的县区和乡镇,另做更新,数据源还是分别取自固网和移动网关口局。最终,依据呼叫次数最多归属原则形成了所需的他网号码基础信息表,并初步对每个他网号码进行了归属定位。
3、归属定位
首先获取了一份行政区域标准化清单,并据此数据将挖掘过程中初步形成的他网及我方乡镇归属进行了最终标准化乡镇的准确更新。
更新后,将本月采集的他网和我方过网用户的最终信息,与往月两种数据进行汇总,形成最新的他网用户信息资料表。汇总过程中,先判断原来他网号码信息表中是否存在,如不存在,则将本月首次出现的号码插到表里,分别将最早的话单中对应的县区和乡镇、呼叫次数最多话单中对应的县区和乡镇更新到他网号码信息表中不同的县区和乡镇名称中,同理更新入网时间。更新这三个字段时只更新空字段,即保证原有信息不变。然后更新上次过网时间和本次过网时间。
4、数据展现
通过利用在以上操作过程形成的基础信息表中的多项信息,结合统计指标中分子、分母判定规则,则得出了新增用户数、当月过往用户数、累计到达用户数三项基础指标。有了以上三项基础指标,细分至乡镇级的新增市场占有率、总体市场占有率、净增市场占有率三个关键市场占有率指标则得到了清晰展现。
通过对以上两种统计结果进行对比,可以看出两种方式在统计结果上的差异很小,进一步验证了此种他网用户定位方式的可行性。
四、成果实施后所产生的效果
通过实践表明,该项成果所体现出来的灵活、准确、细致的分析数据,为一线人员提供了翔实的基础支撑,在经营发展过程中起到了积极的推动作用,通过锁定目标等方式,一定程度上还降低了人工成本。
该成果实现全部利用现有系统和服务器,没有添加任何软硬件投资,但该成果对企业在竞争环境下的决策起到了良好的促进作用,间接效益明显。此系统的实现方案对于各电信企业具有较强的借鉴意义。
【关键词】数据库;固网;移动网;关口局;首次话单;归属原则
一、实施背景
近年来,随着市场竞争环境的不断加剧,各运营商迫切需要准确了解自身发展情况及在竞争中所处的位置。在同行业竞争的情况下,要想直接获取到竞争对手体现出明确归属的用户详细资料非常困难。为了分析市场占有率相关情况,以话务数据为基础,讨论合理的设计思路,建立合适的模型,最终完成了乡镇级移动业务市场占有率分析系统。
二、建设目标
乡镇移动业务市场占有率分析系统,以深入挖掘为设计理念,从‘全’、‘准’、‘细’三个方面集中体现了开发的精髓。全,则为数据全。准,则为定位准。细,则为颗粒度细。基于以上思路,该成果实现了新增市场占有率、当月过网用户数、累计到达数、总体市场占有率等统计数据的清晰展现,形成了对市场经营的有利支撑。
三、项目方案
1、确定口径:根据市场需求,拟定了新增市场占有率、总体市场占有率两个关键市场占有率指标,即新增市场占有率(指本统计周期内我方新增移动用户数占各运营商新增移动用户数的比)和总体市场占有率(指截止本统计周期3个月内我方过网累计用户数占相同统计周期内各运营商用户数之比)。要实现到乡镇级的市场占有率统计,最为关键的环节是确定他网用户的归属。根据用户首次开户后的拨打习惯以及可能经常拨打所在地的行为习惯,制定了以下两种归属地定位方案:
首次呼叫形成归属地:首次与我方号码通话的话单中我方号码的归属,做为他网用户归属地。呼叫次数最多统计归属地:与我方号码通话次数最多的,我方号码归属的乡镇,做为他网用户归属地。
2、数据挖掘:在“数据挖掘”环节实现的是数据采集,获取所需完整信息。采取如下步骤进行了数据挖掘及整理:
首先,明确过网话单抽取范围。为做到没有遗漏,过网话单均取自于我方移动网和固网关口局。其次,抽取所需信息并整理。按照首次话单归属及呼叫次数最多归属两个原则,分别对不同数据进行了抽取。抽取过程中充分考虑了数据来源于两个关口局,信息需要重新分类汇总;数据量大可能造成空间不足;用户只拨打特服号码;本地移动H码不全等复杂因素,在对庞大的原始数据进行分类整理的过程中逐一核对,找出原始数据在实际使用中存在的问题,并针对问题分别设置了程序控制点,实现了程序的全过程控制。
按首次呼叫归属原则提取及整理所需数据如下:
(1)提取所有过固网关口局的他网用户话单信息。提取过程中首先缩小提取范围,将数据源提取范围限定为关口局,然后以此范围中主叫或被叫号码为他网手机号码头(例如,187、188、133、135、136等)的标准进行相关话单详细信息的提取。信息包含主叫、被叫、起始时间等内容,形成他网主被叫话单基础信息表。
(2)为了节省数据库空间和加快处理速度,对数据库表建立索引,并剔除了话单中主叫(或被叫)不为7位的无效话单。为之后关联归属地时可能存在的,无法关联有效信息的问题提前做好数据处理准备。
(3)为了减少每次操作的数据量,先将主叫话单和被叫话单分别保留每月首次通话话单,末次通话话单,和倒数第二张通话话单,并把其余冗余话单全部删除。实际操作时,为了加快速度(drop表操作较delete语句快速),可以生成一个新表,将原表删除。
(4)合并固网的主叫话单和被叫话单,将在不同字段上记录的他网手机号码信息进行字段统一,用类似的方法保留首次通话话单,末次通话话单,和倒数第二张通话话单。
(5)将我方固网号码与固网集中计费系统中用户资料想关联,根据固网集中计费系统相应号码的营业区及支局信息,更新至他网基础信息表的相关字段中,暂时做为两网数据合并前单方面过固网关口局的他网号码归属地的初步定位。
(6)提取过移动网的他网手机主、被叫话单信息,同样可以用与上面类似的方法取出每月的首次通话话单,末次通话话单,和倒数第二张通话话单。
(7)将我方移动网号码关联移动网BSS系统用户资料,据此进行县区和开户地更新,暂时做为两网数据合并前单方面过移动网关口局的他网号码归属地的初步定位。
(8)再次按照话单起始时间进行排序,得到最终的他网号码与我网通话的首次通话话单,末次通话话单,和倒数第二张通话话单,以及所属县区及乡镇。
(9)根据网管提供的H码,将不是本地的他网号码话单删除。
(10)由于数据源分别取自固网和G网,可能有重复话单,再将话单按照规则进行排重。
按照以上过程执行后,则依据首次话单归属原则形成了所需的他网号码基础信息表,并初步对每个他网号码进行了归属定位。
按通话次数最多的乡镇作为归属乡镇的划分方式与首次话单归属原则类似,目标就是找出他网每一用户与我方通话次数最多的县区和乡镇,另做更新,数据源还是分别取自固网和移动网关口局。最终,依据呼叫次数最多归属原则形成了所需的他网号码基础信息表,并初步对每个他网号码进行了归属定位。
3、归属定位
首先获取了一份行政区域标准化清单,并据此数据将挖掘过程中初步形成的他网及我方乡镇归属进行了最终标准化乡镇的准确更新。
更新后,将本月采集的他网和我方过网用户的最终信息,与往月两种数据进行汇总,形成最新的他网用户信息资料表。汇总过程中,先判断原来他网号码信息表中是否存在,如不存在,则将本月首次出现的号码插到表里,分别将最早的话单中对应的县区和乡镇、呼叫次数最多话单中对应的县区和乡镇更新到他网号码信息表中不同的县区和乡镇名称中,同理更新入网时间。更新这三个字段时只更新空字段,即保证原有信息不变。然后更新上次过网时间和本次过网时间。
4、数据展现
通过利用在以上操作过程形成的基础信息表中的多项信息,结合统计指标中分子、分母判定规则,则得出了新增用户数、当月过往用户数、累计到达用户数三项基础指标。有了以上三项基础指标,细分至乡镇级的新增市场占有率、总体市场占有率、净增市场占有率三个关键市场占有率指标则得到了清晰展现。
通过对以上两种统计结果进行对比,可以看出两种方式在统计结果上的差异很小,进一步验证了此种他网用户定位方式的可行性。
四、成果实施后所产生的效果
通过实践表明,该项成果所体现出来的灵活、准确、细致的分析数据,为一线人员提供了翔实的基础支撑,在经营发展过程中起到了积极的推动作用,通过锁定目标等方式,一定程度上还降低了人工成本。
该成果实现全部利用现有系统和服务器,没有添加任何软硬件投资,但该成果对企业在竞争环境下的决策起到了良好的促进作用,间接效益明显。此系统的实现方案对于各电信企业具有较强的借鉴意义。