一、建立模型
1.1模型选择与预建立。到底哪些变量和客户流失概率有密切关系呢?利用数据期刊发表挖掘工具中的相关性比较功能可找出每一个输入变量和客户流失概率的相关性。通过这样的比较选择,我们可以删除那些和客户流失概率相关性不大的变量,减少建模变量的数量。这样不仅可以缩短建立模型的时间,减小模型的复杂程度,而且有时还能够使建立的模型更精确。Oracle的数据挖掘工具能够提供包括决策树、贝叶斯判别、神经网络、近邻学习、回归、关联、聚类等多种建模方法。通过使用多种建模方法,预建立多个模型,再比较这些模型的优劣,从而选择出最适合客户流失分析的建模方法。在预建模之前,使用者还能够改变模型的参数,从而根据实际情况生成更好的模型。
1.2模型建立与调整。
模型建立与调整是数据期刊发表挖掘过程中的核心部分。不同的商业问题和不同的数据分布与属性,经常会影响到模型建立与调整的策略,而且在建模过程中还会使用多种近似算法来简化模型的优化过程。所有这些处理方法,对模型的预测结果都会产生影响。所以在模型建立与调整过程中,需要业务专家参与制定调整策略,避免不适当的优化导致业务信息的丢失。
1.3模型的验证。
模型的验证是数据期刊发表挖掘成败的关键,不但要验证预测模型的过程正确,同时使用这些模型的其他输入和输出过程也要正确。验证的方法是输入一些历史数据,运用该模式比较数据挖掘的结果与已知历史结果的差异,如果差异很大,就要考虑改进模型或应该重新建立新的模型。
1.4建模数据期刊发表的选择。
通常电信行业客户流失的方向有两种。第一种是客户的自然消亡。例如由于客户的身故, 破产, 迁徙,移民等原因 ,导致客户不再存在 。或者是由于客户的升级 ,如 GSM 升CDMA ,造成特定服务的目标客户消失 。第二种是客户的转移流失。通常指客户转移到竞争对手享受服务。显然第二种流失的客户才是电信企业真正关心的,对企业具有挽留价值的客户 。因此 , 我们在选择建模数据时必须选择第二种流失的客户数据参与建模,才能建立出较精确的模型 。
二、总结
总的来说,数据期刊发表挖掘技术在计量客户细分的应用有利于应对计量机构走向市场的形式。在移动互联时代,CPRFM模型应用在计量客户分析所需样本数据较大,其客户价值指标可进一步监测,从而进一步完善。企业经营管理者已愈来愈清楚地认识到客户保持以及提高客户忠诚度的重要性及紧迫性,相信数据挖掘技术广泛应用将使更多的电信企业能从源头上控客户流失,“防患于未然”,从而能在很大程度上避免许多无谓损失,以便在日益激烈的市场竞争中立于不败之地。