spss在数据挖掘中的应用(编辑修改稿)内容摘要:

地区中是相对 168信息点播业务流量最低,而第 Ⅱ 类地区的点播业务流量是介于第 Ⅰ 类和第 Ⅲ 类之间,保持中游水平。 分析地区间的点播量的差异部分是由于地区特征的差异引起的,例如人口数量、经济发展状况(收入水平、手机拥有量、物价水平等),同时也与地区业务的宣传力度有密切联系。 分析清楚这些原因后公司就可以采取相应的措施扩大业务。 问题一输出结果详解 Case 3 Clusters 西安 1 宝鸡 2 榆林 3 延安 3 咸阳 2 铜川 2 渭南 3 安康 3 汉中 2 商洛 3 问题一输出结果详解 ( 3) 树形图 上表已给出了相关聚类结果,最后用树形图( Dendrogram)直观反映整个聚类过程和结果。 问题一输出结果详解 问题二输出结果详解 • 下表(部分)是利用 【 Means(均值 )】 功能计算的各项业务在当月的平均点播量。 表中具体给出了均值、统计数目及标准差等基本统计量。 比较均值大小可以看到,“ 股票点播 ” 、 “ 每日运程 ” 和 “ 劲爆笑话 ” 为点播量最大的业务,说明这些业务深受消费者欢迎,公司应努力增加在这些业务方面的内容更新及促销。 而相反的,“ 商讯点播 ” 、 “ 区号邮编 ” 等业务的点播量太低,因此公司可以考虑停止这些服务功能以节约成本。 问题二输出结果详解 Mean N Std. Deviation 股票点播 31 指数点播 31 外汇点播 31 到价提示 31 到价报警 31 新闻点播 31 外地天气 31 本地天气 31 航班点播 31 列车时刻 31 话费查询 31 头脑体操 31 问题二输出结果详解 ( 2) 秩统计表 下表 是多配对样本非参数检验的秩统计表。 可以看到,“ 股票点播 ” 变量的平均秩最大,等于 ,说明它的点播量最大,排名更靠后;相反的, “ 劲爆笑话 ”变量的平均秩最小,等于 ,说明它的点播量最小,排名更靠前。 Mean Rank 股票点播 劲爆笑话 每日运程 问题二输出结果详解 ( 3) Friedman统计表 Friedman检验结果如下表所示,样本容量等于 31, ChiSquare统计量等于 ,自由度 df等于 2,近似相伴概 率 P值为 00,远远小于显著性水平。 所以拒绝零假设,认为这三种业务的点播量存在显著差异。 这说明虽然它们位居所有业务的前三位,但其点播量还是存在显著的差异。 因此,公司需要分开对待它们各自的点播业务特点。 N 31 ChiSquare df 2 Asymp. Sig. .000 问题三输出结果详解 ( 1) 时间序列折线图 下图绘制了 “ 股票点播 ” 业务在该月每日点播量的时间序列图。 可以看到,股票点播量是平稳的,但具有显著的周期性,在每个周末的点播量明显低于周内的点播量,这与股票周末休市有密切联系。 于是考虑利用 ARMA模型来刻画其波动性。 问题三输出结果详解 问题三输出结果详解 ( 2) 模型拟合优度检验表 下表给出了 AR(7)模型的拟合优度值,可以看到拟合优度统计量 R2等于 ,说明模型的整体的拟合效果较好。 LjungBox Q统计量是对点播序列的线性相关性进行检验。 从检验结果看, LB检验概率 P值大于显著性水平 ,说明序列基本不存在自相关性 问题三输出结果详解 Model Number of Predictors Model Fit statistics LjungBox Q(18) Number of Outliers Stationary Rsquared Statistics DF Sig. 股票点播 Model_1 0 .880 11 .874 0 问题三输出结果详解 ( 3) 模型参数估计值表 下表列出了 AR(7)模型的参数估计值。 可以看到除了滞后 7阶( Lag 7)的系数显著外,其他滞后项系数都没有通过显著性检验,其 t检验的概率 P值都大于。 假设 “ 每日股票点播量 ” 记为 Xt,则最终拟合的模型为: Xt=+ Xt1 问题三输出结果详解 Estimate SE t Sig.。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。