spss在数据挖掘中的应用(编辑修改稿)内容摘要:
地区中是相对 168信息点播业务流量最低,而第 Ⅱ 类地区的点播业务流量是介于第 Ⅰ 类和第 Ⅲ 类之间,保持中游水平。 分析地区间的点播量的差异部分是由于地区特征的差异引起的,例如人口数量、经济发展状况(收入水平、手机拥有量、物价水平等),同时也与地区业务的宣传力度有密切联系。 分析清楚这些原因后公司就可以采取相应的措施扩大业务。 问题一输出结果详解 Case 3 Clusters 西安 1 宝鸡 2 榆林 3 延安 3 咸阳 2 铜川 2 渭南 3 安康 3 汉中 2 商洛 3 问题一输出结果详解 ( 3) 树形图 上表已给出了相关聚类结果,最后用树形图( Dendrogram)直观反映整个聚类过程和结果。 问题一输出结果详解 问题二输出结果详解 • 下表(部分)是利用 【 Means(均值 )】 功能计算的各项业务在当月的平均点播量。 表中具体给出了均值、统计数目及标准差等基本统计量。 比较均值大小可以看到,“ 股票点播 ” 、 “ 每日运程 ” 和 “ 劲爆笑话 ” 为点播量最大的业务,说明这些业务深受消费者欢迎,公司应努力增加在这些业务方面的内容更新及促销。 而相反的,“ 商讯点播 ” 、 “ 区号邮编 ” 等业务的点播量太低,因此公司可以考虑停止这些服务功能以节约成本。 问题二输出结果详解 Mean N Std. Deviation 股票点播 31 指数点播 31 外汇点播 31 到价提示 31 到价报警 31 新闻点播 31 外地天气 31 本地天气 31 航班点播 31 列车时刻 31 话费查询 31 头脑体操 31 问题二输出结果详解 ( 2) 秩统计表 下表 是多配对样本非参数检验的秩统计表。 可以看到,“ 股票点播 ” 变量的平均秩最大,等于 ,说明它的点播量最大,排名更靠后;相反的, “ 劲爆笑话 ”变量的平均秩最小,等于 ,说明它的点播量最小,排名更靠前。 Mean Rank 股票点播 劲爆笑话 每日运程 问题二输出结果详解 ( 3) Friedman统计表 Friedman检验结果如下表所示,样本容量等于 31, ChiSquare统计量等于 ,自由度 df等于 2,近似相伴概 率 P值为 00,远远小于显著性水平。 所以拒绝零假设,认为这三种业务的点播量存在显著差异。 这说明虽然它们位居所有业务的前三位,但其点播量还是存在显著的差异。 因此,公司需要分开对待它们各自的点播业务特点。 N 31 ChiSquare df 2 Asymp. Sig. .000 问题三输出结果详解 ( 1) 时间序列折线图 下图绘制了 “ 股票点播 ” 业务在该月每日点播量的时间序列图。 可以看到,股票点播量是平稳的,但具有显著的周期性,在每个周末的点播量明显低于周内的点播量,这与股票周末休市有密切联系。 于是考虑利用 ARMA模型来刻画其波动性。 问题三输出结果详解 问题三输出结果详解 ( 2) 模型拟合优度检验表 下表给出了 AR(7)模型的拟合优度值,可以看到拟合优度统计量 R2等于 ,说明模型的整体的拟合效果较好。 LjungBox Q统计量是对点播序列的线性相关性进行检验。 从检验结果看, LB检验概率 P值大于显著性水平 ,说明序列基本不存在自相关性 问题三输出结果详解 Model Number of Predictors Model Fit statistics LjungBox Q(18) Number of Outliers Stationary Rsquared Statistics DF Sig. 股票点播 Model_1 0 .880 11 .874 0 问题三输出结果详解 ( 3) 模型参数估计值表 下表列出了 AR(7)模型的参数估计值。 可以看到除了滞后 7阶( Lag 7)的系数显著外,其他滞后项系数都没有通过显著性检验,其 t检验的概率 P值都大于。 假设 “ 每日股票点播量 ” 记为 Xt,则最终拟合的模型为: Xt=+ Xt1 问题三输出结果详解 Estimate SE t Sig.。spss在数据挖掘中的应用(编辑修改稿)
相关推荐
的统计指标表示出来的过程为相关分析。 可根据研究的目的不同,或变量的类型不同,采用不同的相关分析方法。 本章介绍常用的相关分析方法:二元定距变量的相关分析、二元定序变量的相关分析、偏相关分析和距离相关分析。 相关分析的基本概念 任何事物的变化都与其他事物是相互联系和相互影响的,用于描述事物数量特征的变量之间自然也存在一定的关系。 变量之间的关系归纳起来可以分为两种类型,即函数关系和统计关系。
4 5 6 女 5 Grand Total 表分为 3部分: ,按各年级算出均值; ,按各年级算出均值;。 两个分组变量的列形式报告 表 48 2020/9/16 41 第二节 描述性统计分析( Descriptive Statistics) • Frequencies 频数分析表 • Descriptive 描述性统计分析过程 • Explore 探索分析过程 • Crosstabs
ons .541 .343 .734 .391 .021 4 实例结果及分析 ( 5)剔除某个评估项目以后的结果 表 1012的第一列显示了剔除某个评估项目以后的剩余项目的总平均分,例如剔除了科学素质的剩余其他三项的总平均分为 ,是第一列中最大的,这说明科学素质的得分影响比较大;第二列显示了剔除某个评估项目以后的剩余项目总分的样本方差,第三列是某评估项目与其余评估项目总分的简单相关系数
( 1)频数分析表 首先表 122显示了性别、年龄等八项基本信息指标的基本统计情况,其中 “ Valid”列表示有效样本数目, “ Missing”列表示缺失样本数目。 例如,教育变量的有效样本数目为 306,而仅有 2个样本缺失。 接着,软件输出了这八项指标的频数分析结果。 从结果看到,所有调查者中 %为男性,其余为女性;所有调查者中 2130岁人群所占比重最大,达到了 %,而
) 0( | , ) ( 39。 )EWVa r W E εXIε X ε ε GDP Output Production China 2020 [] CobbDouglass Production Function ln(GDP) = a + b ln(L) + g ln(K) + bw W ln(L) + gw W ln(K) + OLS Parameter
频数分析 t 检 验 单样本 t检验 one sample t test 配对资料 t检验 paired samples t test 方差齐性检验 homogeneity test 两独立样本 t检验 tow sample t test for independent sample 校正 t检验 separate variance estimation t test