本来以为 ANOVA 就可以解决的问题,发现你的模型表示表其他朋友误导了。这样子整理下是不是好些?
每一个用户编号是一个个案,每个服务是一个变量。按照你所说的,会有很多个服务。若是用户访问了哪个服务,就在对应的变量下标识为1,未访问标识为0.
Case Service_1 Service_2 Service_3
608 1 0 1
605 1 1 0
623 1 1 0
这样重新整理数据模型后,你只需要比较后面的 Service_1 Service_2
等等之间的相关就可以了。前面的三位数按你所说是用户编号,并无实际意义,无需加入统计分析。
话说若你标题说是统计问题的话我早就看啦,统计很好的数学白痴飘过……
2011/8/22 小蔡 <microcai(a)fedoraproject.org>:
On 2011年08月20日 16:09, 杜宏羽 wrote:
> 210 15
> 237 15
> 239 15
> 258 15
> 284 15
> 290 15
> 300 15
> 307 15
> 341 15
> 366 15
> 372 15
> 605 15
> 608 15
> 205 16
> 212 16
> 237 16
> 239 16
> 290 16
> 300 16
> 314 16
> 341 16
> 351 16
> 370 16
> 607 16
> 608 16
使用神经网络进行分析. :D
> 这样一组数据
> 假如前面的3位数为用户的编号,后面的2位数为服务的编号
> 现在有15跟16这2个服务
> 然后如何分析这2个服务之间是否存在相关性?
> _______________________________________________
> Chinese mailing list
> Chinese at
lists.fedoraproject.org
>
https://admin.fedoraproject.org/mailman/listinfo/chinese
_______________________________________________
Chinese mailing list
Chinese at
lists.fedoraproject.org
https://admin.fedoraproject.org/mailman/listinfo/chinese
--
Take a Deep Breath out of Windows
https://fedoraproject.org/wiki/User:Lovenemesis