数据结构和往常的不太一样 是这样子的:
A B quantity
1 339 1
1 308 2
3 339 1
5 225 1
其中A列是订单编号 B列是产品编号, quantity 是B列产品编号的购买数量。 想进行关联分析 就是选择了339的人有多大概率同一时间选择225 这个是典型的关联分析问题。 但是问题出在数据格式上。
标准的关联分析需要把数据变成对象。同一个订单的物品信息放在一起 格式应该是:
{339,308}
{339}
{225}
但是现在按照订单编号,物品编号单独列出来了。 应该怎么用这个函数呢?
谢谢大神了
发现一个解决办法 正在尝试:
http://cos.name/cn/topic/102766