搜索

2010年10月30日星期六

多信息源自动同步带来的重复信息问题初探

最近搞了个 FriendFeed 账号,然后我的 Facebook 本身也关联了一大堆账号,因为这种机制本身的缺陷,制造了一大堆重复信息。

我本来想解决这个问题,两个思路:
  • 只允许 FriendFeed(或者FF不支持的信息源),屏蔽其它信息源(因为基本上大部分信息源都汇聚到 FriendFeed)
  • 只阻止 FriendFeed,允许其它
但是前者会带来复杂的配置问题,你得仔细审查所有信息源的情况,并且它们互相之间的同步情况也得考虑,否则一些信息经由第三方转了一圈儿之后,依然会重复出现在 Facebook 上;后者会屏蔽掉来自 FriendFeed 自身的源发信息。

而且,第一种方案还会把你的所有信息源都交给 FriendFeed 处理,一旦 FF 出问题,或者我不喜欢这个东西了,那么就要改动全部信息流系统。

权衡利弊,我觉得还是容忍重复信息来得简单,“自动同步全部”这样的配置方式虽然会带来重复信息问题,但是至少不会漏掉什么东西。

我觉得:重复信息应该由软件自动解决,而不是依赖用户手动配置。

至于说软件自动解决的方案,我甚至都在Synchronization and Duplicate Informations across Web Sites给出了建议,不过这需要整个行业的配合才行了,不过我相信这是迟早的事儿。

没有评论:

发表评论