搜索

2010年11月21日星期日

如何分类

使用计算机经常遇到的一个问题是:分类。

通常我们认为越细致、科学、精确……的分类,越使得信息变得井井有条,所以曾经我的这个博客的标签是这样的:


我看不下去了之后,弄成了这样:

如果这个时候问你哪个更好,你会认同分类越细致、科学、精确……越井井有条吗?

难道上面那个论断是错误的?!

还有一个例子是电子邮件分类,我曾经把每个网站发给我的通知邮件都自动分类在某个单独的标签下,于是我有了:
  • 广告
  • Facebook
  • Twitter
  • Buzz
  • Google Reader
  • FriendFeed
  • Dell
  • W3C Blog
  • ……
后来我发现每次收邮件的时候都需要在各个文件夹点来点去……仔细想想看,难道100个邮件来源就要100个文件夹对应?这样的分类细致了,可是真的“细致的分类”更利于管理?!

人这种动物还不是纯粹理性的存在,我们掌控信息的能力是有限的,真实世界是无限的,对于我们来说,每一个分类的增加,在增加分类收益的同时,也在增加管理成本——所以其实对于人来说,分类越少越好!以有限的分类包容尽可能多的信息,这才是适合人类的分类法。

问题的另一面,如果编写程序来处理分类的话,因为计算机的处理能力可以看作是无限的,所以分类越细致越好,这样可以更有利于程序处理。

总结:

如果分类是给人看的:越少越好
如果分类是给机器处理的:越多越好

另外,对于机器不能理解的信息,例如文章正文,则不要分类。

没有评论:

发表评论