1949年,哈佛大学的语言学家乔治·齐普夫(George Zipf)在文字应用中发现了一条类似的原理。他观察到,有少数几个词汇经常被用到,许多-甚至大多数词汇都很少用到。这一点并不奇怪,但齐普夫还发现,这种关系是完全可预测的,实际上与帕累托的财富曲线并无两样。用1除以一个词在所有词汇中的应用率排名可以得出一个比例,而这个比例与这个词的应用频率是密切对应的。也就说,第二常用词的应用频率大约是第一常用词的1/2,而第三常用词的应用频率是第一常用词的1/3,以此类推。这被称做“齐普夫法则”(Zipf’s Law)。
齐普夫还发现,从人口统计数字到工业生产过程,其他许许多多的现象也符合这一规律。他在费城的一个横跨20个街区的地区研究了区域内的所有结婚证书,结果发现有70%的夫妇的婚前彼此居住的距离不超过该区域总长度的30%。
自那以来,其他研究者已经将这个法则扩展到了五花八门的所有事情上,比如血浆中的原子或是城市的规模。这些观察结果都符合幂律分布,也就是帕累托最先在财富曲线中观察到的1/x 形态。
从生物学到书籍销量,你实际上可以在任何领域中发现幂律曲线。长尾就是一个幂律曲线,它不会被有限货架空间或可用频道这样的供给瓶颈残忍地截断。由于幂律曲线的值域无限接近但永远不会下降至零,它也被称为“长尾”曲线,这就是本书书名的由来。
只要消费市场存在,幂律曲线就会在3个条件成立的情况下出现:
1. 多样性(有很多不同种类的事物)。
2. 不平等性(某些事物的质量高于其他事物)。
3. 存在某种网络效应,比如声誉或口头传播效应,这些效应容易将质量的差别成倍放大。
换句话说,只要存在不同事物,某些事物优于其他事物,而且像声誉这样的网络效应能进一步推广好事物、压制坏事物,幂律曲线就会出现。这会造成市场、文化和社会的一种“可预见的不均衡”(如帕累托所说):成功带来更多成功。不用说,我们的世界有很大一部分是由这些力量塑成的。
供给瓶颈如何扭曲市场
为了认识现实世界中的幂律曲线,让我们来看看好莱坞票房的例子。如果你按一般的方式把票房数据绘制成图,曲线会呈现出熟悉的形状:少数热门大片统治了左侧的高端部分,大批其他影片(用最客气的话来说就是“非热门”)构成了右侧的低端部分。