中国有多少Emacs用户?全世界呢?

要估算这个数量只要知道两个数据就可以:

  • 可能使用Emacs的总人数
  • 这些人中Emacs用户的比例

根据统计,全世界大约2000万程序员,中国大约200万[1]。而Emacs在全世界的使用率按照2.5%计算(可以参考的是stackoverflow的用户中Emacs用户大约3%,我忘了出处了。),在中国就按照0.5%计算。于是全世界也就不到50万的Emacs用户,中国大约不到1万。

我能认识Emacs用户真是幸运呀,十三亿中找1万人,好比从13万人找一个人。要珍惜你认识的每一个Emacs用户哦。

估计的有没有问题?

当然,这里的估算方法非常粗略,最大的问题是只考虑了程序员,如果把接近程序员的人群,主要是一些极客算在内,估计的数量会多一些。但是,人群中极客的数量是难以估计的,而且他们中Emacs的使用率也不高。如果非要估计一下,可能全国有50万极客?使用率0.05%?得,250人,果然是极少的。

还有一个值得考虑的是普通人,虽然Emacs使用率比程序员甚至是极客都要低的多,大概10万人里面也不一定有一位,可中国人基数大啊,如果就按照10万人里有一个计算,全国还有1300位非程序员出身的Emacs用户,和1万比,还是个零头。所以我大胆的估计:全中国就1万Emacs用户。

从认识Emacs用户到寻找外星人

再稍微延伸一点,Emacs用户虽然少,但我们Emacs用户都认识很多Emacs用户啊,如果真的按照概率,13万人里找一个,好比3、4所大学里面找一个人啊,能是容易的么?和Emacs用户社交类似的是找到女朋友的概率。根据Peter Backus的研究论文《我为什么没有女朋友》(PDF版原文),能找到合适的女朋友的概率和找到外星人差不多,都低的可怜。可现实中很多人都找到了女朋友了啊。这里,概率并没有起作用,我觉得原因有以下几点:

  1. 社交活动是「反概率」,或者说和我们一般认为经典的概率模型不一样。譬如我们一般假设随机事件都是正态分布的,而社交事件里,某些活跃的人认识很多人,而一般人的社交圈很局限,这种矛盾就使得事实和我们的观念冲突。

  2. 最根本原因是人是会动的,这和理论里面的那些小球、硬币不一样。把妹学里面就有「社交动力学」的说法,我觉得比较贴切。想学把妹学看这里。

  3. 再换个化学的角度讲(各位读者看到这里一定想骂我……),热力学可行不一定能发生,因为如果反应速率特别慢,你也观察不到。虽然是小概率,可发生的条件如果正好符合,也会发生,或者说现实情况根本就不是那个概率能描述的。

  4. 当然也要感谢网络这种新的传播媒介。网络打破了物理上的隔离,使人真正的互联和聚集,让有趣的人互相认识变得容易了。垂直社交的平台,譬如中国的贴吧、世界的reddit还有一些专门网站,让有共同爱好的人走到一起。我的这个Blog不也让你们认识我了么(笑)。

写在最后

因为有人在Emacs China上问Emacs用户有多少,我回复了这篇文章,然后又读了读,觉得还有很多没写出来的东西,于是又增添了一些,搞了个标题党的题目。通过修改这个文章,我关于这个问题的认识也深刻了一点。

估算是一种非常重要的技能,在科研和生活中都有很多应用。我以前一直喜欢「精确」,后来发现,自己的「精确」并没有什么用,就好比圆周率我能背100位,用不上的。且不说是浮点数精度问题,就算真能用上,算出来的比原子核还小,有啥用?反而是快速的计算出结果,并且知道自己计算的误差有多少,更有用。

一点认识,与各位共享。


  1. 数据可以参考这个知乎上的问答。注意这个数字包括了业余爱好者。