SO标签是否能很好地代表编程语言的流行度?
我的第一个猜测是,它不是,而且它主要由杰夫的粉丝(可能是.Net偏见)和乔尔的粉丝(可能更多的C/C++偏向其他人)填充.
有没有办法获得无偏见的编程语言流行度统计?
我是LangPop.com的创建者,它测量了许多衡量人气的指标.我的理念是简单地尝试和衡量许多不同的东西,让人们看到结果,并自己判断.所有指标都有缺陷,偏见和优势.
就SO标签而言,除了C#之外,它们看起来相当准确,但是存在巨大的C#偏差,因此暂时我认为我不会在LangPop结果中包含SO.不过,我一直在关注它.另一个我正在关注的事情的例子,但仍然有点偏向的是GitHub,它有大量的Ruby项目.
Stackoverflow是一个极具偏见的样本,标签计数可能会进一步扭曲数字.因为Joel Spolsky是SO的主要营销工具,并且他喜欢微软技术,所以在这里它的代表性极大.随着对其他平台感兴趣的人感觉到这个网站不适合他们并停止参与,这种偏见会被放大.
在TIOBE调查被普遍视为衡量语言普及的一种手段.像任何调查一样,它有缺陷,但至少它的目的是衡量人气.