闲来无事看看公开课——统计学导论(一):什么是统计学

声明:本博客由 Lilian原创,如需使用请在开头引用或者添加转载字样,谢谢配合。同时也仅代表个人观点。

什么是统计学

这难住了我。。。

根据维基百科所述:

Statistics is a branch of mathematics dealing with the collection, analysis, interpretation, presentation, and organization of data.

用我拙劣的翻译功底翻译下就是:

统计学是数学科学的一个分支,处理数据的收集、分析、解释、呈现以及组织。

统计学的主要方法可以分为两个分支:

  • 描述性统计
  • 推断性统计

描述性统计

which summarizes data from a sample using indexes such as the mean or standard deviation(from wiki)

即主要就是收集数据,统计特征,然后进行报告。而这样的描述也分为数字型的与非数字型的。

推断性统计

inferential statistics, which draws conclusions from data that are subject to random variation (e.g., observational errors, sampling variation).(from wiki)

推断性统计则主要是通过样本所反映的一些统计特征或其他性质来推断群体(总体)的分布情况(参数等)。

数据类型

统计数据类型

统计的本质是要处理数据。而数据主要分为两类:定量的(quantitative)与定性的(qualitative),简单地说就是数字型与非数字型的。

例如:年龄、身高等就是定量的,种族、头发颜色等就是定性的。

度量水平(等级)levels of measurement

  • nominal:定类的,最低等级,没有顺序
  • ordinal:定序的,有顺序,但等级间没有差别,如大一、大二、大三…

上面两种被划分为categorical variables,是定性的数据

  • interval:定距的,有顺序,但零点模糊,等级间有区别,如温度
  • ratio:定比的,最高等级,有顺序,零点

这两种则被划分为quantitative variables,是定量的数据,进一步又被分为离散的与连续的。