数据的分类

数值型数据:可以进行数学运算的数据,分为间隔型和比率型。

顺序型数据:具有顺序关系的分类数据,如成绩等级。

分类数据:用于描述事物类别的名称,如性别、血型。

统计学的基本概念是什么

虚拟变量数据:用于表示定性因素的特殊数据,通常在回归分析中使用。

数据的来源与收集方式

直接来源(一手数据):研究者直接收集的数据。

间接来源(二手数据):通过已有资料获取的数据。

观测数据:在自然状态下收集的数据,不施加控制。

实验数据:通过控制实验条件获得的数据。

数据的时间特性

截面数据:同一时间点收集的数据。

时间序列数据:按时间顺序收集的数据。

混合数据(面板数据):同时包含截面和时间序列特征的数据。

统计学的核心概念

总体(population):研究对象的全部集合。

样本(sample):从总体中抽取的一部分,用于推断总体特征。

样本容量:样本中个体的数量。

参数(parameter):描述总体特征的量,如总体均值(μ)、总体标准差(σ)、总体比例(π)。

统计量(statistic):基于样本计算的量,如样本均值(x̄)、样本标准差(s)、样本比例(p)。

变量与数据计量尺度

变量:描述事物特征的概念。

分类变量:表示类别,如性别。

顺序变量:表示有序类别,如教育程度级别。

数值型变量:具有数学意义的量,分为定类(名义尺度)、定序(顺序尺度)、定距(间隔尺度)和定比(比率尺度)。

统计学通过这些基本概念来理解数据,进行假设检验、描述性统计分析、推断性统计分析等,帮助我们从数据中发现模式、做出预测和决策。