1计量经济学定义:
广义:利用经济理论、统计学和数学定量研究经济现象的经济计量方法的统称,包括回归分析法投入产出分析法,时间序列分析方法等。
狭义:我们常说的计量经济学,以揭示经济现象中的因果关系为目的,再数学上主要应用回归分析方法。
2理论模型的设计:1.确定模型所包含的变量。第一,需要正确理解和把握所研究的经济现象中暗含的经济学理论和经济行为规律。第二,选择变量要考虑数据的可得性,第三,选择变量时要考虑所有入选变量之间的关系,使得每个解释变量都是独立的。2.确定模型的数学形式。利用经济学和数理经济学的成果 根据样本数据作出的变量关系图 选择可能的形式试模拟3.拟定理论模型中待估参数的理论期望值,关键在于理解待估参数的经济含义。 3常用的样本数据:时间序列数据(平稳的时间序列适合于经典计量模型) 截面数据(经典计量模型理论以该类数据为基础) 虚变量数据(也称为二进制数据,一般取0或1) 4样本数据质量 :完整性 准确性 可比性 一致性 5模型检验
(1) 经济意义检验 :根据拟定的符号、大小、关系,对参数估计结果的可靠性进行判断。
(2) 统计检验 由数理统计理论决定。包括:拟合优度检验 总体显著性检验 变量显 著性检验
(3) 计量经济学检验 由计量经济学理论决定。包括:异方差性检验 序列相关性检验 共线性检验
(4) 模型预测检验 由模型的应用要求决定。包括: 稳定性检验:扩大样本重新估计 预测性能检验:对样本外一点进行实际预测 6计量经济学模型成功地三要素:理论 数据 方法 7计量经济学模型的应用: 一、结构分析
a经济学中的结构分析是对经济现象中变量之间相互关系的研究。
b结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。
c计量经济学模型的功能是揭示经济现象中变量之间的相互关系,即通过模型得到弹性、乘数等。
d前提是模型设定和统计推断都是正确的。 二、经济预测
计量经济学模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。 计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技术手段。 对于非稳定发展的经济过程,对于缺乏规范行为理论的经济活动,计量经济学模型预测功能失效。
模型理论方法的发展以适应预测的需要。经济预测不应该成为计量经济学模型的主要应用领域。
三、政策评价
经济政策不能实验,计量经济学模型的“经济政策实验室”的功能所能够产生的效用是巨大的。只要求“相对性”结果,模型系统性偏差并不出现在比较的结果中。政策评价应该成为计量经济学模型的主要应用领域。 四、检验与发展经济理论:
第二章知识点
1回归分析概念 是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论 其用意:在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。 这里:前一个变量被称为被解释变量或应变量,后一个(些)变量被称为解释变量或自变量。 2回归分析的主要内容
回归分析构成计量经济学的方法论基础,其主要内容包括:
(1)根据样本观察值对经济计量模型参数进行估计,求得回归方程; (2)对回归方程、参数估计值进行显著性检验; (3)利用回归方程进行分析、评价及预测。 3随即干扰项概念
总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平。但对某一个别的家庭,其消费支出可能与该平均水平有偏差。
iYiE(Y|Xi)
称i为观察值Yi围绕它的期望值E(Y|Xi)的离差,是一个不可观测的随机变量,又称为随机干扰项或随机误差项。 4样本回归函数的概念
样本散点图近似于一条直线,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该线近似地代表总体回归线。该线称为样本回归线。
记样本回归线的函数形式为:
ˆˆXˆf(X)Yii01i称为样本回归函数
5一元线性回归模型一般形式P29
Y=β0+β1X+μ Y被解释变量 X 解释变量 β0、β1待估参数 μ随即干扰项
对模型的假设一般包括1对模型假定的假设2对解释变量的假设3对随机干扰项的假设
6参数估计的普通最小二乘法(OLS)过程 P33
1最小二乘原理根据被解释变量的所有观测值与估计值之差的平方和最小的原则求得参数
nn估计量。
22ˆMinQ(YY)(Y(X)) iii01i11
2、正规方程组
Q
0i01i
0 Qi01ii 0 1
该关于参数估计量的线性方程组称为正规方程组
3、参数估计量求解正规方程组得到结构参数的普通最小二乘估计量(ordinary least squares estimators)及其离差形式:
2 iiiiiii 10222
ˆˆX)0(YˆˆX)X0(YˆXYXYXnXi(Xi)nYXYXiiiiˆ122nX(X)iiˆxyxiˆYˆX10 2i分布参数的普通最小二乘估计量 2
7统计性质的概念
当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。 准则
线性性(linear),即它是否是另一随机变量的线性函数;
无偏性(unbiased),即它的均值或期望值是否等于总体的真实值; 有效性(efficient),即它是否在所有线性无偏估计量中具有最小方差。
渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值; 一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值; 渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。 8参数估计量β0尖和β1尖的概率分布
ˆen2
ˆ~N(,112x2iˆ~N()002iX,nx2i2i)
29、随机误差项的方差2的估计
2又称为总体方差。 由于随机项i不可观测,只能从i的估计——残差ei出发,对总体方差进行估计。 可以证明,2的最小二乘估计量为:
ˆ2en2它是关于2的无偏估计量。
在最大或然估计法中,求解似然方程: *n1 22222
2
i01
L2ˆˆ(Yi01Xi)012ˆˆˆ(YXi)nen2i
2的最大或然估计量不具无偏性,但却具有一致性。 10拟合优度检验 总离差分解示意图
对于所有样本点,则需考虑离差的平方和:
TSS总体平方和
回归平方和
ESS
残差平方和
RSS
10可决系数R2统计量 222y(YY)iiˆY)2ˆ2(Yyˆ)e(YYii2i2iiESSRSS是一个非负的统计量。取值范围:[0,1]
越接近1,说明实际观测点离回归线越近,拟合优度越高。 R1 TSS TSS 补充P45 2.4.4公司
11 T 检验 过程 请仔细看P47
12怎样缩小置信区间 要缩小置信区间,需要
(1)增大样本容量n。因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;
(2)提高模型的拟合优度。因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和越小。 13P50_61 2 11 题 第九章
1总体回归模型设定的“一般性”原则 p317-320 (1)正确的总体模型只能是一个。(2) “一般性”是“唯一性”原则的自然要求。 2模型关系设定的指导原则
ˆˆY(⒈) 经济学理论指导原则 经济学理论 已有的研究成果
(⒉) 统计分析指导原则 散点图 试拟合
对数据进行统计分析得到的是单个解释变量与被解释变量之间的关系 。
第三章
1总体回归函数:描述在给定解释变量Xi条件下被解释变量Yi的条件均值。
i1i2iki011i22ikki
j也被称为偏回归系数(partial regression coefficients),表示在其他解释变量保持不变的情况下,Xj每变化1个单位时,Y的均值E(Y)的变化。
或者说j给出了Xj的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。 2样本回归函数 样本回归函数的随机形式,称为样本回归模型 011i22ikiki i 011i22ikikii i3最小二乘估计
ˆ(XX)1XY β
4最小样本容量:所谓“最小样本容量”,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。样本最小容量必须不少于模型中解释变量的数目(包括常数项),即 n >= k+1 5满足基本要求的样本容量: 从统计检验的角度: n30 时,Z检验才能应用; n-k8时, t分布较为稳定。 一般经验认为:
当n30或者至少n3(k+1)时,才能说满足模型估计的基本要求。 6可决系数
ESSRSS2 R1 TSSTSS该统计量越接近于1,模型的拟合优度越高。 调整的可决系数 RSS/(nk1)2R1
TSS/(n1)
其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。 调整的可决系数与未经调整的可决系数之间存在如下关系p74 7赤池信息准则
ee2(k1)
AICln nn施瓦茨准则
E(Y|X,X,X)XXXˆXˆXˆeXˆˆXˆXYˆXeekSClnlnnnn
这两准则均要求仅当所增加的解释变量能够减少AIC值或SC值时才在原模型中增加该解释变量。
8 F检验P76
9、关于拟合优度检验与方程显著性检验关系的讨论 两者是丛不同原理出发的两类检验,前者是丛已经得到估计的模型出发,检验它对样本观测值的拟合程度,后者是丛已经得到估计的模型出发,检验它对样本观测值的拟合程度,后者是从样本观测值出发检验模型总体线性关系的显著性。但是二者又是相关联的,模型对样本观测值的拟合程度越高,模型总体线性关系的显著性就强 10.如何才能缩小置信区间?
增大样本容量n;提高模型的拟合优度, 提高样本观测值的分散度 11.模型的类型与变换
(1)、倒数模型、多项式模型与变量的直接置换法 2)幂函数模型、指数函数模型与对数变换法 3)、复杂函数模型与级数展开法P83
12模型施加约束条件后进行回归,称为受约束回归
第四章
1异方差性:对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性.
2异方差性的检验;图示检验法:帕克(Park)检验与戈里瑟(Gleiser)检验; 戈德菲尔德-匡特(Goldfeld-Quandt)检验(G-Q检验);怀特(White)检验
3加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS(普通最小二乘法)估计其参数。 4序列相关性概念:多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性 5实际问题中的序列相关性
a没有包含在解释变量中的经济变量固有的惯性。 b模型设定偏误(Specification error)。主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。 c数据的“编造”。(时间序列数据作为样本时,一般都存在序列相关性。截面数据作为样本时,一般不考虑序列相关性。)
6序列相关性的检验:图示法 回归检验法 D.W.检验法 拉格朗日乘数(LM)检验 7序列相关的补救方法:—广义最小二乘法 —广义差分法
8多重共线性:如果某两个或多个解释变量之间出现了相关性,则称为多重共线性 9实际经济问题中的多重共线性 产生多重共线性的主要原因: (1)经济变量相关的共同趋势 (2)滞后变量的引入 (3)样本资料的限制
10多重共线性的检验(用于多重共线性的检验方法主要是统计方法:如判定系数检验法、逐步回归检验法)
多重共线性检验的任务是:
(1)检验多重共线性是否存在;
(2)估计多重共线性的范围,即判断哪些变量之间存在共线性 11克服多重共线性的方法
第一类方法:排除引起共线性的变量 第二类方法:差分法 第三类方法:减小参数估计量
的方差
12随机解释变量问题:如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。
13同期外生的or严格外生的p144
14工具变量:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。选择为工具变量的变量必须满足以下条件: 与所替代的随机解释变量高度相关; 与随机误差项不相关;
与模型中其它解释变量不相关,以避免出现多重共线性。 15解释变量的内生性检验p150
第五章
1虚拟变量模型的定义:
同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。 2虚拟变量的引入(p157)
虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。 (1) 加法方式:引入虚拟变量,考察:截距的不同。许多情况下,斜率发生变
化,或斜率、截距同时发生变化。 (2) 乘法方式:斜率的变化可通过以乘法的方式引入虚拟变量来测度。 (3) 临界指标的虚拟变量的引入:在经济发生转折时,可通过建立临界指标的
虚拟变量模型来反映。 3虚拟变量的设置原则:
虚拟变量的个数需按以下原则确定:每一定性变量(qualitative variable)所需的虚拟变量个数要比该定性变量的状态类别数(categories)少1。即如果有m种状态,只在模型中引入m-1个虚拟变量。
4、滞后变量模型的概念:以滞后变量作为解释变量,就得到滞后变量模型,也称动态模型。它的一般形式为:
Yt01Yt12Yt2qYtq0Xt1Xt1sXtst(1)自回归分布滞后模型:既含有Y对自身滞后变量的回归,还包括着X分布在不同时期的滞后变量。有限自回归分布滞后模型:滞后期长度有限。无限自回归分布滞后模型:滞后期无限
(2)分布滞后模型:模型中没有滞后被解释变量,仅有解释变量X的当期值及其若干期的滞后值。
Yt
i0siXtit
(3)自回归模型:模型中的解释变量仅包含X的当期值与被解释变量Y的一个
Yt01Xt或多个滞后值。
i1qiYtit
一阶自回归模型:
Yt01Xt2Yt1t
5、分布滞后模型的修正估计方法:
(1) 经验加权法:根据实际问题的特点和实际经验给各滞后变量指定权数,滞后变量按权数线性组合,构成新的变量。
权数据的类型有:递减型、矩型、倒V型等。
经验权数法的优点是:简单易行;缺点是:设置权数的随意性较大。 (2) 阿尔蒙(Almon)多项式法:
主要思想:针对有限滞后期模型,通过阿尔蒙变换,定义新变量,以减少解释变量个数,然后用OLS法估计参数。 主要步骤为: 第一步,阿尔蒙变换:
Yti0siXtit 第二步,模型的OLS估计: 对变换后的模型进行OLS估计,得α的估计值;计算滞后分布模型参数β的估计值。
事实上,多项式分布滞后模型比原分布滞后模型的多重共线性问题可能增强了,而不是削弱了。
(3) 科伊克(Koyck)方法:
科伊克方法是将无限分布滞后模型转换为自回归模型,然后进行估计。 6、局部调整假设可写成:(p172)
Yt01Xt(1)Yt1t
7、自回归模型的参数估计:
(1)工具变量法:解释变量Yt-1与随机扰动项t相关(例如科伊克模型、自适应预期模型)。
(2)普通最小二乘法:解释变量Yt-1与随机扰动项t同期无关(例如局部调整模型)。
8、格兰杰因果关系检验的概念:(p174)
格兰杰提出了一个简单的检验程序,习惯上称为格兰杰因果关系检验。 9、模型设定偏误的类型:(p177) ( 10、检验方法了解)
模型设定偏误主要有两大类:一类是关于解释变量选取的偏误,主要包括漏选相关变量和多选无关变量;另一类是关于模型函数形式选取的偏误。 (1)相关变量的遗漏;(2)无关变量的误选;(3)错误的函数形式。 练习题:
1、引入虚拟变量的作用是什么?有哪几种基本的引入方式?各适用于什么情
况? 答案是前面已写的第二个标题。 2、p186,不会。 3、(1)滞后变量模型有哪几种? 答案:前面已写第四个标题。 (2)普通最小二乘法存在什么问题?答案:工具变量法只解决了解释变量与t
相关对参数估计所造成的影响,但没有解决t的自相关问题。
事实上,对于自回归模型,t项的自相关问题始终存在,对于此问题,至今没
有完全有效的解决方法。唯一可做的,就是尽可能地建立“正确”的模型,以使序列相关性的程度减轻。
1、 产生模型设定偏误的原是什么?后果及检验方法是什么?
答案:原因是:一是关于解释变量选取的偏误,主要包括漏选相关变量和多选无
关变量;二是关于模型函数形式选取的偏误。
后果是:a、遗漏相关变量偏误: (1)如果X2与X1相关,1的估计量在
小样本下有偏,在大样本下非一致。 (2)如果X2与X1不相关,则1的估计量满足无偏性与一致性;但这时0的估计却是有偏的。
(3)随机扰动项的方差估计也是有偏的。 (4)a1估计量的方差是有偏的。 b、包含无关变量偏误: 对包含无关变量的模型进行估计,参数估计量是无偏的,但不具有最小方差性。
c、错误函数形式的偏误: 产生的偏误是全方位的。 检验方法:(1)检验是否含有无关变量:t检验:检验某1个变量是否应包括
在模型中; F检验:检验若干个变量是否应同时包括在模型中。 (2)检验是否有相关变量的遗漏或函数形式设定偏误:残差图示法 7、不会(p187)
第九章
1总体回归模型设定的“一般性”原则 p317-320 (1)正确的总体模型只能是一个。(2) “一般性”是“唯一性”原则的自然要求。 2模型关系设定的指导原则
(⒈) 经济学理论指导原则 经济学理论 已有的研究成果 (⒉) 统计分析指导原则 散点图 试拟合
对数据进行统计分析得到的是单个解释变量与被解释变量之间的关系 。
2.在多元线性回归分析中,t检验和F检验有何不同?在一元线性回归分析中二者是否有等价作用?(见课本P70)
答:在多元线性回归分析中,t检验常被用作检验回归方程中各个参数的显著性,而F检验则被用作检验整个回归关系的显著性。各解释变量联合起来对被解释变量有显著的线性关系,并不意味着每一个解释变量分别对被解释变量有显著的线性关系。
在一元线性回归分析中,二者具有等价作用,因为二者都是对共同的假设——解释变量的参数等于零一一进行检验。
第五章习题答案 1.回归模型中引入虚拟变量的作用是什么?有哪几种基本的引入方式?它们各适合用于什么情况?
答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。 加法方式与乘法方式是最主要的引入方式。
前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
2.在多元线性回归分析中,t检验和F检验有何不同?在一元线性回归分析中二者是否有等价作用?(见课本P70)
答:在多元线性回归分析中,t检验常被用作检验回归方程中各个参数的显著性,而F检验则被用作检验整个回归关系的显著性。各解释变量联合起来对被解释变量有显著的线性关系,并不意味着每一个解释变量分别对被解释变量有显著的线性关系。
在一元线性回归分析中,二者具有等价作用,因为二者都是对共同的假设——解释变量的参数等于零一一进行检验。
3.滞后变量模型有哪几种类型?分布滞后模型使用OLS方法存在哪些问题?
答:滞后变量模型有分布滞后模型和自回归模型两大类,前者只有解释变量及其滞后变量作为模型的解释变量,不包含被解释变量的滞后变量作为模型的解释变量;而后者则以当期解释变量与被解释变量的若干期滞后变量作为模型的解释变量。分布滞后模型有无限期的分布滞后模型和有限期的分布滞后模型;自回归模型又以Coyck模型、自适应预期模型和局部调整模型最为多见。
分布滞后模型使用OLS法存在以下问题:(1)对于无限期的分布滞后模型,由于样本观测值的有限性,使得无法直接对其进行估计。(2)对于有限期的分布滞后模型,使用OLS方法会遇到:没有先验准则确定滞后期长度,对最大滞后期的确定往往带有主观随意性;如果滞后期较长,由于样本容量有限,当滞后变量数目增加时,必然使得自由度减少,将缺乏足够的自由度进行估计和检验;同名变量滞后值之间可能存在高度线性相关,即模型可能存在高度的多重共线性。
4.产生模型设定偏误的主要原因是什么?模型设定偏误的后果以及检验方法有哪些?
答:产生模型设定偏误的原因主要有:模型制定者不熟悉相应的理论知识;对经济问题本身认识不够或不熟悉前人的相关工作:模型制定者手头没有相关变量的数据;解释变量无法测量或数据本身存在测量误差。
模型设定偏误的后果有:(1)如果遗漏了重要的解释变量,会造成OLS估计量在小样本下有偏,在大样本下非一致;对随机干扰项的方差估计也是有偏的。(2)如果包含了无关的解释变量,尽管OLS估计量具有无偏性与一致性,但不具有最小方差性。(3)如果选择了错误的函数形式,则后果是全方位的,不但会造成估计的参数具有完全不同的经济意义,而且估计结果也不同。
对模型设定偏误的检验方法有:检验是否含有无关变量,可以使用t检验与F检验完成:检验是否有相关变量的遗漏或函数形式设定偏误,可以使用残差图示法,Ramsey提出的RESET检验来完成。
因篇幅问题不能全部显示,请点此查看更多更全内容