意思
当前位置:首页 > 其他范文 > 意思 > 列表页

参数估计量的均值或期望值等于总体的真实值,你是如何理解这句话意思

小草范文网  发布于:2017-04-20  分类: 意思 手机版

篇一:计量经济学试题及答案

1.计量经济学模型:揭示经济现象中客观存在的因果关系,主要采用回归分析方法的经济数学模型。

2.参数估计的无偏性:它的均值或期望值是否等于总体的真实值。

3.参数估计量的有效性:它是否在所有线性无偏估计量中具有最小方差。 估计量的期望方差越大说明用其估计值代表相应真值的有效性越差;否则越好,越有效。不同的估计量具有不同的方差,方差最小说明最有效。

4.序列相关:即模型的随即干扰项违背了相互独立的基本假设。

5.工具变量:在模型估计过程中被作为工具使用,以替代与随即干扰项相关的随机解释变量。

6.结构式模型:根据经济理论和行为规律建立的描述经济变量之间直接关系结构的计量经济学方程系统。

7.内生变量:具有某种概率分布的随机变量,它的参数是联立方程系统估计的元素,内生变量是由模型系统决定的,同时也对模型系统产生影响。内生变量一般都是经济变量。

8.异方差:对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。

9. 回归分析 :研究一个变量关于另一个(些)变量的依赖关系的计算方法和理论 。其目的在于通过后者的已知或设定值,去估计和预测前者的(总体)均值。前一变量称为被解释变量或应变量,后一变量称为解释变量或自变量。

1.下列不属于线性回归模型经典假设的条件是( A ) ...

A.被解释变量确定性变量,不是随B.随机扰动项服从均值为0,方差恒定,

机变量。 且协方差为0。

C.随机扰动项服从正态分布。 D.解释变量之间不存在多重共线性。 ?2.参数?的估计量?具备有效性是指( B ) ??A.Var(?)?0 B.Var(?)为最小 ??C.E(???)?0 D. E(???)为最小

3.设Q为居民的猪肉需求量,I为居民收入,PP为猪肉价格,PB为牛肉价格,且牛

PBQ????I??P??P??i t01i2i3i肉和猪肉是替代商品,则建立如下的计量经济学模型:

?3?2和??1、?根据理论预期,上述计量经济学模型中的估计参数?应该是( C )

?3?0?3?0?2<0,??2>0,??1<0,??1<0,?A.? B.?

?3?0?3?0?2<0,??2>0,??1>0,??1>0,?C.? D.?

4.利用OLS估计模型Yi??0??1Xi??i求得的样本回归线,下列哪些结论是不正确的(D )

A.样本回归线通过(,)点

C.?Y??B.?i=0 ??D.Yi??0??1Xi

5.用一组有20个观测值的样本估计模型Yi??0??1Xi??i后,在0.1的显著

?的显著性作t检验,则?显著地不等于零的条件是t统计量性水平下对?11

绝对值大于( D )

A. t0.1(20) B. t0.05(20) C. t0.1(18) D. t0.05(18)

6.对模型Yi??0??1X1i??2X2i??i进行总体线性显著性检验的原假设是

( C )

A.?0??1??2?0

C.?1??2?0 B.?j?0,其中j?0,1,2 D.?j?0,其中j?1,2

7.对于如下的回归模型lnYi??0??1lnXi??i中,参数?1的含义是(D )

A.X的相对变化,引起Y的期望B.Y关于X的边际变化率

值的绝对变化量

C.X的绝对量发生一定变动时,D.Y关于X的弹性

引起Y的相对变化率

8.如果回归模型为背了无序列相关的假定,则OLS估计量(A )

A.无偏的,非有效的

C.无偏的,有效的

A.格里瑟检验

C.怀特检验 B.有偏的,非有效的 D.有偏的,有效的 B.戈德菲尔德-匡特检验 D.杜宾-沃森检验 9. 下列检验方法中,不能用来检验异方差的是( D)

10.在对多元线性回归模型进行检验时,发现各参数估计量的t检验值都很低,

但模型的拟合优度很高且F检验显著,这说明模型很可能存在( C )

A.方差非齐性

C.多重共线性 B.序列相关性 D.模型设定误差

11.包含截距项的回归模型中包含一个定性变量,且这个定性变量有3种特征,

则,如果我们在回归模型中纳入3个虚拟变量将会导致模型出现(A )

A.序列相关

C.完全共线性

A.与随机解释变量高度相关

重共线性

13.当模型中存在随机解释变量时,OLS估计参数仍然是无偏的要求(A)

A.随机解释变量与随机误差项独B.随机解释变量与随机误差项同

期相关 期不相关,而异期相关 是有偏的 C.随机解释变量与随机误差项同D.不论哪种情况,OLS估计量都B.异方差 D.随机解释变量 B.与被解释变量高度相关 12.下列条件中,哪条不是有效的工具变量需要满足的条件(B ) C.与其它解释变量之间不存在多D.与随机误差项不同期相关

14.在分布滞后模型Yt??0??1Xt??2Xt?1??t中,解释变量对被解释变量的长期影响乘数为( C )

A. ?1 B. ?2 C. ?1??2 D.?0??1??2

15.在联立方程模型中,外生变量共有多少个(B )

C. 3 D. 4 ????X?e??Y??i01ii的参数?0和?1的准则是使1.普通最小二乘法确定一元线性回归模型

(B )

A.∑ei最小

( B)

1??i?0nA. 22E(?)??iB.

2?~N(0,?) iD.A. 1 B. 2 B.∑ei2最小C.∑ei最大 D.∑ei2最大 2、普通最小二乘法(OLS)要求模型误差项?i满足某些基本假定。下列不正确的是C.

2E(?i?j)?0,i?j22 23.调整后的判定系数(k是待估参数的个数)(B ) n?1R与判定系数R2的关系是n?12A.R=1-(1-Rn)?n1?k B.R=1-(1-R)nn??1k

2222n?kRRRC.=(1-R) D. =(1-)n?k

4.在含有截距项的二元线性回归模型中随机误差项的无偏估计量是(D) ei2ei2ei2ei2

B.n?1 C.n?2D.n?3 ??5.设OLS法得到的样本回归直线为Yi??0??1Xi?ei,以下说法不正确的是 (D )

e?0A.?i B.(,)落在回归直线上 A. n

C.?YD.Cov(Xi,ei)?0

6.根据样本资料估计得到如下的人均产出Y对人均资本存量K的样本回归模??lnY?5?0.7lnKi型:i。这表明人均资本存量每增加1%,人均产出预期将增加( B )

A. 0.3% B. 0.7% C. 3% D. 7%

7. 设M为货币需求量,Y为收入水平,r为利率。根据凯恩斯流动性偏好理论,建立如下的货币需求计量经济学模型:Mt??0??1Yt??2rt??t根据理论预期,上述计量

?2应该是(C ) ?1和?经济学模型中的估计参数?

?2<0 ?2>0 ?1<0,??1<0,?A.?B.?

?2<0 ?1>0,?C.??2>0 ?1>0,?D.?

8. 逐步回归法既可检验又可修正(D )

A.异方差性 B.自相关性 C.随机解释变量 D.多重共线性

9. 怀特检验方法可以检验(C )

A.多重共线性

C.异方差性

A.4-dL<DW值<4 B.自相关性 D.随机解释变量 B.0< DW值<dL 10. DW检验中,存在负自相关的区域是( A )

C.du< DW值<4-du

型中需引入( C )

A.一个虚拟变量

C.三个虚拟变量 D.dL< DW值<du,4-du< DW值<4-dL 11.没有截距项的回归模型中包含一个定性变量,并且这个变量有三种特征,则回归模B.二个虚拟变量 D.四个虚拟变量

B.随机解释变量

D.异方差

B.有偏的,非有效的

D.有偏的,有效的 12.工具变量法可以用来克服(B ) A.多重共线性 C.自相关 A.无偏的,非有效的 C.无偏的,有效的

A.0.6 B.0.5C.0.1 D.1.1

15.在联立方程模型中,不属于外生变量的前定变量共有多少个( A)

A. 1 B. 2 C. 3 D. 4

1.现有2008年中国31个省(自治区、直辖市)的居民收入(Y)和居民消费支出(X)数据。如果我们以上述样本数据来估计中国居民的消费函数,问:怎样设定回归方程来能够完全捕捉到中国东部、中部和西部地区居民消费函数的差异?

2.有如下的计量经济学模型:Yi??0??1Xi??i,且Var(?i)?f(Xi)。请问上述计量经济学模型违背了哪条经典假设?我们应该如何修正上述模型?

3.对于如下的有限分布滞后模型:Yt?????iXt?i??t,我们在估计这样的模型时,面临着哪些主要的困难?请你说明有哪些方法可以克服上述困难?

4、有如下的联立方程模型:

?Ct??0??1Yt??2Ct?1??1t??It??0??1Yt??3rt??2t

?Y?C?I?Gttt?ti?0613.如果回归模型为背了同方差的假定,则OLS估计量(A) 14. 在有限分布滞后模型Yt=0.9+0.6Xt-0.5Xt-1+ut中,长期影响乘数是( D)

其中,C—消费;I—投资;Y—总收入;r—利率;G—政府支出。请写出上述联立方程模型的结构式参数矩阵。

?X???X?e。对上述模型,是否仍然能1.考虑如下过原点的线性回归:Yi??11i22ii

够得到如下的结论:

?e

i?0?eXi1i?0?eXi2i?0

2.在如下的计量经济学模型中:Yt??0??1Xt??t,存在?t???t?1??t,请问如何修正上述计量模型才能使得其系数的OLS估计量具有BLUE的性质。

3.有如下的消费计量模型:Si??0??1Yi??i(其中Si为居民储蓄,Yi为居民收入)。如果农村居民和城镇居民的边际储蓄倾向是不同的,则我们应该如何修正上述模型。

4.请将如下的随机生产函数Yi?AiKiLie?i转化为线性的计量经济学模型,并说明参

数?和?的经济意义。

1.下面的数据是对X和Y的观察值得到的: ??

?Y?285.503,?Xii?118.790,?YiXi?1089.314,?Yi2?2663.893

222;,,X?492.750xy??4.708x?37.556y?i?ii?i?i?34.477

其中xi,yi分别为Xi,Yi的离差;观测值个数为31。问:

(1) 用普通最小二乘法计算完成如下二元线性回归模型的参数估计

Yi??0??1Xi??i

(2) 求拟合优度R2

(3) 在0.05的显著性水平下检验估计参数是否显著

(4) 求出?0和?1在0.95置信度下的置信区间

(附:t0.025(30)?2.042,t0.05(30)?1.697;t0.025(29)?2.045,t0.05(29)?1.699

2.现有2006年中国31个省(自治区、直辖市)的火灾经济损失Y(单位:亿元)和保费收入X(单位:亿元)的数据。我们的目的是估计中国的保费收入对火灾经济损失的影响,因此,我们建立了如下的回归方程:lnYi??0??1lnXi??i

进一步的,我们借助Eviews软件完成了上述回归方程的估计,Eviews软件的输出结果如下:

Dependent Variable: LN(Y)

Method: Least Squares

Sample: 1 31

Included observations: 31

Coefficie

Variable nt Std. Error t-Statistic Prob.

-4.05473

C 8 1.414064 0.0076 Adjusted R-squared 0.558284 S.D. dependent var 1.235830

篇二:无偏估计

样本平均数的平均数是总体平均数的无偏估计。

Sn 是对总体标准差的有偏估计,Sn-1是对总体标准差的无偏估计。

还要注意,“样本的标准差”、“总体的标准差”与“样本平均数的标准差”、“总体平均数的标准差”不是一回事。

无偏估计

无偏估计是

参数估计量的均值或期望值等于总体的真实值,你是如何理解这句话意思

参数的样本估计量的期望值等于参数的真实值。估计量的数学期望等于被估计参数,则称此为无偏估计。 设A'=g(X1,X2,...,Xn)是未知参数

A的一个点估计量,若A'满足

E(A')= A

则称A'为A的无偏估计量,否则为有偏估计量。

注:无偏估计就是系统误差为零的估计。

其中的自由度不再是原有的样本量,需要看情况减去

应该在此进一步解释,无偏估计量

无偏性

估计值在待估参数的真值附近摆动,对待估参数的真值无偏倚。从分析测试的观点看,无偏性意味着测定的准确度。

总体参数的无偏估计量的意义为:样本估计量(平均数、变异数、方差等)的数学期望等于母体真值。 一个估计量若是无偏的,则其概率分布的期望值就等于它所估计的参数。无偏性并不是说我们用任何一个特定样本得到的估计值等于d,甚或很接近0。而是说,如果我们能够从总体中抽取关于Y的无限多个样本,并且每次都计算一个估计值,那么将所有随机样本的这些估计值平均起来,我们便得到。由于在大多数应用中,我们仅使用一个随机样本,所以这个思维实验有些抽象。

无偏估计量

对于待估参数,不同的样本值就会得到不同的估计值。这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来衡量

定义

无偏估计量,数学期望等于被估计的量的统计估计量。

设^θ(X1,X2,?,Xn)是θ的估计量,若E(^θ)=θ,对一切θ∈Θ,则称^θ为θ的无偏估计量,否则称为θ的有偏估计量。

无偏估计量的定义是:设(ξ∧)是ξ的一个估计量,若E(ξ∧)=ξ ,则称ξ∧是ξ的无偏估计量 下面说明题目中的四个估计量都是λ的无偏估计量。因为ξ8、ξ8、ξ8 都是取自参数为λ的泊松总体的样本。 无偏性

对于待估参数,不同的样本值就会得到不同的估计值。这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来衡量。对此,一个自然而基本的衡量标准是要求估计量无系统偏差。也就是说,尽管在一次抽样中得到的估计值不一定恰好等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,换句话说,希望估计量的均值(数学期望)应等于未知参数的真值,这就是所谓无偏性(Unbiasedness)的要求。

举例 下面说明题目中的四个估计量都是λ的无偏估计量。首先,因为ξ1、ξ2、ξ3 都是取自参数为λ的泊松总体的样本,独立同分布,所以它们的期望和方差都是λ ,则

(1)无偏性E(λ1∧)= E(ξ1)= λE(λ2∧)= E[(ξ1+ξ2)/2]= (λ+λ)/2 = λE(λ3∧)= E[(ξ1+2*ξ2)/3]= (λ+2λ)/3 = λE(λ4∧)= E[(ξ1+ξ2+ξ3)/3]= (λ+λ+λ)/3 = λ

(2)有效性,即最小方差性D(λ1∧)= D(ξ1)= λD(λ2∧)= D[(ξ1+ξ2)/2]= [D(ξ1)+D(ξ2)]/4= (λ+λ)/4 = λ/2D(λ3∧)= D[(ξ1+2*ξ2)/2]= [D(ξ1)+4D(ξ2)]/9= (λ+4λ)/9 = 5λ/9D(λ4∧)= D[(ξ1+ξ2+ξ3)/3]= [D(ξ1+ξ2+ξ3)]/9 =(λ+λ+λ)/9 = λ/3其中 D(λ4∧)= λ/3 最小,所以无偏估计量 λ4∧最有效。

估计值

为了估计未知参数θ,我们构造一个统计量h(X1,??,Xn),然后用h(X1,??,Xn)的值h(x1,??xn)来估计θ的真值,称h(X1,??,Xn)为θ的估计量,称h(x1,??xn)为θ的估计值。

在物理学计量中,估读值是测量值的一部分,是读出准确值后,余下的一位数要进行估读,其结果为估计值,跟测量者有关

设(X1,??,Xn)为来自总体X的样本,(x1,??xn)为相应的样本值,θ是总体分布的未知参数,θ∈Θ, Θ表示θ的取值范围,称Θ为参数空间。尽管θ是未知的,但它的参数空间Θ是事先知道的。为了估计未知参数θ,我们构造一个统计量h(X1,??,Xn),然后用h(X1,??,Xn)的值h(x1,??xn)来估计θ的真值,称h(X1,??,Xn)为θ的估计量,称h(x1,??xn)为θ的估计值

数学期望

1类型

离散型

离散型随机变量的一切可能的取值xi与对应的概率Pi(=xi)之积的和称为该离散型随机

变量的数学期望[1] (设级数绝对收敛),记为E(x)。数学期望是最基本的数学特征之一。

它反映随机变量平均取值的大小。又称期望或均值。如果随机变量只取得有限个值,称之

为离散型随机变量的数学期望。它是简单算术平均的一种推广,类似加权平均。例如某城

市有10万个家庭,没有孩子的家庭有1000个,有一个孩子的家庭有9万个,有两个孩子的家庭有6000个,有3个孩子的家庭有3000个, 则此城市中任一个家庭中孩子的数目是一个随机变量,记为X,它可取值0,1,2,3,其中取0的概率为0.01,取1的概率为0.9,取2的概率为0.06,取3的概率为0.03,它的数学期望为0×0.01+1×0.9+2×0.06+3×0.03等于1.11,即此城市一个家庭平均有小孩1.11个,用数学式子表示为:E(X)=1.11。 连续型

设连续性随机变量X的概率密度函数为f(x),若积分绝对收敛,则称积分的值为随机变量的数学期望,记为E(X)。

若随机变量X的分布函数F(x)可表示成一个非负可积函数f(x)的积分,则称X为连续性随机变量,f(x)称为X的概率密度函数(分布密度函数)。

能按一定次序一一列出,其值域为一个或若干个有限或无限区间,这样的随机变量称为离散型随机变量。 离散型随机变量与连续型随机变量也是由随机变量取值范围(取值)确定,

变量取值只能取离散型的自然数,就是离散型随机变量,

比如,一次掷20个硬币,k个硬币正面朝上,

k是随机变量,

k的取值只能是自然数0,1,2,?,20,而不能取小数3.5、无理数√20,

因而k是离散型随机变量。

如果变量可以在某个区间内取任一实数,即变量的取值可以是连续的,这随机变量就称为连续型随机变量, 比如,公共汽车每15分钟一班,某人在站台等车时间x是个随机变量,

x

的取值范围是[0,15),它是一个区间,从理论上说在这个区间内可取任一实数3.5、√20等,因而称这随机变量是连续型随机变量。

连续型随机变量X的概率密度函数为f(x),若积分绝对收敛,则称此积分值为随机变量X的数学期望,记为:

2定义 定义1

按照定义,离散随机变量的一切可能取值与其对应的概率P的乘积之和称为数学期望,记为E.如果随机变量只取得有限个值:x,y,z,...则称该随机变量为离散型随机变量。

定义2

1 决定可靠性的因素常规的安全系数是根据经验而选取的,即取材料的强度极限均值(概率理论中称为数学期望)与工作应力均值(数学期望)之比

3计算 随机变量

在概率论和统计学中,一个离散性随机变量的期望值(或数学期望、或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和。换句话说,期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常识中的“期望”——“期望值”也许与每一个结果都不相等。(换句话说,期望值是该变量输出值的平均数。期望值并不一定包含于变量的输出值集合里。)

单独数据

对于数学期望的定义是这样的。数学期望

E(X) = X1*p(X1) + X2*p(X2) + ?? + Xn*p(Xn)

X1,X2,X3,??,Xn为这几个数据,p(X1),p(X2),p(X3),??p(Xn)为这几个数据的概率函数。在随机出现的几个数据中p(X1),p(X2),p(X3),??p(Xn)概率函数就理解为数据X1,X2,X3,??,Xn出现的频率f(Xi).则:

E(X) = X1*p(X1) + X2*p(X2) + ?? + Xn*p(Xn) = X1*f1(X1) + X2*f2(X2) + ?? + Xn*fn(Xn) 很容易证明E(X)对于这几个数据来说就是他们的算术平均值。

我们举个例子,比如说有这么几个数:

1,1,2,5,2,6,5,8,9,4,8,1

1出现的次数为3次,占所有数据出现次数的3/12,这个3/12就是1所对应的频率。同理,可以计算出f(2) = 2/12, f(5) = 2/12,f(6) = 1/12,f(8) = 2/12,f(9) = 1/12,f(4) = 1/12 根据数学期望的定义:

E(X) = 1*f(1) + 2*f(2) + 5*f(5) + 6*f(6) + 8*f(8) + 9*f(9) + 4*f(4) = 13/3

所以 E(X) = 13/3,

这些数的算术平均值:

Xa = (1+1+2+5+2+6+5+8+9+4+8+1)/12 = 13/3

所以E(X) = Xa = 13/3

怎样理解估计量的无偏性?

所谓总体参数估计量的无偏性指的是,基于不同的样本,使用该估计量可算出多个估计值,但它们的平均值等于被估参数的真值。 在某些场合下,无偏性的要求是有实际意义的。例如,假设在某厂商与某销售商之间存在长期的供货关系,则在对产品出厂质量检验方法的选择上,采用随机抽样的方法来估计次品率就很公平。这是因为从长期来看,这种估计方法是无偏的。比如这一次所估计出来的次品率实际上偏高,厂商吃亏了;但下一次的估计很可能偏低,厂商的损失就可以补回来。由于双方的交往会长期多次发生,这时采用无偏估计,总的来说可以达到互不吃亏的效果。

不过,在某些场合中,无偏性的要求毫无实际意义。这里又有两种情况:一种情况是在某些场合中不可能发生多次抽样。例如,假设在某厂商和某销售商之间只会发生一次买卖交易,此后不可能再发生第二次商业往来。这时双方谁也吃亏不起,这里就没有什么“平均”可言。另一种情况则是估计误差不可能相互补偿,因此“平均”不得。例如,假设需要通过试验对一个批量的某种型号导弹的系统误差做出估计。这个时候,既使我们的估计的确做到了无偏,但如果这一批导弹的系统误差实际上要么偏左,要么偏右,结果只能是大部分导弹都不能命中目标,不可能存在“偏左”与“偏右”相互抵消,从而“平均命中”的概念。

由此可见,具有无偏性的估计量不一定就是我们“最需要”的“恰当”估计量。 无偏估计实例证明

无偏估计

在概率论和数量统计中,学习过无偏估计,最近在学习论文时候,也经常论文中提到无偏估计。虽然对无偏估计有所了解,但是还是有些问题:

1)总体期望的无偏估计量是样本均值x-,总体方差的无偏估计是样本方差S^2,为什么样本方差需要除以n-1,而不是除以n;

2)样本在总体中是怎样的抽样过程,是放回抽样,是随机抽样,还是不放回抽样等等。

为了解决这个问题,首先来回忆一下什么叫无偏估计:

无偏估计是参数的样本估计值的期望值等于参数的真实值。估计量的数学期望等于被估计参数,则称此为无偏估计。

设A'=g(X1,X2,...,Xn)是未知参数A的一个点估计量,若A'满足

E(A')= A

则称A'为A的无偏估计量,否则为有偏估计量。

注:无偏估计就是系统误差为零的估计。

由于公式A'=g(X1,X2,...,Xn)中的X1,X2,...,Xn一般为一次抽样的结果,没有明确是怎么抽样的一个过程,所以导致不好理解为什么A'就是A的无偏估计量,特别是很难举出实例来给与证明。经过自己的查阅资料和理解,实际上无偏估计量可以理解如下:

简单的理解,无偏估计量就是:在样本中进行n次随机的抽样,每次抽样都可以计算出一个对某一个参数的点估计量,计算n次,得到n个点估计量,然后对n个点估计量计算期望,得到的值和需要估计的总体参数相等,则称n中的任何点估计量为总体参数的无偏估计量。

能否举出一个例子呢?因为实际的应用中总体是不知道,只有样本,这能够举例子吗?是可以的,不妨设总体容量为3,样本容量为2,计算出总体方差的无偏估计为样本方差,而且样本方差是除以n-1,而不是除以n。

上图为手算的两个例子,说明了总体方差的无偏估计量是样本方差,总体方差是除以n,样本方差是除以n-1。

篇三:第三章参数估计

第三章参数估计

重点:

1.总体参数与统计量

2.样本均值与样本比例及其标准误差

难点:

1.区间估计

2.样本量的确定

知识点一:总体分布与总体参数

统计分析数据的方法包括:描述统计和推断统计(第一章)

推断统计是研究如何利用样本数据来推 断总体特征的统计学方法,包括参数估计和假设检验两大类。

总体分布是总体中所有观测值所形成的分布。

总体参数是对总体特征的某个概括性的度量。通常有

总体平均数( μ)

总体方差(σ )

总体比例( π)

知识点二:统计量和抽样分布

总体参数是未知的,但可以利用样本信息来推断。

统计量是根据样本数据计算的用于推断总体的某些量,是对样本特征的某个概括性度量。

统计量是样本的函数,如样本均值()、样本方差( s)、样本比例(p)等。

构成统计量的函数中不能包括未知因素。

由于样本是从总体中随机抽取的,样本具有随机性,由样本数据计算出的统计量也就是随机的。统计量的取值是依据样本而变化的,不同的样本可以计算出不同的统计量值。

[例题·单选题]以下为总体参数的是( )

a.样本均值b.样本方差

c.样本比例d.总体均值

答案:d

解析:总体参数是对总体特征的某个概括性的度量。通常有总体平均数、总体方差、总体比 例题·判断题:统计量是样本的函数。

答案:正确 22

解析:统计量是样本的函数,如样本均值()、样本方差(

量的函数中不能包括未知因素。 )、样本比例(p)等。构成统计

[例题·判断题]在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。

答案:错误

解析:作为推断对象的总体是唯一的,但作为观察对象的样本不是唯一的,不同的样本可以计算出不同的统计量值。。

(一)样本均值的抽样分布

设总体共有n个元素,从中随机抽取一个容量为n的样本,在重置抽样时,共有n种抽法,即n

可以组成n不同的样本,在不重复抽样时,共有n

个可能的样本。每一个样本都可以计算出一个均值,这些所有可能的抽样均值形成的分布就是样本均值的分布。

但现实中不可能将所有的样本都抽取出来,因此,样本均值的概率分布实际上是一种理论分布。 数理统计学的相关定理已经证明:

即样本均值的均值就是总体均值。

在重置抽样时,样本均值的方差为总体方

在不重置抽样时,样本均值的方差为

的1/n,即

其中,为修正系数,对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,n比较大而n/n≥5% 时,修正系数可以简化为1-n/n,当n比较大,而n/n<5%时,修正系数可以近似为1,即可以按重置抽样计算。

当总体服从正态分布时,样本均值一定服从正态分布,即有x~n(,)时,~n(,) 若总体为未知的非正态分布时,只要样本容量 n足够大(通常要求n ≥30),样本均值仍会接近

正态分布。样本分布的期望值为总体均值,样本方差

著名的中心极限定理。

为总体方差的1/n 。这就是统计上

该定理可以表述为:从均值为,

方差为的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n ≥30)

,样本均值的分布近似服从均值为,方差为的正态分布。

如果总体不是正态分布,当n为小样本时(通常n<30),样本均值的分布则不服从正态分布。

[例题·单选题]设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在重置抽样时,共有( )个样本

a.25 b.10 c.5 d.1

答案:a

解析:在重置抽样时,共有n种抽法,共有样本n个,即5=5×5=25个。

[例题·单选题]设一个总体共有5个元素,从中随机抽取一个容量为2的样本,在不重置抽样时,共有( )个样本

a.25 b.10

c.5 d.1

答案:b nn2

解析:在不重复抽样时,共

有个可能的样本。

(个)

(二)样本比例的抽样分布

比例是指具有某种属性的单位占全部单位数的比重。

总体比例(通常用 π表示)是总体中具有某种属性的单位数占全部总体单位数的比例,是一个参数,通常是未知的,也是我们想通过抽样得到的说明总体特征的数据。

样本比例(通常用p表示)是随机抽取的样本中具有某种属性的单位数占样本全部单位数的比例,是一个样本统计量,是随机变量,对于一个已经抽取出来的样本来讲,是可以观察到的。描述所

有可能样本比例的概率分布就是样本比例的抽样分布。

当样本容量比较大时,样本比例p近似服从正态分布,且有p的数学期望就是总体比率π ,即σ(p)=π

而p的方差与抽样方法有关,

在重置抽样下为,

在不重置抽样下为 即在重置抽样时, p的分布为p~n(,)

在不重置抽样时, p的分布为p~n(,)

一般讲,当 np≥5,并n(1-p) ≥5时,就可以认为样本容量足够大。对于无限总体进行不重置抽样时,可以按照重置抽样计算,当总体为有限总体,当n比较大,而n/n ≤ 5%时,修正系数

会趋向1,这时也可以按重置抽样计算方差。

从上述分析可以看出,随着样本容量的增大,样本比例的方差愈来愈小,说明样本比例随样本容量增大,围绕总体比例分布的峰度愈来愈高。

[例题·单选题]当样本容量比较大时,在重置抽样条件下,样本比例p的方差为() a. 答案:a b. c. d.

解析:当样本容量比较大时,在重置抽样条件下,样本比例p

的方差为

[例题·单选题]设一个总体含有3个可能元素,取值分别为1,2,3。从该总体中采取重复抽样方法抽取样本量为2的所有可能样本,样本均值为2的概率值是( )

a.1/9 b.2/9 c.1/3 d. 4/9

答案:c

解析:在重复抽样下,样本为1,2,3的概率都是1/3。

[例题·判断题] 样本容量是指从一个总体中可能抽取的样本个数。

答案:错误

解析:样本容量是样本中个体的数目。一个总体可以有多个样本,各个样本的的容量可以相同可以不同。

[例题·判断题]在确定总体比例估计中的样本容量时,如果缺少比例的方差,常取比例值为 0.5。 答案:正确

知识点三:统计量的标准误差

统计量的标准误差也称为标准误,是指样本统计量分布的标准差。可用于衡量样本统计量的离散程度。在参数估计中,它是用于衡量样本统计量与总体参数之间差距的一个重要尺度。

样本均值的标准误计算公式为:

当总体标准差 σ未知时,可用样本标准差s代替计算,这时计算的标准误差称为估计标准误差。

相应地,样本比例的标准误计算公式为

同样,当总体比例的方差π(1-π )未知时,可用样本比例的方差p(1-p)代替。

[例题·单选题] 样本均值的标准误差计算公式为( ) a. b. c.

d.

答案:b

解析:样本均值的标准误差计算公式为

[例题·单选题]样本比例的标准误差计算公式为() a. b. c. d.

本文已影响