下面对数据样本方差解释不正确的是()。
A.方差描述了样本数据在平均值附近的波动程度
B.方差刻画了随机变量或一组数据离散程度
C.方差(样本方差)是每个样本数据与全体样本数据平均值之差的平方和的平均数
D.方差刻画了样本数据的大小
A.方差描述了样本数据在平均值附近的波动程度
B.方差刻画了随机变量或一组数据离散程度
C.方差(样本方差)是每个样本数据与全体样本数据平均值之差的平方和的平均数
D.方差刻画了样本数据的大小
第1题
计算样本均值与样本方差时,常常先对数据x1,x2,...,xn作线性变换=(a,b为常数,b≠0),设分别是x1,x2,...,xn的样本均值和样本方差,分别是y1,y2,...,yn的样本均值和样本方差。证明:。
第2题
利用NYSE.RAW中的数据。
(i)估计教材方程(12.47)中的模型并求OLS残差平方。求u2t在整个样本中的平均值、最小值和最大值。
(ii)利用OLS残差平方估计如下的异方差性模型
报告估计系数、标准误、R²和调整R²。
(ii)将条件方差描述成滞后return-1的函数。方差在return_,取何值时最小?这个方差是多少?
(iii)为了预测动态方差,第(ii)部分的模型得到了负的方差估计值吗?
(v)第(ii)部分中的模型拟合效果比教材例12.9中的ARCH(1)模型更好还是更差?请解释。
(vi)在教材方程(12.51)的ARCH(1)回归中添加二阶滞后ut-22。这个滞后看起来重要吗?这个ARCH(2)模型比第(ii)部分中的模型拟合得更好吗?
第3题
A.样本越少,模型的方差越大
B.如果模型性能不佳,可减少样本多样性进行优化
C.增加数据可以减少模型方差
D.样本越多,模型训练越快,性能越好
第4题
bwght=119.77-0.514cigs
(i)当cigs=0时,预计婴儿的出生体重为多少?当cigs=20(每天一包)时呢?评价其差别。
(ii)这个简单回归能够得到婴儿出生体重和母亲抽烟习惯之间的因果关系吗?请解释。
(iii)要预测出生体重125盎司,cigs应该为多少?
(iv)样本中在怀孕期间不抽烟的妇女比例约为0.85。这有助于解释第(iii)部分中的结论吗?
第7题
使用PNTSPRD.RAW中的数据。
(i)变量sprdcvr是一个二值变量,若在大学篮球比赛中实际分数差距超过拉斯维加斯让分,则此变量取值1。sprdcvr的期望值(比方说u)表示在一场随机抽取的比赛中分差超过让分的概率。在10%的显著性水平上相对于H1:μ≠0.5检验H0:μ=0.5,并讨论你的结果。(提示:将sprdcvr只对一个截距项进行回归便得到一个r统计量,利用这个统计量很容易完成。)
(ii)553个样本中有多少场比赛是在中立场地进行的?
(iii)估计线性概率模型
并以通常的形式报告结论。(报告通常的标准误和异方差-稳健的标准误。)哪个变量在实际上和统计上都是最显著的?
(iv)解释为什么在原假设下,模型中不存在异方差性。
(v)利用通常的F统计量检验第(iv)部分的原假设,你得到了什么结论?
(vi)给定上述分析,你会不会认为,利用赛前可利用的信息,有可能系统地预测拉斯维加斯让分能否实现?
第9题
A.每一条观察值都是一个不同的个体,可视为独立样本
B.在横截面数据分析中,观察值的顺序并不重要
C.横截面数据往往来自于宏观经济调查
D.横截面数据常见的计量问题是异方差
第10题
利用FERTIL1.RAW中的数据。
(i)对教材例13.1所估计的方程中,检验16岁时的生活环境是否对生育率产生影响(以大城市为基组)。报告F统计量的值及其p值。
(ii)检验16岁时所在区域(以南方为基组)是否对生育率产生影响。
(iii)令u为总体方程中的误差项。假设你认为u的方差随时间而变(但不随educ,age等而变)。那么刻画这一特点的一个模型是
利用这个模型去检验u的异方差性。(提示:你的F检验应有6和1122个自由度。)
(iv)在教材表13-1所估计的方程中增加交互项y74-educ,y76educ,···,y84-educ。解释这些项代表了什么?它们是联合显著的吗?
第11题
在本题中,你将比较参与401(k) 计划的资格对净金融资产影响的OLS和LAD估计值。模型是
(i) 利用401KSUBS.RAW中的数据与OLS估计这个方程, 按照通常形式报告结果, 并解释e40lk的系数。
(ii) 利用布罗施-帕甘检验, 使用OLS残差检验异方差性。u看上去独立于解释变量吗?
(ii) 用LAD估计这个方程, 并以对OLS同样的方式报告结果。解释LAD的估计值p。
(iv)调和第(i)部分和第(iii)部分的结论。