线性回归中,检验回归模型的F统计量,通常与给定的F临界值做比较,这里与F相比较的临界值取为,如果是一元线性回归,则临界值直接取为,这里的参数的含义为:
A.为显著性水平,k为回归模型中自变量的个数,n为样本容量
B.为显著性水平,k为样本容量,n为回归模型中自变量的个数
C.为显著性水平,k为回归模型中自变量的次数,n为样本容量
D.为显著性水平,k为回归模型中自变量的个数,n为回归模型中自变量的次数
A.为显著性水平,k为回归模型中自变量的个数,n为样本容量
B.为显著性水平,k为样本容量,n为回归模型中自变量的个数
C.为显著性水平,k为回归模型中自变量的次数,n为样本容量
D.为显著性水平,k为回归模型中自变量的个数,n为回归模型中自变量的次数
第1题
使用PNTSPRD.RAW中的数据。
(i)变量sprdcvr是一个二值变量,若在大学篮球比赛中实际分数差距超过拉斯维加斯让分,则此变量取值1。sprdcvr的期望值(比方说u)表示在一场随机抽取的比赛中分差超过让分的概率。在10%的显著性水平上相对于H1:μ≠0.5检验H0:μ=0.5,并讨论你的结果。(提示:将sprdcvr只对一个截距项进行回归便得到一个r统计量,利用这个统计量很容易完成。)
(ii)553个样本中有多少场比赛是在中立场地进行的?
(iii)估计线性概率模型
并以通常的形式报告结论。(报告通常的标准误和异方差-稳健的标准误。)哪个变量在实际上和统计上都是最显著的?
(iv)解释为什么在原假设下,模型中不存在异方差性。
(v)利用通常的F统计量检验第(iv)部分的原假设,你得到了什么结论?
(vi)给定上述分析,你会不会认为,利用赛前可利用的信息,有可能系统地预测拉斯维加斯让分能否实现?
第3题
在例9.1中,我们narr86在的一个线性模型中增加二次项pcrv2、ptime86²和inc 862。
(i)利用CRIME L RAW中的数据, 在例17.3的泊松回归中同样增加这些项。
(ii)根据估计 。数据存在过度散布的证据吗?该如何调整泊松极大似然估计标准误?
(iii)利用第(i)部分和第(ii)部分的结论及教材表17.3,计算这三个平方项联合显著性的准似然比统计量。你得到什么结论?
第5题
本题要用到TRAFFIC2.RAW中的数据。加州1981年至1989年交通事故的这些月度观测在第10章计算机习题11中曾被使用过。
(i)利用标准的迪基-富勒回归, 检验Itotacc, 是否具有单位根。在2.5%的显著性水平上, 你能拒绝单位根的存在吗?
(ii)现在,在第(i)部分的检验中增加两个滞后变化,并计算增广迪基-富勒检验。你得到什么结论?
(iii)在第(ii) 部分的ADF回归中增加一个线性时间趋势变量。现在情况又将如何?
(iv)根据第(i) 部分至第(ii) 部分的结论, 你认为对I to tacc, 的最好刻画是:一个Ⅰ(1)过程还是一个含有线性时间趋势的Ⅰ(O)过程?
(v)在一个ADF回归中, 利用两个滞后项来检验致死交通事故百分数pre fat是否存在单位根。在此情形中,包含一个线性时间趋势与否是否有关系?
第6题
A.x与y线性关系显著
B.x与y线性关系不显著
C.x与y线性关系是否显著无法判断
D.以上说法都不对
第7题
A.逻辑斯蒂回归中所使用Sigmoid函数的输出形式是概率输出
B.逻辑斯蒂回归是一种非线性回归模型
C.在逻辑斯蒂回归中,输入数据特征加权累加值在接近−∞或+∞附近时,模型输出的概率值变化很大
D.在逻辑斯蒂回归中,能够实现数据特征加权累加
第8题
A.H0:β0=β1=0,并运用F检验
B.H0:β1=0,并运用F检验
C.H0:β1=0,运用T检验
D.B和C都是正确的,可以仍选其一进行检验
第9题
薪水信息和职业统计。
(i)估计一个将每场得分(points)与加入联盟年数(exper)、年龄(age)、大学期间打球年数(coll)相联系的模型。包含一个exper的二次项,其他变量都应该以水平值形式加入模型。按照通常的格式报告结果。
(ii)保持大学打球年数和年龄不变,从加入联盟的第几个年份开始,在NBA打球的经历实际上将降低每场得分?这讲得通吗?
(iii)你为什么认为coll具有负系数,而且统计显著?(提示:NBA运动员在读完大学之前被选拔出,甚至直接从高中选出。)
(iv)有必要在方程中增加age的二次项吗?一旦控制了exper和coll之后,这对年龄效应意味着什么?
(v)现在将log(wage)对points,exper,exper2,age和coll回归。以通常的格式报告结论。
(vi)在第(v)部分的回归中检验age和coll是否联合显著。一旦控制了生产力和资历,这对考察年龄和受教育程度是否对工资具有单独影响这个问题有何含义?
第10题
本题需要使用ELEM 94-95中的数据, 也可参见计算机习题C 4.10。
(i) 利用所有数据, 将lavg sal对bs, lenrol, Istaff和lunch进行回归。报告bs的系数及其常用标准误和异方差-稳健标准误。你对的经济显著性和统计显著性得到什么结论?
(ii)现在去掉四个bs>0.5的观测,即平均福利(假设)占平均薪水50%以上的观测。bs的系数又是多少?利用异方差-稳健标准误来判断,它在统计上显著吗?
(iii)验证bs>0.5的四个观测分别为68、1127、1508和1670。为它们各定义一个虚拟变量。(你可以称它们为d68、d1127、d 1508和d 1670.) 把它们添加到第(i) 部分的回归中, 验证其他变量的OLS系数及其标准
误与第(ii)部分中的结果相同。在5%的显著性水平上,这四个虚拟变量中哪个变量的t统计量在统计上显著不等于0?
(iv)在这个数据集中,验证第(iii)部分回归中具有最大学生化残差(该虚拟变量的t统计量最大)的数据点对OLS估计值具有很大的影响。(即利用除去具有最大学生化残差的数据点之外的所有观测进行OLS回归。)依次去掉bs>0.5的每个观测都具有重要影响吗?
(v) 即便在大样本中, 就OLS对单个观测的敏感性而言, 你有何结论?
(vi) 在第(iji) 部分, 验证LAD估计量对包含这些观测不是很敏感。