首页 >> 新闻动态 >> 新闻标题
Stata 18如约而至,20大更新,尝鲜试用,等您申请!
2023-04-26
2023年4月25日,StataCorp正式发布Stata 18版本,Stata 18很多功能都有大的更新或者功能扩展,具体更新主要包括以下20个方面:
1. Bayesian model averaging
2. Causal mediation analysis
3. Tables of descriptive statistics
4. Heterogeneous DID
5. Group sequential designs
6. Multilevel meta-analysis
7. Meta-analysis for prevalence
8. Robust inference for linear models
9. Wild cluster bootstrap
10. Local projections for IRFs
11. Flexible dema.nd system models
12. TVCs with interval-censored Cox model
13. Lasso for Cox model
14. RERI
15. IV quantile regression
16. IV fractional probit model
17. Alias variables across frames
18. Data Editor enhancements
19. Do-file Editor enhancements
20. All-new graph style
此外,还有其他新增功能:
? Corrected & consistent AIC
? Model selection for ARIMA & ARFIMA
? GOF plots for survival models
? New spline functions
? Graph colors by variable
? Create, load, & save sets of frames
? Boost-based regular expressions
? Vectorized numerical integration, &
? New reporting features in putdocx, putexcel, & putpdf
1. Bayesian model averaging (BMA)
过去,您选择一个模型,并在此模型的基础上进行分析。结果也是以所选择的模型为条件。但是,当存在多个可信模型的情况时,这种方法可能就不可靠了。模型平均允许您基于多个模型进行分析,从而在结果中考虑模型的不确定性。BMA根据贝叶斯原理解释模型的不确定性,贝叶斯原理可以普遍应用于任何数据分析。在回归设置中,模型不确定性描述了回归模型中应包含哪些预测因子的不确定性。
新命令bmaregress执行线性回归的BMA,可以用于推理、预测,如果需要,甚至可以用于模型选择。比如:
. bmaregress y x1 x2
考虑结果y的所有四个可能模型,其包括或排除预测因子x1和x2,并根据每个模型基于观测数据的可能性来组合这些模型。您可以从各种先验分布中进行选择,以探索关于模型和预测因子重要性的假设对结果的影响。
Postesmation命令允许您估计模型的概率,确定重要的预测因素,探索模型的复杂性,获得预测手段,评估预测性能,并对回归系数进行推断。
目前,除了Stata,其他商业软件都还没BMA程序包。它可以应用所有学科,几乎每个人都会使用线性回归。bmaregress对线性回归模型执行BMA,使研究人员能够解释应使用哪些预测因子的不确定性。
2. Causal mediation analysis
因果推断旨在识别和量化治疗对结果的因果影响。在因果中介分析中,我们旨在进一步探讨这种效应是如何产生的。也许运动会增加一种激素的水平,而这种激素反过来又会增加幸福感。也许进口配额增加了当地企业的市场能力,反过来又提高了商品价格。
我们经常用因果图来可视化这样的关系,例如:

有了新的mediate命令,我们可以估计治疗对结果的总影响,并将其分解为直接影响和间接影响(通过激素水平等中介)。事实上,根据利益假设,可以计算多种类型的分解。此外,estat proportion报告了通过中介发生的总效应的比例。
mediate命令的结果可以是连续的、二进制的或计数的;中介可以是连续的、二进制的或计数的;并且该治疗结果可以是二元的、多值的或连续的。
mediate命令非常灵活。它支持24种结果和中介模型的组合,因此它可以应用于实际研究中出现的各种情况。因果推理问题很自然的应用于所有学科。
3. Tables of descriptive statisitcs
新的dtable命令可以创建一个描述性统计信息表。dtable能报告连续和分类因素变量的汇总统计数据。您可以为每个变量选择要报告的统计信息;从平均值、标准差、中位数、四分位间距、百分比、比例和许多其他值中进行选择。您还可以轻松地比较其他变量类别之间的统计信息。
dtable创建的表可以通过多种方式进行自定义,包括要报告的统计信息、数字和字符串格式、注释、标题、标签等。该表可以直接导出为Microsoft Word、Microsoft Excel、HTML、Markdown、PDF、LaTeX、SMCL或纯文本。
dtable可以很容易地创建通常称为“Table 1”的表,这是几乎所有研究论文中包含的第一个表。
此命令可以应用于所有学科。这些表对于任何进行探索性分析或创建要发布表格的人都很有用。
4. Heterogeneous difference in differences (DID)
DID模型用于通过重复测量数据估计对治疗对象(ATET)的平均治疗效果。治疗效果可以是药物疗法对血压的影响,也可以是培训计划对就业的影响。与现有teffects命令提供的标准横断面分析不同,DID分析在估计ATET时控制组和时间效应,其中组确定重复测量。
异构质性DID模型还考虑了在不同时间点接受治疗的组所产生的治疗效果的变化以及组内随时间变化的效果。
假设几个学区引入了一项锻炼和营养计划来改善学生的健康状况。不同的学区在不同的时间点推出该项目。假设该计划对学生健康结果的影响不会随着时间的推移而改变,并且无论该计划何时通过都是一样的,这合理吗?也许不是合理。我们可以使用异构DID模型来解释潜在的效果差异。
新命令hdidregress和xthdidregression适用于异构DID模型。hdidregress处理重复的横截面数据,xthdidregression处理纵向/面板数据。
异构DID在最近世界各地的许多Stata会议上都是一个热门话题。现有的很多用户都对此感兴趣。
5. Group sequential designs (GSDs)
GSDs是一种适应性设计,如果研究人员发现有令人信服的证据表明治疗有效或无效,他们可以提前停止试验。
假设我们想设计一项研究来测试一种化疗是否对治疗肿瘤有效,并且我们希望在几年内收集数据。GSDs允许我们在收集数据期间进行分析,而不是在收集完所有数据后进行一次分析。收集数据期间的分析都提供了停止试验或继续收集数据的机会。如果有强有力的证据表明试验无效,也可以提前停止;这避免了额外的参与者受到无效治疗。
Stata 18为GSDs提供了一套命令。新的gsbounds命令根据分析次数(也称为外观)、所需的总体Type I误差和所需的功效来计算有效性和无效性界限。您可以从七种边界计算方法中进行选择,选择是使用经典方法还是错误损耗方法,以及选择保守或不太保守的边界法进行早期分析。新的gsdesign命令计算有效性和无效性边界,并为中期和最终分析提供样本量,以测试均值、比例和幸存函数。
通过图表可以很容易地可视化所有中期和最终分析的边界。
执行起来非常的方便。命令语法遵循我们对效能命令的直接语法。通过点击接口可以很容易地访问结果。它很强大。样本量计算可以扩展到通过gsdesign可用的均值、比例和幸存者函数的测试之外,因为用户可以指定用户定义的方法。
此命令适合药学研究人员。任何设计临床试验的人都会感兴趣;这可以扩展到临床心理学家和其他医学研究人员。