Stata 中Mata的st_view函数 – 小心使用!

​​

由Kaizong Ye,Weilong Zhang撰写

经常使用Stata,我认为这是一个很棒的包。几年前的一个很好的补充是Mata语言,一种完全成熟的矩阵编程语言 。我相信Stata的许多内置命令都是用Mata编程的。我一直在使用Mata来编写新的命令 。这篇文章有望帮助其他人避免我所遇到的问题。

st_view()


Mata中的st_view()函数使您可以创建“对当前Stata数据集的视图”的对象。具体来说,您可以创建指向当前Stata数据集的一个或多个部分的Mata对象。例如之后

×

Stata 从9.0之后开始包括一个矩阵变成语言,这就mata。虽然之前的stata也包含一些基本的矩阵运算,但局限性太大。不过这个东西和Stata的数据组织方式就有些不同了。Stata的数据按照变量或者说是序列组织起来的,但mata则是按照矩阵组织起来,这与Matlab和R很像。现在的问题就是如何将Stata的数据输入mata进行运算,然后再将结果输出。

一般来讲,Stata的联机帮助很详细,也有很多例子。但是mata的联机帮助甚至手册都有些简陋,很多时候很多命令根本就没有例子。

  首先如何将Stata的数据输入mata:st_view()和st_data。这两个命令的作用是一样的,但是从效果上还有细微差别。st_view()可以生成一个当前在内存中的Stata数据的矩阵,你可以对这些矩阵进行任何运算,但是当Stata的数据改变以后,这个矩阵也会改变;而st_data()则不然,他会生成一个绝对独立的矩阵,不论你Stata的数据怎么改变,这个mata中的矩阵依然如故。比如st_view(X=.,.,.)会将当前数据中变成mata中的一个矩阵X,但是当你clear之后在进入mata,这个矩阵X的所有元素都变成“.”了。相反的,X=st_data(.,.,.)也将现在内存中的Stata数据变成一个矩阵,但是无论这个数据是否还在,都不影响这个矩阵的取值。据说之所以设计st_view()的原因是这样比较节省内存。不过这两个命令的共同之处是,如果变量是一个字符型的话,进入mata以后就变成“.”了。

我们可以使用Mata对象x来检查x变量的内容。 

调用st_view()有很多种方法。 

st_view()对象按列号指向,而不是指向变量


我通过遇到奇怪行为发现的第一个重点是st_view()对象指向Stata数据集中的特定列,即使通过传递变量来调用它也是如此 。这意味着,创建了Mata对象x,它是Stata数据集中变量x的视图,如果Stata数据集中的变量x改变位置,则Mata st_view对象x将不再指向正确的变量。为了说明,尝试以下代码 :


代码生成一个Stata数据集,其中包含两个变量y(包含1个)和x(包含2个)。Mata程序test()首先创建Mata对象x,它指向Stata数据集变量x。 然后我们从Mata程序中调用Stata命令drop y。然后我们再次打印Mata对象x。运行代码,我们得到输出:

我们看到第一次输出x给我们x变量,它包含2s。但是我们第二次调用print x时,会得到一列缺失值。 事实证明它指向特定的列,而不是特定的变量。 

这种行为有什么影响?如果我们使用st_view()并调用它以指向特定变量,我们应该知道如果重新排序Stata数据集的变量,我们的st_view()对象可能不再指向正确的变量。这意味着每次我们在Mata程序中对Stata数据集进行更改时,我们都应该重新定义我们想要使用的任何Mata st_view()对象。

这有什么影响? 必须在 “更改数据集”之后重新创建st_view()对象 。


​非常感谢您阅读本文,如需帮助请联系我们!


随时关注您喜欢的主题

在wechat上关注我们

最新洞察

技术干货


 
QQ在线咨询
售前咨询热线
15121130882
售后咨询热线
0571-63341498