手机版 下载桌面 设为首页

利用SPSS软件快速整理数据的六个步骤

  利用SPSS软件快速整理数据的六个步骤

  每年的这个时候是毕业生最忙的时候,今年也不例外。这两天办公室来了很多咨询的准毕业生,不仅将各个咨询室占满,而且会议桌也围了一圈,创单日咨询数量新高。在咨询过程中,由于拿过来的数据格式不一,清理数据的时间占了整个咨询时间的80%-90%左右,如果能提前完成数据清理,将大大提高咨询效率。下面给大家一些清理数据的SOP,希望能帮助大家快速整理好数据。

  大家拿过来的数据是不是这样的:

  第一步:合并数据。数据在不同的sheet里是不能分析的,要把所有的数据合并到一个sheet表里,在每个表里添加一个分组变量,就可以区别是哪一组了。合并的时候要注意把相同的变量,否则数据要全错了。

  第二步:给每个一病例一个唯一编码,便于进行溯源,进行查找和更正错误数据。方法是:插入一列,变量名设为Id,前两个编号1、2,同时选中1、2,鼠标放在右下角,出现实线的“十”字时双击。

  第三步:数据导入SPSS。可以通过“文件-打开-数据”,找到文件所在的路径,将文件类型选择excel格式,打开即可。最新版的SPSS支持直接把数据拖放到SPSS上打开哦。

  第四步,更改变量名。一般的数据软件只支持变量名是“英文”或者“英文+数字”形式,虽然高级版本的SPSS可以支持中文变量名,但在多因素分析中还会出现错误,因此建议更改变量名,并在标签中进行标注。

第五步:查重。一般的统计分析方法要求各个case间是独立的,因此数据不能有重复的case,如果一个研究对象有多次随访,也应合并到一行数据里。查重方法:“数据-标识重复个案”:

  对于重复个案,查明原因,属于完全重复者可删除,属于不同随访时,合并到一行。

  第六步:数据重新编码。统计软件一般只能对“数”进行分析,因此文本数据应转成“数”据。方法:“转换-自动重新编码”,将性别选入右框,填写一个新的变量名,点击“添加新名称”后点击确定。

  在输出页面可看到编码情况,在数据页面最后一列生成“数据”。

  连续变量转成分组变量,也可以使用重新编码功能。如将年龄分成几组,操作方法:“转换-重新编码为不同变量“,将年龄选入,填写新变量名称,点击“变化量”

  再点击“旧值和新值”,在弹出的界面里,左侧为旧值范围,右侧为转换成的新值,如低于或等于45岁赋为1组,则

  46-60岁赋为2组,则

  如此依次,点“继续-确定“,在数据最后一列即可看到新变量。

  小编建议按上述步骤依次整理,经过以上几步,基本可以把数据整理完成,形成一份可分析的数据。

分类标签:SPSS  

声明:本文转载仅出于学习和传播信息所需,并不意味着代表本站观点或证实其内容的真实性;其他网站或个人转载使用须保留本站所注“来源”,并自负相关法律责任;如作者不希望被转载或其他事宜,请及时联系我们!