一篇论文的数据分析方法,核心取决于你的研究类型(定量、定性还是混合研究)以及数据来源(问卷、实验、公开数据库、访谈文本等)。下面按论文最常用的场景,帮你梳理清楚。
一句话原则:分析方法要为研究问题服务,而不是堆砌复杂的统计模型。
这是本科、硕士论文中最常见的类型。关键是:从“描述现象”到“验证关系”。
做什么:计算均值、标准差、频数、百分比;画直方图、箱线图。
为什么用:让读者快速了解样本基本情况(例如:受访者平均年龄25.3岁,男性占62%)。
写作话术:“采用描述性统计对样本的人口学特征进行分析……”
信度:克隆巴赫系数(Cronbach‘s α),一般 >0.7 可接受。
效度:探索性因子分析(EFA)或验证性因子分析(CFA),KMO >0.6,Bartlett球形检验显著。
写作话术:“采用Cronbach’s α系数检验问卷内部一致性,采用KMO和Bartlett检验判断是否适合因子分析……”
| 自变量类型 | 因变量类型 | 常用方法 |
|---|---|---|
| 二分类(男/女) | 连续(成绩) | 独立样本t检验 |
| 多分类(专业) | 连续(满意度) | 单因素方差分析(ANOVA)+ 事后检验(LSD/Tukey) |
| 分类(前后测) | 连续(同一批人) | 配对样本t检验 |
| 研究目的 | 常用方法 | 适用场景 |
|---|---|---|
| 探究两个变量相关 | Pearson(正态) / Spearman(非正态)相关系数 | 初步判断是否存在关联 |
| 预测/影响因素分析 | 线性回归 / 多元线性回归 | 因变量是连续(如收入、得分) |
| 分类预测 | Logistic回归 | 因变量是二分类(如买/不买,是/否) |
| 多个变量间的复杂关系 | 结构方程模型(SEM) | 有中介、调节变量,需要路径分析 |
| 面板/追踪数据 | 固定效应/随机效应模型 | 多年数据、同一对象多次测量 |
中介效应:三步回归法 / Bootstrap法(PROCESS插件)
调节效应:交互项回归 / 分组回归
聚类分析:将样本或变量分成若干类
时间序列:ARIMA、协整检验(经济学、金融学常用)
不追求统计显著性,追求理解、解释和模式提炼。
| 数据类型 | 分析方法 | 简要说明 |
|---|---|---|
| 深度访谈、焦点小组 | 主题分析法 | 转录→编码→提炼主题(最常用) |
| 开放式问卷、网络评论 | 内容分析法 | 对文本进行系统分类、计数(可定量化) |
| 田野笔记、案例资料 | 扎根理论 | 三级编码(开放式→主轴→选择),构建理论 |
| 叙事/故事 | 叙事分析 | 关注时间顺序、转折点、身份建构 |
| 政策文件、历史文档 | 话语分析 | 分析语言如何建构权力、意识形态 |
“采用Braun & Clarke(2006)的主题分析六阶段框架,对访谈转录文本进行编码,共提取出X个一级节点,Y个二级节点,最终归纳为Z个核心主题……”
3.1 数据来源
本研究通过线上平台(问卷星/Credamo)发放问卷,回收有效问卷XXX份,有效回收率XX%。3.2 变量测量
自变量X采用XXX(作者,年份)编制的量表,共X个题项,Likert 5点计分(1=完全不同意,5=完全同意)。本研究中该量表的Cronbach‘s α为0.XXX。3.3 数据分析方法
采用SPSS 26.0进行数据分析。首先进行描述性统计和共同方法偏差检验(Harman单因素法);其次进行Pearson相关分析;最后采用层次回归法检验主效应及调节效应,并使用Bootstrap法(5000次)检验中介效应(如果适用)。
3.1 样本与资料收集
采用目的性抽样,选取XXX领域从业者/用户共X名进行半结构化访谈,每人40-60分钟,全程录音并转录为文字,共获得约X万字文本。3.2 分析方法
采用主题分析法。由两名研究者独立编码,Kappa系数为0.XX(>0.7)。通过开放式编码→轴向编码→选择编码,最终提炼出X个核心主题。