《Stata统计学与案例应用精解》

01
本书内容
《Stata统计学与案例应用精解》为统计学/计量经济学与Stata零基础读者设计,内容涵盖统计学与计量经济学双重教学体系,旨在满足更多高校专业师生的需求。书中基于44份真实权威的经济社会统计数据和14份调查研究数据,精心设计了58个统计分析应用案例和10个数据处理案例,广泛涵盖经济金融、医学药学、企业管理、日常生活等多个领域,在数据质量、案例构思和覆盖面等方面优势明显。本书创新性地引入了实证论文写作指导、稳健性检验与异质性分析、政策效应检验、AI工具应用等内容,打造从“零基础入门”到“撰写学术论文”的一站式学习路径。
本书共23章,结构上划分为七部分。第一部分(第1~3章)为课程入门引导,内容包括Stata概述、Stata变量和数据的基本操作以及统计学基础知识;第二部分(第4~7章)为基础统计应用,具体包括描述统计、图形绘制、参数检验和非参数检验;第三部分(第8~13章)为高阶统计应用,具体包括方差分析、相关分析、基本线性回归分析、线性回归分析诊断与处理、非线性回归分析和因变量离散回归分析;第四部分(第14~17章)为专业统计应用,具体包括因子分析、聚类分析、生存分析和信度分析;第五部分(第18、19章)为特殊数据应用,具体包括时间序列数据分析和面板数据分析;第六部分(第20~22章)为论文指导应用,具体包括实证研究论文指导、稳健性检验与异质性分析以及政策效应检验;第七部分(第23章)为AI工具应用。
本书配套赠送教学PPT课件、全书数据文件、全书Stata代码和讲解视频,以辅助教学。
02
本书作者
张 甜
山东大学经济学博士,现任职于山东管理学院,教授本科生统计学、计量经济学等课程,在《金融研究》《财贸经济》《经济评论》《财经科学》《财贸研究》等重要期刊发文多篇,参与多项国家级、省部级课题 ,著有《SPSS统计学原理与实证研究应用精解》《Stata统计分析从入门到精通》《Python数据科学应用从入门到精通》等近10本畅销的数据分析教材。
杨维忠
山东大学经济学硕士,CPA,十余年商业银行风控、营销、内控等工作经历,具有丰富的业务授课经验和实操经历,著有《SPSS统计分析入门与应用精解(视频教学版)》《Python机器学习原理与算法实现》《Stata统计分析商用建模与综合案例》等10余本畅销的数据分析教材。
03
本书读者
本书既可作为经管社科、统计学、教育学、心理学、医学等相关专业在校学生学习和应用Stata的教材,也可作为职场人士自学并提升数据分析技能的工具书。
04
本书目录
目 录
第一部分 课程入门引导
第1章 Stata概述2
1.1 Stata简介2
1.2 Stata 17.0窗口说明及基本设置3
1.2.1 Stata 17.0窗口说明4
1.2.2 设定偏好的界面语言5
1.2.3 新建或编辑样本观测值、变量的基本操作7
1.2.4 读取以前创建的Stata格式的数据文件8
1.2.5 导入其他格式的数据文件9
1.2.6 Stata帮助系统介绍13
1.3 Stata 17.0命令的语法格式15
1.3.1 command(命令名称)15
1.3.2 varlist(变量列表)16
1.3.3 by varlist(按变量分类)17
1.3.4 =exp(赋值)18
1.3.5 if exp(条件表达式)18
1.3.6 in range(范围筛选)19
1.3.7 weight(加权)19
1.3.8 options(其他可选项)20
1.4 Stata 17.0 do文件20
1.4.1 do文件的创建21
1.4.2 do文件的运行21
1.5 Stata 17.0运算符与函数22
1.5.1 Stata 17.0运算符22
1.5.2 Stata 17.0函数25
1.6 本章回顾与习题26
1.6.1 本章回顾26
1.6.2 本章习题28
第2章 Stata变量和数据的基本操作29
2.1 分类变量和定序变量的基本操作29
2.2 常用的几种处理数据的操作30
2.2.1 Stata 17.0的数据类型30
2.2.2 对数据进行长短变换31
2.2.3 对数据进行类型变换32
2.2.4 生成随机数35
2.2.5 数据压缩35
2.2.6 按变量合并、拆分数据文件36
2.2.7 按样本观测值合并数据文件38
2.2.8 添加标签40
2.2.9 对数据进行排序42
2.3 本章回顾与习题43
2.3.1 本章回顾43
2.3.2 本章习题43
第3章 统计学知识45
3.1 统计学常用的基本概念45
3.1.1 总体、样本与统计推断46
3.1.2 频率与概率46
3.1.3 条件概率、独立事件与全概率公式46
3.1.4 概率函数与概率密度函数47
3.2 概率分布47
3.2.1 离散型概率分布47
3.2.2 连续型概率分布49
3.3 统计量52
3.3.1 集中趋势统计量53
3.3.2 离散趋势统计量54
3.3.3 分布趋势统计量55
3.4 大数定律与中心极限定理56
3.4.1 大数定律56
3.4.2 中心极限定理56
3.5 参数估计57
3.5.1 点估计57
3.5.2 区间估计58
3.5.3 参数估计的无偏性、有效性以及一致性59
3.6 假设检验59
3.6.1 假设检验概述60
3.6.2 T检验、Z检验和F检验61
3.6.3 参数检验和非参数检验63
3.6.4 模型设定检验63
3.7 本章习题64
第二部分 基础统计应用
第4章 描述统计68
4.1 定距变量的描述性统计68
4.1.1 统计学原理及Stata命令68
4.1.2 案例应用——分析我国新能源汽车月度产量70
4.2 正态性检验和数据转换73
4.2.1 统计学原理及Stata命令74
4.2.2 案例应用——分析山东省历年化学纤维产量74
4.3 单个分类变量的汇总78
4.3.1 统计学原理及Stata命令78
4.3.2 案例应用——分析工商银行A股每日涨跌情况78
4.4 两个分类变量的列联表分析79
4.4.1 统计学原理及Stata命令79
4.4.2 案例应用——分析汽车制造业上市公司企业规模与公司属性80
4.5 多表和多维列联表分析82
4.5.1 统计学原理及Stata命令82
4.5.2 案例应用——分析专用设备制造业上市公司ESG82
4.6 本章回顾与习题84
4.6.1 本章回顾84
4.6.2 本章习题85
第5章 图形绘制88
5.1 Stata制图的基本操作88
5.1.1 Stata制图命令88
5.1.2 Stata菜单实现90
5.2 直方图91
5.2.1 统计学原理及Stata命令91
5.2.2 案例应用——绘制晨鸣纸业A股每日收盘价直方图92
5.3 散点图93
5.3.1 统计学原理及Stata命令93
5.3.2 案例应用——绘制美国制造业PMI指数、失业率散点图95
5.4 曲线标绘图96
5.4.1 统计学原理及Stata命令96
5.4.2 案例应用——绘制天津市建筑企业经济效益曲线标绘图97
5.5 连线标绘图99
5.5.1 统计学原理及Stata命令99
5.5.2 案例应用——绘制上海市人民币各项存贷款余额连线标绘图99
5.6 箱图101
5.6.1 统计学原理及Stata命令101
5.6.2 案例应用——绘制陕西、浙江、江苏、福建星级酒店营业额箱图102
5.7 饼图103
5.7.1 统计学原理及Stata命令103
5.7.2 案例应用——分析主要国家和地区半导体销售占比104
5.8 条形图106
5.8.1 统计学原理及Stata命令106
5.8.2 案例应用——绘制北美、欧盟、阿拉伯世界不同年龄区间人口占比条形图108
5.9 本章回顾与习题109
5.9.1 本章回顾109
5.9.2 本章习题110
第6章 参数检验112
6.1 单一样本T检验112
6.1.1 统计学原理及Stata命令112
6.2 独立样本T检验114
6.2.1 统计学原理及Stata命令114
6.2.2 案例应用——分析不同类型国家替代能源和核能占能耗总量的比重114
6.3 配对样本T检验116
6.3.1 统计学原理及Stata命令116
6.3.2 案例应用——分析办公电脑通过软件优化开机时间的效果116
6.4 单一样本标准差检验117
6.4.1 统计学原理及Stata命令117
6.4.2 案例应用——分析欧元兑人民币中间价波动情况117
6.5 双样本标准差检验118
6.5.1 统计学原理及Stata命令118
6.5.2 案例应用——分析港元和澳元汇率波动差异119
6.6 本章回顾与习题120
6.6.1 本章回顾120
6.6.2 本章习题120
第7章 非参数检验122
7.1 单样本正态分布检验122
7.1.1 统计学原理及Stata命令122
7.1.2 案例应用——分析上海期货交易所螺纹钢期货收盘价123
7.2 两独立样本检验124
7.2.1 统计学原理及Stata命令124
7.2.2 案例应用——分析德国、荷兰的年通货膨胀率差异124
7.3 两相关样本检验126
7.3.1 统计学原理及Stata命令126
7.3.2 案例应用——分析试验药品服用前后的效果126
7.4 多独立样本检验127
7.4.1 统计学原理及Stata命令127
7.4.2 案例应用——分析中国、韩国、日本的失业率差异128
7.5 游程检验129
7.5.1 统计学原理及Stata命令129
7.5.2 案例应用——分析工商银行A股每日涨跌幅数据129
7.6 本章回顾与习题130
7.6.1 本章回顾130
7.6.2 本章习题131
第三部分 高阶统计应用
第8章 方差分析134
8.1 单因素方差分析134
8.1.1 统计学原理及Stata命令134
8.1.2 案例应用——分析山西、四川、辽宁常住人口自然增长率差异135
8.2 多因素方差分析138
8.2.1 统计学原理及Stata命令138
8.2.2 案例应用——分析德国、法国、西班牙、意大利四个国家的住房拥挤率141
8.3 协方差分析143
8.3.1 统计学原理及Stata命令143
8.3.2 案例应用——分析我国部分省份地方政府债券收益率的影响因素144
8.4 重复测量方差分析146
8.4.1 统计学原理及Stata命令146
8.4.2 案例应用——分析用药次数对起效时间的影响146
8.5 本章回顾与习题148
8.5.1 本章回顾148
8.5.2 本章习题148
第9章 相关分析150
9.1 简单相关分析150
9.1.1 统计学原理及Stata命令150
9.1.2 案例应用——分析国际原油价格和黄金价格的相关性154
9.2 偏相关分析157
9.2.1 统计学原理及Stata命令157
9.2.2 案例应用——分析商业银行经营机构公司存贷款增长的相关性157
9.3 本章回顾与习题159
9.3.1 本章回顾159
9.3.2 本章习题160
第10章 基本线性回归分析161
10.1 最小二乘线性回归分析161
10.1.1 统计学原理及Stata命令161
10.1.2 案例应用——分析欧元区20国经济景气指数的影响因素165
10.2 约束条件回归分析170
10.2.1 统计学原理及Stata命令170
10.2.2 案例应用——分析车辆燃油效率的影响因素171
10.3 本章回顾与习题172
10.3.1 本章回顾172
10.3.2 本章习题173
第11章 线性回归分析诊断与处理175
11.1 异方差诊断与处理175
11.1.1 统计学原理及Stata命令175
11.1.2 案例应用——分析中等收入国家航空运输客运量的影响因素178
11.2 自相关诊断与处理182
11.2.1 统计学原理及Stata命令182
11.2.2 案例应用——分析英国工业生产指数对失业救济率的影响186
11.3 多重共线性诊断与处理191
11.3.1 统计学原理及Stata命令191
11.3.2 案例应用——分析中国居民收入基尼系数影响因素192
11.4 内生性诊断与处理196
11.4.1 统计学原理及Stata命令196
11.4.2 案例应用——分析被调查者年薪的影响因素201
11.5 本章回顾与习题204
11.5.1 本章回顾204
11.5.2 本章习题206
第12章 非线性回归分析209
12.1 转换变量回归分析209
12.1.1 统计学原理及Stata命令209
12.1.2 案例应用——分析山东有效发明专利数对新产品销售收入的影响210
12.2 非线性回归分析213
12.2.1 统计学原理及Stata命令213
12.2.2 案例应用——分析工作年限对绩效年薪的影响213
12.3 分位数回归分析217
12.3.1 统计学原理及Stata命令217
12.3.2 案例应用——分析人力投入回报率对净资产收益率的影响217
12.4 本章回顾与习题219
12.4.1 本章回顾219
12.4.2 本章习题219
第13章 因变量离散回归分析221
13.1 二值选择模型221
13.1.1 统计学原理及Stata命令221
13.1.2 案例应用——分析商业银行对公授信客户征信违约记录的影响因素227
13.2 多值选择模型234
13.2.1 统计学原理及Stata命令234
13.2.2 案例应用——分析血糖含量与年龄、糖摄入量、中高等强度运动量的关系236
13.3 有序选择模型239
13.3.1 统计学原理及Stata命令239
13.3.2 案例应用——分析生产车间工人年度奖金档次240
13.4 本章回顾与习题243
13.4.1 本章回顾243
13.4.2 本章习题244
第四部分 专业统计应用
第14章 因子分析248
14.1 统计学原理及Stata命令248
14.2 案例应用——分析39家上市银行风险与效益指标250
14.3 本章回顾与习题255
14.3.1 本章回顾255
14.3.2 本章习题255
第15章 聚类分析257
15.1 划分聚类分析257
15.1.1 统计学原理及Stata命令257
15.1.2 案例应用——分析A股电气机械和器材制造业上市公司财务指标261
15.2 层次聚类分析263
15.2.1 统计学原理及Stata命令263
15.2.2 案例应用——分析美股酒店及汽车旅馆公司盈利能力265
15.3 本章回顾与习题267
15.3.1 本章回顾267
15.3.2 本章习题268
第16章 生存分析270
16.1 生存分析的基本概念及数据类型270
16.1.1 生存分析涉及的基本概念270
16.1.2 生存分析数据类型271
16.2 生存分析原理及Stata案例272
16.2.1 统计学原理及Stata命令272
16.2.2 案例应用——分析患者年龄和是否吸烟对生存时间的影响278
16.2.3 案例应用——分析药物种类和剂量对患者生存时间的影响283
16.3 本章回顾与习题286
16.3.1 本章回顾286
16.3.2 本章习题287
第17章 信度分析289
17.1 统计学原理及Stata命令289
17.2 案例应用——分析自我效能感调查问卷信度291
17.3 本章回顾与习题293
17.3.1 本章回顾293
17.3.2 本章习题293
第五部分 特殊数据应用
第18章 时间序列数据分析296
18.1 时间序列数据的预处理296
18.1.1 统计学原理及Stata命令296
18.1.2 案例应用——分析甘肃省历年降雨量时间走势301
18.2 移动平均滤波与指数平滑法302
18.2.1 统计学原理及Stata命令302
18.2.2 案例应用——分析中国网约车运营月度数据307
18.3 ARIMA模型、ARIMAX模型311
18.3.1 统计学原理及Stata命令311
18.3.2 案例应用——分析中国国房景气指数和宏观经济景气指数走势315
18.4 单位根检验317
18.4.1 统计学原理及Stata命令317
18.4.2 案例应用——分析香港失业率、M2同比月度数据318
18.5 向量自回归模型321
18.5.1 统计学原理及Stata命令321
18.5.2 案例应用——分析德国CPI、登记失业率、经济景气指数数据330
18.6 协整检验与向量误差修正模型335
18.6.1 统计学原理及Stata命令335
18.6.2 案例应用——分析中国城镇居民人均可支配收入、社会融资规模、居民人均消费支
出年度数据340
18.7 ARCH系列模型343
18.7.1 统计学原理及Stata命令343
18.7.2 案例应用——分析碳酸锂期货收盘价348
18.8 本章回顾与习题350
18.8.1 本章回顾350
18.8.2 本章习题353
第19章 面板数据分析356
19.1 面板数据的预处理356
19.1.1 统计学原理及Stata命令356
19.1.2 案例应用——分析家用电器行业上市公司盈利能力指标358
19.2 短面板数据分析359
19.2.1 统计学原理及Stata命令359
19.2.2 案例应用——分析个人护理用品行业上市公司股权集中度对盈利能力的影响361
19.3 长面板数据分析366
19.3.1 统计学原理及Stata命令366
19.3.2 案例应用——分析半导体上市公司研发费用占比对净资产收益率的影响368
19.4 本章回顾与习题374
19.4.1 本章回顾374
19.4.2 本章习题375
第六部分 论文指导应用
第20章 实证研究论文指导378
20.1 实证研究的概念378
20.2 实证研究论文的撰写步骤379
20.2.1 提出研究问题379
20.2.2 查阅参考文献380
20.2.3 设计研究框架380
20.2.4 提出理论假设381
20.2.5 收集数据383
20.2.6 选取恰当的统计分析方法进行实证分析383
20.2.7 写出研究结论并提出对策和建议387
第21章 稳健性检验与异质性分析389
21.1 稳健性检验的概念及意义389
21.2 稳健性检验的方法及示例390
21.2.1 论证从理论假设提出到实证研究设计之间的稳健性390
21.2.2 论证实证研究回归模型构建的稳健性391
21.2.3 论证实证研究分析所使用样本数据的稳健性392
21.3 异质性分析的概念及意义394
21.4 异质性分析的方法及示例394
第22章 政策效应检验396
22.1 政策效应检验方法的对比与选择396
22.1.1 “计划全面实行、试点较多”的政策效应检验396
22.1.2 “政策适用范围较窄、试点较少”的政策效应检验397
22.1.3 “一刀切”的政策效应检验397
22.2 双重差分法398
22.2.1 传统DID398
22.2.2 经典DID399
22.2.3 异时DID399
22.2.4 广义DID399
22.2.5 异质DID400
22.3 平行假设趋势检验400
22.4 安慰剂检验402
22.4.1 安慰剂检验的概念402
22.4.2 替换政策发生时间402
22.4.3 随机生成处理组403
22.4.4 同时随机生成政策发生时间与处理组403
22.4.5 替换样本404
22.4.6 替换变量404
22.5 合成控制法404
22.5.1 合成控制法的概念404
22.5.2 合成控制法的Stata操作405
22.5.3 合成控制法示例——研究美国加利福尼亚州1988年第99号控烟法的效果407
22.6 断点回归法414
22.6.1 断点回归法的概念414
22.6.2 断点回归法的Stata操作415
22.6.3 断点回归法示例——研究M候选人当选对预算支出的影响415
第七部分 AI工具应用
第23章 DeepSeek等AI工具的应用420
23.1 DeepSeek等AI工具的作用420
23.2 Stata统计分析AI提示实例421
23.2.1 数据整理AI提示示例421
23.2.2 描述性统计AI提示示例422
23.2.3 图形绘制AI提示示例423
23.2.4 最小二乘回归分析AI提示示例423
23.2.5 因子分析AI提示示例424
23.2.6 时间序列分析AI提示示例425
23.2.7 DID(双重差分法)分析AI提示示例426
23.2.8 倾向得分匹配(PSM)分析AI提示示例427
23.2.9 动态面板数据分析AI提示示例428
23.2.10 机器学习因果推断AI提示示例429
23.2.11 Stata与Python交互AI提示示例430
05
本书特色

本文摘自《Stata统计学与案例应用精解》,获出版社和作者授权发布。