导语在绩效评价与效率测算的学术研究中如何让结论经得起推敲本文作为本系列第五篇将手把手带你吃透三阶段 DEA 模型。从原理拆解、数据规范、软件一键操作到论文实证部分的写作框架助你彻底剥离“运气”与“环境”的干扰算出纯粹的管理效率一、前言为什么一定要用三阶段 DEA在传统的单阶段 DEA 模型中我们算出的效率值其实是一个“大杂烩”它同时混杂了三类影响因素自身管理技术水平我们真正想测度的核心外部环境条件如政策扶持、区位优势随机误差与运气扰动如偶然的财政波动。这就导致了一个尴尬的局面有些决策单元DMU效率看着低未必是自身管理差只是因为“命不好”外部条件太薄弱而部分单元效率虚高纯粹是依托了优越的外部环境并不能真实反映其治理能力。三阶段 DEA 模型正是为了解决这一痛点而生。它能科学剥离环境因素和随机噪声的干扰精准测算出纯粹由内部管理决定的真实效率。近年来在公共管理、卫生经济、金融绩效等领域的核心期刊论文中三阶段优化测算已成为标配能让你的实证结论更加客观严谨。二、三阶段分步原理简要介绍为了让大家更好地在论文中阐述方法论我们先把复杂的数学公式放一边用通俗的逻辑理清三个阶段的任务1. 第一阶段初始 DEA 测算看“原貌”使用原始的投入产出数据运行BCC 模型通常选用投入导向。这一步会得到两个关键产物初始综合效率值各项投入指标的松弛变量Slack 值⚠️注意此时的松弛量是一个“混合体”里面包含了管理无效、环境影响和随机扰动三部分。2. 第二阶段SFA 随机前沿回归剔“杂质”这是整个模型的核心。我们将第一步得出的投入松弛量作为被解释变量选取外部环境指标作为解释变量开展随机前沿分析SFA 回归。目的量化环境和随机因素对投入冗余的具体影响程度。动作依据 SFA 回归结果对所有样本的投入数据进行“校正”把大家统一拉到相同的外部环境水平线上通常是拉到均值或最劣环境。3. 第三阶段校正后 DEA 测算见“真身”用第二步校正后的“纯净”投入数据配合原始的产出数据再次运行 DEA 模型。此时输出的效率值就是剔除了环境与随机干扰后的真实管理效率。三、环境变量选取原则论文避坑指南很多同学在写论文时最容易在环境变量上栽跟头。请牢记以下铁律必须是外部不可控因素研究对象自身无法通过主观努力轻易改变的指标。严禁纳入内部管控指标如果是管理层能调控的必须放回投入/产出指标里。数量不宜贪多一般24 个最为合适否则容易导致 SFA 回归自由度不足或共线性问题。 常用场景举例公共事业单位财政保障水平、区域人口规模、地理位置虚拟变量、基础设施条件。区域治理地区人均G D P GDPGDP、城镇化率、第三产业占比。医疗卫生机构机构规模、服务辖区常住人口数。审计绩效被审计单位业务体量、地域差异、人员编制结构。四、测试数据示例可直接套用本次测试共包含6 个决策单元D M U 1 ∼ D M U 6 DMU_1 \sim DMU_6DMU1∼DMU6设定2 个投入指标1 个产出指标以及2 个环境变量。1. 投入产出基础数据表DMU名称投入指标1 (X 1 X_1X1)投入指标2 (X 2 X_2X2)产出指标1 (Y 1 Y_1Y1)D M U 1 DMU_1DMU114936D M U 2 DMU_2DMU2191331D M U 3 DMU_3DMU3171232D M U 4 DMU_4DMU4161133D M U 5 DMU_5DMU511637D M U 6 DMU_6DMU6138382. 环境变量数据表DMU名称环境变量1 (Z 1 Z_1Z1)环境变量2 (Z 2 Z_2Z2)D M U 1 DMU_1DMU121D M U 2 DMU_2DMU222D M U 3 DMU_3DMU323D M U 4 DMU_4DMU412D M U 5 DMU_5DMU513D M U 6 DMU_6DMU612数据描述性统计软件自动读取环境变量1均值 1.5000 1.50001.5000标准差 0.5000 0.50000.5000最小值 1.0000 1.00001.0000最大值 2.0000 2.00002.0000环境变量2均值 3.5000 3.50003.5000标准差 2.9861 2.98612.9861最小值 1.0000 1.00001.0000最大值 10.0000 10.000010.0000五、软件完整操作步骤以 DEA Performance 为例传统做法需要用 DEAP 算松弛量再导进 Stata 跑 SFA再导回 Excel 改数据……极其繁琐且极易出错。现在借助集成化软件只需四步步骤 1导入全套数据在 Excel 中整理好上述格式的表格直接导入软件。在界面中清晰划分投入列、产出列以及环境变量列。步骤 2选择三阶段 DEA 模式在模型菜单中直接勾选【三阶段 DEA】Three-stage DEA。程序会自动锁定投入导向的 BCC 模型无需分段手动干预。步骤 3执行一键运算点击运行后台全自动流转DEA 求解 → SFA 随机前沿回归 → 投入数据校正 → 二次 DEA 测算步骤 4导出结果软件会分别输出并归档结果表方便我们进行对比分析六、测试结果展示与分析三阶段综合效率柱状图 软件实际运行日志参考以下是软件后台运行的真实记录可作为撰写论文“数据处理过程”部分的参考素材读取参数投入指标2产出指标1DMU数量6版本权限校验通过正在读取表格投入产出数据…数据读取完成共加载 6 组DMU数据数据矩阵转换完成当前选中模型三阶段DEA开始求解… 开始执行标准三阶段DEA计算 ▶ 载入环境变量共 2 项匹配DMU样本数 6 个环境变量1均值1.5000标准差0.5000最小值1.0000最大值2.0000环境变量2均值2.1667标准差0.6872最小值1.0000最大值3.0000环境变量将通过SFA回归分解其对投入/产出松弛的系统性影响【第一阶段】计算原始BCC效率与对应松弛基于原始投入产出数据计算初始效率与总松弛包含环境因素、随机误差、管理无效率三类影响▶ 已选择 BCC【投入导向】DMU1 求解成功效率值0.785714DMU2 求解成功效率值0.578947DMU3 求解成功效率值0.647059DMU4 求解成功效率值0.687500DMU5 求解成功效率值1.000000DMU6 求解成功效率值1.000000▶ 投入导向求解各DMU投入总松弛径向冗余剩余松弛【第二阶段】逐项执行SFA回归剥离环境与随机干扰分解逻辑总松弛 环境因素影响 随机误差 管理无效率最终仅保留管理无效率部分正在对第1项投入做SFA回归…环境变量影响系数环境变量1: 系数0.0001加剧松弛降低效率环境变量2: 系数-0.0002抑制松弛提升效率模型拟合对数似然43.1545无效率方差占比γ1.0000第1项投入调整完成平均调整幅度: 0.0002正在对第2项投入做SFA回归…环境变量影响系数环境变量1: 系数0.7749加剧松弛降低效率环境变量2: 系数-0.0703抑制松弛提升效率模型拟合对数似然-5.1319无效率方差占比γ0.0000第2项投入调整完成平均调整幅度: 1.4202【第三阶段】调整后数据重新计算BCC得到真实管理效率剔除环境与随机因素干扰后效率差异仅由DMU自身管理能力与运营水平决定▶ 已选择 BCC【投入导向】DMU1 求解成功效率值0.813417DMU2 求解成功效率值0.605682DMU3 求解成功效率值0.665009DMU4 求解成功效率值0.709798DMU5 求解成功效率值1.000000DMU6 求解成功效率值1.000000 标准三阶段DEA计算完成 ---------- 三阶段DEA 单模型结果汇总 ----------模型类型常规效率模型总决策单元数量6DMU1【DMU1】 效率计算结果0.813417DMU2【DMU2】 效率计算结果0.605682DMU3【DMU3】 效率计算结果0.665009DMU4【DMU4】 效率计算结果0.709798DMU5【DMU5】 效率计算结果1.000000DMU6【DMU6】 效率计算结果1.000000有效求解单元数6求解失败单元数0 全部计算流程结束 DEA Performan 下载地址https://pan.baidu.com/s/1WpqasGSOCE-wDz_K4JbRLQ?pwd5801