今天给大家分享的是国内顶级期刊2023发表论文《碳排放规制、企业减排激励与全要素生产率——基于中国碳排放权交易机制的准自然实验》中使用到的重要数据集——碳排放控排企业名单,该论文从企业生产效率视角对论文进行研究,发现碳排放权交易机制显著提升了控排企业的全要素生产率,但该市场机制还未产生积极溢出效应,试点地区和同行业非控排企业的全要素生产率都未发生显著变化,并且在异质性分析中得出碳市场的初始配额实施部分竞价拍卖、采用基准法核算、非履约主体交易机制对企业全要素生产率的积极作用会更加明显,同时碳排放权交易机制还显著降低了控排企业的资源错配程度,提升了绿色生产投入和技术创新产出。该论文在研究过程中使用到了一个非常重要的数据碳排放权交易市场控排企业名单,我们在论文的基础上进行了拓展和完善,为大家提供了一个更全面、充分的数据集方便大家研究,数据获取查看文末获取方式。
一、论文讲解
该论文以深圳、上海、北京、广东、湖北、天津、重庆和福建八个地区碳排放权交易市场的控排企业名单为基准,构建双重差分模型开展自然实验,从企业层面研究碳排放权机制对企业全要素生产率的影响以及溢出效应检验,同时进行了平行趋势检验、安慰剂检验、事件研究法和两阶段差分、倾向匹配得分和熵平衡法、个体和时间双重聚类、分样本回归、被解释变量测度更换等一系列稳健性检验,结果保持文件,并且从企业生产效率、产品市场竞争以及企业资源配置三个方面进行了进一步的分析,最终得出结论,给出相应的建议。
(一)样本与数据
深圳、上海、北京、广东、湖北、天津、重庆和福建八个地区分别从2013年开始先后启动碳市场交易,2021年发电行业的全国统一碳交易市场也线上交易,论文中以A股所有上市公司为初始样本,研究区间为2010-2020年,并剔除了部分样本,企业财务相关数据来源于国泰安(CSMAR)和万得(Wind)数据库,碳市场控排企业名单通过各碳市场手工整理,我们对控排企业名单数据进行了整理,并将其进行了拓展,数据详细请往下了解。
(二)模型设计与变量定义
碳排放权交易机制采取分地区和逐步试点的方式进行,论文中采用双重差分模型进行研究,具体模型构建如下:
其中,TFP为企业全要素生产率,对于这一块指标的核算详细信息请查看论文
解释变量CTS表示上市公司是否为碳市场控排企业,若上市公司为控排企业,定义为处理组,赋值为1,其他则归入对照组,赋值为0。变量CTS_Post表示企业为碳市场控排和进入时间的交互项,企业被纳入碳市场控排后的年份赋值为1,纳入之前的年份及其他为进入控排名录的企业赋值为0,该变量是论文主要关注的变量。
Controls白哦是控制变量,参考已有文献,控制了如下变量:公司规模(Size)、财务杠杆(Lev)、资产收益率(ROA)、产权性质(SOE)、大股东持股比率(First)、机构投资者持股比率(IO)、上市时间(Age)、企业经营活动产生的净现金流(OCF)、董事长是否兼任总经理(Dual)、产品市场竞争(HHI)、固定资产投资(Fixed)、公司研发支出(R&D)、分析师关注(Analyst)和融资约束(SA)等。此外,为了避免经济周期、行业和地区的时变和非时变差异对企业生产效率的影响,模型中还分别控制了年度、行业和地区以及年度与行业和地区分别交互的固定效应。最后为控制企业不随时间变化因素的影响,模型中还加入了公司固定效应。
(三)结果与分析
1.基准回归结果
2.地区与行业溢出效应
3.稳健性检验
主要包括平行趋势检验以及安慰剂检验、事件研究法和两阶段差分、倾向匹配得分和熵平衡法、个体和时间双重聚类、分样本回归、被解释变量测度更换等一系列其他稳健性检验。
(四)进一步分析
1.碳市场机制设计与企业生产效率
2. 产品竞争市场与碳市场的生产率效应
3.碳排放权机制与企业资源配置
上述三个方面的研究均采用各自相应的标准进行分样本比较解释变量系数进行说明。
(五)结论与启示
以上就是该论文的大致结构和内容,接下来的内容是重点,给大家分享我们收集整理的数据。
二、重要数据
碳排放权交易机制从2013年在深圳、上海、北京、广东、湖北、天津、重庆和福建八个地区进行试点推广,不同地区分别在不同年份进行实施,从我们收集的数据,北京和湖北是2014年开始进行试点,福建从2016年开始进行试点,其他地区均从2013年开始进行试点,我们收集整理了各个地区的控排企业名单,数据资料是非常完整的,原始名单数据设计到20000多个企业,我们进行了整理,将数据中重复以及涉及到改名的企业进行核对和剔除,考虑到大家的研究需求我们将样本区间进行了拓展,最终得到了2008-2020年的控排企业名单数据,方便大家研究。
(一)原始数据
我们从试点地区的发改委和生态环境局收集整理了各地区控排企业名单,各地区试点时间在上面已经申明,不同地区不同年份的数据我们均收集完整,无缺失年份数据,部分原始名单信息展示如下,大家根据这个信息可以初步判断我们收集数据的完整性,以重庆为例进行展示。
在收集完数据之后我们对数据进行了整合,方便进行进一步处理,名单汇总数据一共20000多行数据, 由于原始名单中很多是以PDF文件格式呈现,我们均进行了人工核对识别,判断整理数据是否与原始名单一致,最终得到一致的名单,整合数据展示如下:
在整合完数据之后,我们对整合数据首先进行了按照企业名称进行去重操作,保留重复企业名单中最早进行试点的样本(参考论文),去重操作均采用python代码执行,因此不存在人为剔除样本操作,最终得到一个去重版原始数据集,最终得到了4721条数据,同时我们使用爱企查、天眼查等企业信息网站进行了数据核对,纯手工核对,识别出上市企业和非上市企业,并将上市企业股票代码数据保存,方便大家核对和审查以及后续的数据拼接,识别完成之后,我们发现还是会存在重复的企业,这是无法避免的,因为企业在发展的过程会设计名称变更,我们按照企业现在名字进行修改,最终数据保存在“去重版原始数据”表中,数据展示如下:
在人工核对完之后,我们对重复数据和非上市企业数据进行了剔除,大家在实际研究中只会使用到上市数据,一共208家企业,同时参考论文将上市企业的相关信息进行补充企业所在行业和上市状态,数据保存在“去重版上市企业原始数”表中,数据展示如下:
(二) 上市企业面板数据未剔除数据版
我们将经过处理的企业名单转换成大家实际研究中需要使用到的面板数据格式,并参考论文设定相应的虚拟变量,论文中使用到的研究区间是2010-2020年,我们在此基础上进行了拓展,延伸到了2008-2020年,为什么不对后面年份进行延伸呢?主要是:第一、目前的论文研究最多使用到2020年,2021年全国发电行业纳入,目前暂不清楚会有什么变化,为了确保数据准确性,我们截止到2020年;第二、论文中在研究的时候都会保持数据间隔,大部分不会存在直接靠近最近年份进行研究;第三、最近年份的其他数据大家在实际中可能不一定收集齐全,我们收集的数据在正常情况下能够满足大家的研究需求。参考论文我们补充了企业是否控排企业数据以及控排企业和年份的交互数据,分别保存在“是否控排企业”和“DID”列中,由于我们是根据控排企业名单进行整理的,所以“是否控排企业”均为1,相信大家肯定可以理解的,最终得到了控排企业2008-2020年面板数据,一共2704条数据,保存在“上市企业面板数据未剔除数据版”表中,具体展示如下:
(三)上市企业面板数据剔除数据版
论文中进行了部分样本剔除,剔除了金融保险类企业以及ST的公司样本,我们同样进行了这方面的数据处理,进行了样本剔除之后,重新转换面板数据,数据内容和未剔除数据版一样,只是进行了样本剔除,最终得到2457样本,保存在“上市企业面板数据剔除数据版”表中,数据展示如下:
以上就是本次分享的全部内容,大家可以看到我们对分享的数据是十分认真和用心的,并且站在使用者的角度考虑,所以大家完全可以相信数据的质量,最后,数据在发布时间起24小时内通过关键词指示操作即可免费获取,关注公众号“明天科技屋”并回复数字关键词了解数据获取方式,该数据由明天科技屋一手整理,版权归明天科技屋所有,未经允许,不得用于商业盈利,否则将追随法律责任!!!