根据各省政府工作报告,参考金灿阳(2022)和陶长琪(2022),借助Python软件,统计数字经济相关的关键词词频,分别记为数字经济政策词频A、数字经济政策词频B
A文献参考
B文献参考
年度趋势
一、数据介绍
数据名称: 政府工作报告-数字经济政策词频
数据范围:全国31个省份
数据年份:2002-2023年(平衡面板为2007-2023年)
数据来源:地方政府网
数据整理:自主整理
数据说明:内含数字经济相关的60个词频明细、文本长度、文本词频总数
更新时间:2023年2月
二、整理说明
从地方政府网爬取工作报告原始文件
将报告文本整理为面板数据
去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
保留中英文、数字、标点符号,利用正则表达式统计60个词频
保留中英文、数字,统计全文文本总长度
保存文本词频总数、60个词频明细、文本长度
三、指标说明
一共71个指标,如下
行政区划代码 | 年份 | 地区 |
所属地域 | 长江经济带 | 文本总长度 |
仅中英文-文本总长度 | 文本总词频-全模式 | 文本总词频-精确模式 |
数字经济政策词频和-A | 数字经济政策词频和-B | 数字经济_A |
智能经济_A | 信息经济_A | 知识经济_A |
智慧经济_A | 数字化信息_A | 现代信息网络_A |
信息和通信技术_A | ICT_A | 通信基础设施_A |
互联网_A | 云计算_A | 区块链_A |
物联网_A | 数字化_A | 数字乡村_A |
数字产业_A | 电子商务_A | 5G_A |
数字基础设施_A | 人工智能_A | 电商_A |
大数据_A | 数据化_A | 产业数字化_A |
数字产业化_A | 数据资产化_A | 智慧城市_A |
云服务_A | 云技术_A | 云端_A |
电子政务_A | 移动支付_A | 线上_A |
信息产业_A | 软件_A | 信息基础设施_A |
信息技术_A | 数字生活_A | 智能制造_B |
智能化_B | 智慧化_B | 智慧城市_B |
云计算_B | 上云_B | 云平台_B |
云服务_B | 大数据_B | 数据安全_B |
数据服务_B | 数据治理_B | 数据共享_B |
工业互联网_B | 物联网_B | 区块链_B |
机器人_B | 5G_B | 数字技术_B |
数字化_B | 数字经济_B |
四、数据概览
面板形态
数据概览
下载链接:https://download.csdn.net/download/T0620514/88840519