企业数字化转型的测度难题:基于大语言模型的新方法与新发现

《经济研究》新文章《企业数字化转型的测度难题:基于大语言模型的新方法与新发现》运用机器学习和大语言模型构造一套新的企业数字化转型指标。理论分析和数据交叉验证均表明,构建的指标相对已有方法更准确:

1.第一步:选择管理层讨论与分析目录、释义及重大风险提示这两个章节作为文本数据

2.第二步:构建待预测句库和待标记句库。先将全部文本按照句号和分号分割,得到待预测句库。使用关键词抽取具有不同代表性的年报句子,并与随机抽取的句子一起构成待标记句库。其次,定义数字技术,并构建数字技术词典。综合政策口径、企业界的定义,将数字技术分为六种类型:大数据、人工智能、移动互联、云计算、物联网和区块链

3.第三步:对待标记句库的句子进行人工标注先判断企业使用了哪种/哪几种数字技术,进而判断企业是否进行了数字化转型。

4.第四步:采用有监督的机器学习方法训练模型使用百度开源的、内嵌ERNIEPaddleHub框架来开展模型训练,用其内置的tokenizer函数快速将句子转为ERNIE模型训练所需要的格式。将全部被标记的句子按照8∶1∶1的比例分为训练集、测试集和验证集。同时为了比较不同模型之间的分类性能,基于PaddleHub框架训练了BERT_base_Chinese,同时基于sklearn框架训练了SVM(支持向量机)、NeuralNetworks(神经网络)、SVMNeuralNetworks结合的Voting算法、KNNK近邻)以及GaussianNB(朴素贝叶斯)共七类常见模型。

5.第五步:采用ERNIE模型构造数字化转型指标基于ERNIE大语言模型,对2006—2020年待预测句库中的每一句文本进行预测,判断企业是否以及使用何种数字技术构造了企业数字化转型哑变量。

在此基础上,文章实证检验企业数字化转型对财务绩效的影响。研究发现:第一,企业数字化转型能够显著提高财务绩效,其中,大数据、人工智能、移动互联、云计算和物联网均有明显作用,但区块链并没有明显的作用;第二,只有在财务绩效较差的企业中,数字化转型才能够显著提高财务绩效;第三,企业数字化转型提高财务绩效的主要渠道包括改善效率和降低成本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/21711.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

17.Redis之主从复制

1.主从复制是怎么回事? 分布式系统, 涉及到一个非常关键的问题: 单点问题 单点问题:如果某个服务器程序, 只有一个节点(只搞一个物理服务器, 来部署这个服务器程序) 1.可用性问题,如果这个机器挂了,意味着服务就中断了~ 2.性能/支持的并发量也是比较有限…

【HarmonyOS】鸿蒙系统中应用权限等级介绍、定义、申请授权讲解

【HarmonyOS】鸿蒙系统中应用权限等级介绍、定义、申请授权讲解 针对权限等级,相对于主体来说,会有不同的细分概念。 一、权限APL等级: 首先在鸿蒙系统中,对于权限本身,分为三个等级:normal,s…

(9)svelte 教程: Event Modifiers

(9)svelte 教程: Event Modifiers 什么是 Event Modifiers Event Modifiers 是 Svelte 框架中的一种特性,它允许你在绑定事件处理函数时,添加一些修饰符来修改事件的默认行为或事件流。通过这些修饰符,可…

SQL面试问题集

目录 Q.左连接和右连接的区别 Q.union 和 union all的区别 1、取结果的交集 2、获取结果后的操作 Q.熟悉开窗函数吗?讲一下row_number和dense_rank的区别。 Q.hive行转列怎么操作的 Q.要求手写的题主要考了聚合函数和窗口函数,row_number()&#…

TypeScript算法每日一题:最富有客户的资产总量(1672)

作者:前端小王hs 阿里云社区博客专家/清华大学出版社签约作者✍/CSDN百万访问博主/B站千粉前端up主 题库:力扣 题目序号:1672(简单) 题目:最富有客户的资产总量 给你一个m x n的整数网格accounts&#xff…

同一个tomcat不同端口运行不同项目

第一步:修改 server.xml 文件 修改 tomcat 安装目录下 conf/server.xml 文件,需要几个端口就添加几个 Service 节点。 配置 2 个端口:9131 和 9133,于是增加两个 Service 节点。 每个 Service 节点的 name 属性值要设置不同的值…

【MATLAB】雷达信号处理程序源码 雷达系统仿真代码 matlab SAR

【MATLAB】雷达信号处理程序源码 雷达系统仿真代码 matlab SAR 包含以下所有源码,内容如下:: 1、 MATGPR R3探地雷达数据处理 MATLAB 程序 2、 python 雷达图像识别 3、 SAR 雷达回波仿真 matlab 4、 SAR 雷达影像处理源码 5、 STFT 处理 IPIX 雷达…

开源协议及静态链接和动态链接

文章目录 开源LicenseMIT,BSD,Apache LicenseEPLGPL系列 静态链接和动态链接 开源License MIT,BSD,Apache License 这三种随便修改,商业上无风险 EPL 类似于上面三种 GPL系列 LGPL (静态链接调用必须…

Vue3组件通信方式

1. 常用的组件通信方式: props:可以实现父子组件、子父组件、甚至兄弟组件通信 自定义事件:可以实现子父组件通信 全局事件总线$bus:可以实现任意组件通信 pubsub:发布订阅模式可以实现任意组件通信 vuex&#xf…

一个知识问答系统,用户的选择决定接下来出现的问题,且下一个问题的呈现取决于前面几个问题的回答

一个知识问答系统,用户的选择决定接下来出现的问题,且下一个问题的呈现取决于前面几个问题的回答,我们需要设计一个更复杂的图结构来表示这些关系。 设计图结构 Question节点:表示问题。Answer节点:表示答案。HAS_AN…

Flutter基础 -- Dart 语言 -- 类抽象接口继承函数库

目录 1. 类 class 1.1 定义、使用类 1.2 构造函数 1.3 初始化列表 1.4 命名构造函数 1.5 重定向构造函数 1.6 callable 2. 类 get set 2.1 定义、使用 get set 2.2 简化 get set 2.3 业务场景 3. 静态 static 3.1 static 定义 3.2 函数内部访问 3.3 静态方法 3…

嵌入式学习(Day:31 网络编程2:TCP)

client, server browser b/s http p2p peer TCP的特征:1.有链接;2.可靠传输;3.流式套接字 1、模式 C/S 模式 》服务器/客户端模型(服务端1个,客户端很多个) server:socket()-->bind()---…

数据分析常用模型合集(三)同期群、逻辑树、假设检验等

前面两篇文章,我们将比较大、较为系统的分析方法作了一个介绍,本文是最后一篇,将剩余的一些讲一讲。 数据分析常用模型合集(二)RARRA模型、RFM模型-CSDN博客 剩下的一些模型,其实不应叫做模型,…

qt+ffmpeg 实现音视频播放(四)之音视频同步

在处理音视频数据时,解码音频的数据往往会比解码视频的数据比较慢,所以我们在播放音视频时,音频和视频的数据会出现渐渐对不上的情况。尤其在播放时间越长的时候,这种对不上的现象越明显。 为了解决这一问题,人们想出…

PHP基础学习笔记(常用函数)

字符串 strlen — 获取字符串长度 <?php $str abcdef; echo strlen($str); // 6$str ab cd ; echo strlen($str); // 7 //strlen() 返回的是字符串的字节数&#xff0c;而不是其中字符的数量。 ?>strpos — 查找字符串首次出现的位置 $mystring abc; $findme …

051、Python 快速把多个元素连接成一个字符串的方法

要想快速地将列表或元组中的元素连接成一个字符串&#xff0c;有一个特别实用地方法&#xff1a;join() 方法。 join() 方法&#xff1a;一个用于将序列中的元素以指定的分隔符连接成一个字符串的方法&#xff0c;这个方法通常用于字符串操作。 基本语法&#xff1a; separa…

在windows操作系统上安装MariaDB

最近收到关于数据库在哪里看的评论&#xff0c;所以就一不做二不休&#xff0c;把安装数据库的步骤写一篇文章吧。 这篇文章介绍如何在windows上完成MariaDB-10.6.5版本的安装&#xff0c;对应MySQL-8.x版本。 第一步&#xff1a;下载安装包 通过以下网盘链接下载MariaDB-10.6…

Spark入门:KMeans聚类算法

聚类&#xff08;Clustering&#xff09; 是机器学习中一类重要的方法。其主要思想使用样本的不同特征属性&#xff0c;根据某一给定的相似度度量方式&#xff08;如欧式距离&#xff09;找到相似的样本&#xff0c;并根据距离将样本划分成不同的组。聚类属于典型的无监督学习&…

国产信创CPU之飞腾CPU剖析

CPU&#xff1a;信创根基&#xff0c;国之重器 国产CPU已形成自主架构、x86、ARM三大阵营。自主阵营中&#xff0c;龙芯、申威分别基于MIPS和Alpha推出loong ISA和SW-64。ARM阵营以鲲鹏、飞腾为代表&#xff0c;利用ARM IP授权开发处理器。x86阵营由海光、兆芯等主导&#xff…

【Linux】操作系统中的文件系统管理:磁盘结构、逻辑存储与文件访问机制

文章目录 前言&#xff1a;1. 磁盘机械结构2. 磁盘物理结构3. 磁盘的逻辑存储3. 1. 文件名呢&#xff1f;3.2 对文件的增删查改与 路径3.3. 文件 4. 软硬链接4.1. 操作观察现象4.2. 软硬链接的原理4.3. 软硬链接的应用场景 总结 前言&#xff1a; 在现代操作系统中&#xff0c…