全面解析十七种数据分析方法,具象数据分析思维

一、介绍



在当今数据驱动的商业环境中,数据分析已经成为了企业获取竞争优势的关键工具。无论是为了优化运营效率,提高客户满意度,还是推动产品创新,企业都需要通过分析大量数据来做出明智的决策。数据分析方法多种多样,每种方法都有其独特的定义和用途,适用于不同的业务场景和问题解决需求。本文将详细介绍17种常见的数据分析方法,包括描述统计、假设检验、信度分析等,旨在帮助读者更好地理解每种方法的核心概念及其在实际工作中的应用价值。



二、数据分析方法



1. 描述性统计分析



40db2a328aa2c97517eebf50477f1f57.jpeg



描述性统计分析是统计学中的一个分支,其目的是通过概括和总结数据集的主要特征,来提供对数据的直观理解。这种分析方法主要关注数据的集中趋势、分散程度和分布形状等基本统计特征。



描述性统计分析通常通过以下几个方面展现数据:



  • 中心位置测度:描述数据的集中趋势。常用的统计量包括均值(平均值)、中位数和众数。
  • 离散程度测度:衡量数据的分散或离散程度,反映数据的波动。常见的统计量有标准差、方差、极差等。
  • 数据分布:描述数据的分布形状,是对数据集整体结构的概括。包括正态分布、偏态分布、峰态等。
  • 频数和频率:统计数据集中各个数值或范围出现的次数,以及其在整体中所占的比例。
  • 描述性图表:利用直方图、箱线图、散点图等可视化手段展示数据的分布和规律,使人们更容易理解数据。



2. 探索性数据分析(EDA)



探索性数据分析是由统计学家John W. Tukey提出的一种数据分析方法,旨在通过绘图和统计手段,深入理解数据集的结构、特征和模式,发现潜在的趋势和异常,为后续深入分析和建模提供基础。EDA的目标不是进行严格的推论统计,而是对数据进行初步的、直观的、全面的探索。



d84b2d087f27466c183fde0dce552847.jpeg



EDA的主要特点包括:



  • 可视化数据:通过绘制直方图、散点图、箱线图等可视化图表,以直观的方式展示数据的分布、关系和形态。
  • 统计描述:利用统计学的描述性统计量,如均值、中位数、标准差等,对数据的中心趋势和分散程度进行描述。
  • 相关性分析:通过计算变量之间的相关系数或绘制相关矩阵,揭示变量之间的关系。
  • 分布形态分析:判断数据的分布形态,包括正态性、偏度和峰度等,为后续建模选择适当的统计方法提供参考。



3. 假设检验和推论统计学



推论统计学是统计学的一个分支,主要关注从样本中得出关于总体的信息。它通过对样本统计量的分析和推断,帮助我们了解总体的性质、做出预测或者对总体参数进行推断。



898860302b58e03b0a1b8a9620248554.jpeg



推论统计学主要包括两个方面:



1)参数估计:利用样本数据估计总体参数的值,包括点估计和区间估计。点估计给出一个单一值作为总体参数的估计,而区间估计则提供参数估计的区间,表示我们对总体参数的不确定性。



2)假设检验:假设检验是统计学中一种常用的方法,用于对某个关于总体参数的假设进行检验。该方法基于样本数据,通过对比观察到的统计值与在零假设下的理论期望值之间的差异,来评估是否可以拒绝零假设。假设检验通常包括以下步骤:



  • 设立假设:提出一个关于总体参数的零假设(H0)和备择假设(H1)。
  • 选择显著性水平:确定显著性水平(通常为0.05),表示在该水平下,如果观察到的差异足够大,就拒绝零假设。
  • 收集样本数据:从总体中抽取样本,并计算样本统计量。
  • 计算检验统计量:根据样本数据计算一个检验统计量,该统计量的分布在零假设成立的条件下是已知的。
  • 做出决策:将计算得到的检验统计量与显著性水平相比较,如果小于显著性水平,则拒绝零假设;反之,则接受零假设。


示例中提到的数据分析模板分享给大家——
https://s.fanruan.com/7lh3w
零基础快速上手,还能根据需求进行个性化修改哦



4. 回归分析



回归分析是一种统计学方法,用于研究自变量与因变量之间的关系。通过建立数学模型,回归分析旨在揭示自变量的变化如何影响因变量的变化,以及这种影响的程度和方向。



c619360d60110e26035d113a1f74fb57.jpeg



回归分析可分为两大类:



  • 简单线性回归:只有一个自变量时的回归分析。回归方程为 Y = β₀ + β₁X + ε。
  • 多元线性回归:当存在多个自变量时的回归分析。回归方程为 Y = β₀ + β₁X₁ + β₂X₂ + ... + ε。



5. 聚类分析



聚类分析是一种无监督学习方法,旨在将数据集中的观察值划分为相似的组,这些组被称为簇(Cluster)。聚类的目标是使同一簇内的观察值相似度较高,而不同簇之间的相似度较低。通过聚类,我们可以发现数据中的内在结构、识别模式,并将相似的观察值划分为同一组,有助于深入理解数据。



86d9e7a443a3076f913c969295d68710.jpeg



聚类分析在许多领域中都有广泛应用,例如:



  • 市场分析:根据消费者行为将市场细分,以更好地了解目标市场。
  • 生物学:将基因表达数据聚类为具有相似功能的基因群。
  • 图像分析:将相似的图像聚类到一起,以便进行图像检索和分类。
  • 社交网络分析:根据用户的行为模式将社交网络中的用户进行分组。



6. 相关分析



相关分析旨在发现数据集中不同项之间的关联关系。这些关联规则描述了一个事件或者集合中出现的模式,指出在给定一些条件下,其他条件也可能会发生。常见的应用包括购物篮分析、交叉销售、网络流量分析等。



9397f9fbf2718fbf4ff6a83cb2d5d934.jpeg



在相关分析中,有两个关键的指标:



  • 支持度(Support):衡量一个规则在数据集中出现的频率。支持度高表示规则在数据集中出现的频率较高。
  • 置信度(Confidence):衡量规则的可信度,即在条件出现的情况下,结果也会出现的概率。置信度高表示规则较为可靠。



相关分析的经典算法包括:



  • Apriori算法:基于先验原则,从频繁项集(在数据集中频繁出现的项的集合)逐步生成关联规则。
  • FP-growth算法:使用一种称为“频繁模式树”的数据结构,通过递归地分解数据集,发现频繁项集。



相关分析在商业和科学领域中得到了广泛的应用。例如,在零售业,通过分析顾客的购物篮,商家可以制定更有效的促销策略;在医学研究中,相关分析可以帮助发现患病的模式或者药物的副作用等。



7. 时间序列分析



时间序列分析是一种研究随时间变化而产生的数据的统计方法。时间序列是按照时间顺序排列的一系列数据点,通常是等间隔采集的观测结果。这些数据点可以用来分析时间的趋势、周期性、季节性和其他可能的模式。



1da9accb3d217f4510f79cd89e6108a2.jpeg



时间序列分析主要包括以下几个方面:



  • 趋势分析:识别和描述数据中的长期趋势,判断数据是逐渐增长、减少还是保持稳定。
  • 季节性分析:探究数据中是否存在按照季节重复出现的模式。季节性分析有助于理解数据在一年内的周期性波动。
  • 周期性分析:与季节性类似,周期性分析关注长期重复出现的模式,但这些模式的周期可能不是固定的一年。
  • 噪声分析:考察时间序列中的随机波动,以确定是否存在无法预测的随机变动。
  • 预测和模型建立:基于已有的时间序列数据,建立数学模型,用来预测未来的观测值。



时间序列分析在许多领域中都有应用,包括金融、经济学、气象学、生态学、医学等。通过深入理解时间序列的模式,人们可以更好地预测未来趋势,制定决策和规划。



8. 空间数据分析



空间数据分析是一种专注于处理和分析与地理位置相关的数据的方法。这类数据包括地理信息、地理坐标、地形地貌等,通常以空间对象和它们在地球表面上的位置为基础。空间数据分析的目标是揭示地理空间中的模式、趋势和关联关系,从而帮助我们更好地理解地理现象、做出决策和规划。



e9787e2e90f3bb3765e181f2cd12f8f2.jpeg



空间数据分析的主要内容包括:



  • 地理信息系统 (GIS):GIS是一种集成空间数据分析和空间数据可视化的工具。它允许用户收集、存储、分析和展示地理空间数据,支持地图制图和决策制定。
  • 地统计学(Geostatistics):地统计学关注对地理空间中的现象进行统计分析,包括空间插值(Spatial Interpolation)和变异性分析(Variogram Analysis)等。
  • 地理数据挖掘: 类似于传统数据挖掘,地理数据挖掘专注于从空间数据中发现隐藏的模式和知识。
  • 空间模型:利用统计学和机器学习方法,建立空间数据的预测和分类模型,例如空间回归模型、地理加权回归(Geographically Weighted Regression,GWR)等。
  • 网络分析:研究空间网络中的路径、连接和网络关系,通常应用于交通规划、电信网络等领域。
  • 遥感分析:使用遥感技术获取地球表面的信息,通过分析遥感图像,了解地表特征、覆盖类型和变化。



9. 生存分析



生存分析(Survival Analysis)是一种统计学方法,用于研究个体或对象在一段时间内发生某一特定事件(例如死亡、疾病复发、设备故障等)的概率和时间关系。它考虑了数据中的截尾(Censoring)情况,即观察到的生存时间可能未达到终点事件或被丢失。



c8799192413ca08f7c2dffc07c509da9.jpeg



生存分析的主要内容包括:



  • 生存函数(Survival Function):描述了在给定时间内生存下来的个体或对象的概率。
  • 生存曲线(Survival Curve):以时间为横轴,生存函数为纵轴绘制的曲线,用于直观展示个体或对象在不同时间点的生存概率。
  • 截尾(Censoring):生存数据中可能存在部分观测值因为未达到终点事件而被截尾的情况,生存分析要考虑如何处理这种截尾数据。
  • 风险比(Hazard Ratio):用于比较不同组别或处理间生存时间的风险差异,是生存分析的一个重要指标。
  • 累积风险(Cumulative Hazard):描述了在给定时间点之前经历终点事件的累积概率。
  • 生存分析模型:包括半参数模型(如Cox比例风险模型)和参数模型(如指数分布、Weibull分布等),用于估计生存函数和比较不同因素对生存时间的影响。



生存分析广泛应用于医学、生物学、流行病学、工程学等领域,用于评估治疗效果、疾病预后、产品寿命、质量控制等方面的问题。



10. 信度分析



信度分析(Reliability Analysis)是一种统计方法,用于评估测量工具(例如问卷调查、测试、观察量表等)的信度,即测量工具在不同情况下产生相似结果的程度。信度分析旨在确定测量工具的稳定性和一致性,以确保测量结果的准确性和可靠性。



a78e90a3f9390116fe0f60ed837c224e.jpeg



在信度分析中,常用的统计指标包括:



  • 内部一致性信度:评估测量工具中各项指标之间的一致性程度,常用的统计指标包括Cronbach's alpha系数和Kuder-Richardson系数。
  • 测试-重测信度:评估同一测量工具在不同时间或条件下的测量结果的一致性程度,通常使用相关系数(如Pearson相关系数或Spearman相关系数)来衡量。
  • 间观者信度:评估不同观察者或评分者对同一对象进行评定时的一致性程度,常用的统计指标包括Kappa系数和Intraclass Correlation Coefficient(ICC)。



信度分析的结果可帮助研究者确定测量工具的可信度和稳定性,从而有效地评估和解释研究结果。



空间数据分析应用的领域非常广泛,包括城市规划、环境科学、农业、流行病学、天文学等。这些分析不仅有助于对地理现象的理解,还为地理信息的管理和利用提供了科学的支持。



11. 因子分析



因子分析(Factor Analysis)是一种统计方法,用于分析观察到的变量之间的潜在结构或潜在因素。它旨在识别多个观察到的变量之间的共性,将它们归纳为较少数量的潜在因子,并探索这些因子与原始变量之间的关系。因子分析常用于数据降维、变量筛选、构建量表或测量工具、发现潜在结构等领域。



5a06a8a518670b388dec3af2c25a570b.jpeg



在因子分析中,主要包含以下几个步骤:



  • 提取因子:通过统计方法提取数据中潜在的共性因子。常用的提取方法包括主成分分析(PCA)、最大似然估计法、最小残差法等。
  • 旋转因子:对提取出的因子进行旋转,以使因子结构更易于解释。常见的旋转方法包括正交旋转(如Varimax旋转)和斜交旋转(如Promax旋转)。
  • 因子解释:解释每个因子代表的含义,并将它们与原始变量联系起来,以理解潜在的结构。
  • 因子得分计算:根据因子载荷量计算每个观测样本在每个因子上的得分,以便进一步分析。



因子分析适用于多个领域,包括心理学、教育、市场调查、医学研究等,可用于探索变量之间的潜在关系、构建潜变量模型、简化数据结构等。



12. 主成分分析



主成分分析(Principal Component Analysis,PCA)是一种常用的多变量数据降维技术,旨在将高维数据转换为低维数据,同时尽可能保留原始数据的信息。它通过寻找数据中的主成分(Principal Components),将数据投影到新的坐标系中,从而实现数据的降维。



925b9270dc3e7717aa5225ce2224f76b.jpeg



主成分分析的主要步骤包括:



  • 数据标准化:对原始数据进行标准化处理,使各个变量具有相同的尺度,避免由于尺度差异导致的主成分不准确。
  • 计算协方差矩阵:计算标准化后的变量之间的协方差矩阵,该矩阵反映了变量之间的线性关系。
  • 特征值分解:对协方差矩阵进行特征值分解,得到特征值和对应的特征向量。特征向量即为主成分方向,特征值表示数据在相应主成分方向上的方差大小。
  • 选择主成分:根据特征值的大小选择保留的主成分数量,通常选择特征值较大的前几个主成分,以保留大部分数据的方差信息。
  • 计算主成分得分:将原始数据投影到选定的主成分上,得到每个样本在主成分上的得分,作为降维后的数据。



主成分分析可用于数据可视化、特征提取、数据压缩、去除共线性等任务,在多个领域广泛应用,如金融、生物学、医学、社会科学等。



13. 决策树分析



决策树分析是一种基于树形结构的机器学习算法,用于建立分类或回归模型。在决策树中,每个内部节点表示一个特征/属性,每个分支代表该特征的一个可能取值,而每个叶节点表示一个类别标签或数值输出。



7194c659910bb1f5f6658c6b9d476b84.jpeg



决策树分析的主要步骤包括:



  • 特征选择:从所有可能的特征中选择最佳的特征,以将数据集分割成不同的子集。通常使用的特征选择方法包括信息增益、基尼指数等。
  • 树的构建:递归地将数据集划分成子集,直到子集中的数据属于同一类别或达到预定义的停止条件。构建过程通过选择最佳的特征来创建节点,并在每个节点上进行分裂,直到满足停止条件为止。
  • 剪枝:为了防止过拟合,可以对生成的决策树进行剪枝处理,去除一些不必要的节点和分支,从而提高模型的泛化能力。
  • 预测:使用生成的决策树对新样本进行分类或回归预测。根据样本的特征值沿着树的分支逐步向下,直到到达叶节点,然后将叶节点所属的类别或数值作为预测结果。



决策树分析具有易于理解、可解释性强的特点,能够处理分类和回归问题,并且对数据的准备要求较低。它被广泛应用于金融、医疗、工业等领域的风险评估、疾病诊断、产品推荐等任务中。



14. ROC分析



ROC(Receiver Operating Characteristic)分析是一种用于评估分类模型性能的方法。它通过绘制 ROC 曲线来展示分类器的真正例率(True Positive Rate,也称为灵敏度)与假正例率(False Positive Rate)之间的关系。ROC 曲线的横轴是假正例率(FPR),纵轴是真正例率(TPR),在不同的阈值下绘制出的曲线可以帮助我们理解分类器在不同条件下的性能表现。



6c70b419d77f5df19d54e6e4f377c571.jpeg



在 ROC 曲线中,我们希望真正例率尽可能高,同时假正例率尽可能低。因此,ROC 曲线越靠近左上角(0,1)点,表示分类器性能越好。而对角线(45°直线)表示随机猜测的性能水平。



除了绘制 ROC 曲线外,我们还可以使用 AUC(Area Under the ROC Curve)指标来度量分类器性能。AUC 值表示 ROC 曲线下的面积,通常在 0 到 1 之间,越接近 1 表示分类器性能越好,越接近 0.5 则表示性能越差(与随机猜测无异)。



ROC 分析通常用于比较不同模型的性能、选择最佳分类器、优化模型阈值等。它在医学诊断、信用评分、广告点击预测等领域有着广泛的应用。



15. 判别分析



判别分析(Discriminant Analysis)是一种统计分析方法,旨在区分或分类两个或多个已知组别之间的差异。其主要目的是通过将多个变量(也称为预测变量)与一个或多个分类变量(也称为响应变量或因变量)进行分析,来确定这些变量之间的关系,并基于这些关系进行分类或预测。



d0265c16871302f7325355abfb843cee.jpeg



判别分析通常用于以下情况:



  • 数据包含一个或多个连续变量,以及一个离散分类变量。
  • 通过已知的变量来预测未知的分类标签。
  • 区分两个或多个组别,并确定哪些变量最能有效地区分这些组别。



判别分析的主要目标是找到一个或多个线性组合的函数,这些函数能够最大程度地区分不同组别之间的差异。在实践中,判别分析通常会生成一个判别函数,该函数可以用来对新的观测数据进行分类,从而确定它们属于哪个组别。



判别分析有几种不同的类型,包括线性判别分析(LDA)、二次判别分析(QDA)和其他变体。这些方法的选择取决于数据的性质、假设的满足程度以及分析的特定目的。



16. 列联表分析



列联表分析(Contingency Table Analysis)是一种统计方法,用于研究两个或多个分类变量之间的关系。它将数据组织成一个二维表格,称为列联表或交叉表,其中行代表一个分类变量的各个水平,列代表另一个分类变量的各个水平。列联表中的每个单元格表示两个分类变量在特定水平组合下的频数或百分比。



57cfc35e2f48494f8c98d956fa4ff78a.jpeg



列联表分析的主要目的是探索和描述两个或多个分类变量之间的相关性或关联性。它可以帮助我们回答诸如以下问题:



  • 两个分类变量之间是否存在关联或相关性?
  • 不同分类变量水平之间的关联程度如何?
  • 一个分类变量的水平对另一个分类变量的水平有何影响?



在列联表分析中,常用的统计方法包括卡方检验(Chi-square Test),用于检验两个分类变量之间是否存在显著的关联;残差分析(Residual Analysis),用于确定列联表中各个单元格的观察频数与期望频数之间的差异程度;以及列联表中的效应量指标,如Cramer's V 等,用于描述两个分类变量之间的关联强度。



列联表分析通常用于社会科学、医学、市场研究等领域,以帮助研究人员理解和解释不同分类变量之间的关系,从而进行更深入的数据解释和决策制定。



17. 对应分析



对应分析(Correspondence Analysis)是一种用于探索分类数据之间关系的多元统计技术。它主要用于分析两个或多个分类变量之间的频率分布或相互关联。对应分析的主要目标是在一个二维图上展示分类变量之间的关系,以便于可视化和解释。



b6107daa7bd78f7bcb06079b1f5c2fdc.jpeg



对应分析的一般步骤包括:



  • 构建频率表:首先,根据研究的对象或问题构建一个频率表,记录不同分类变量的频次或比例。
  • 计算期望频率:根据频率表计算期望频率,即在假设各个分类变量之间独立的情况下,每个单元格的期望频率。
  • 计算残差:将观察频率与期望频率进行比较,计算残差,用来衡量观察频率与期望频率之间的偏差。
  • 进行对应分析:通过对残差进行奇异值分解等数学方法,将多维数据映射到低维空间中,得到分类变量之间的关系。



对应分析的结果通常以对应图(Correspondence Plot)的形式呈现,其中不同分类变量的水平或类别在二维平面上用点表示,点的位置和相对位置反映了它们之间的关系。



对应分析在市场调查、社会科学调查、生态学、生物统计学等领域有广泛的应用。它可以帮助研究人员发现变量之间的关联性,识别数据中的模式和结构,并为后续的分析和解释提供有用的参考。



三、结语



通过上述对17种数据分析方法的详细阐述,我们可以看到,每一种方法都是解读数据、揭示洞见的有力工具。而在实际应用中,企业往往需要一个集成的平台来高效地执行这些分析方法,并将分析结果转化为可行的策略。



在这方面,BI数据分析工具FineBI提供了一个强大的解决方案。FineBI不仅支持上述所有数据分析方法,还通过其直观的用户界面和强大的数据处理能力,帮助企业快速从数据中提取有价值的信息,从而做出更加精准和及时的决策。



无论您是数据分析师,还是决策者,FineBI都能助您一臂之力,让数据分析变得更加高效和智能。选择FineBI,让数据分析成为推动您业务发展的强大引擎。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/798997.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件无线电系列——CIC滤波器

本节目录 一、CIC滤波器 1、积分器 2、梳状滤波器 3、CIC滤波器的特性 二、单级CIC和多级CIC滤波器本节内容 一、CIC滤波器 CIC滤波器,英文名称为Cascade Integrator Comb,中文全称为级联积分梳状滤波器,从字面来看就是将积分器与梳状滤波器…

《云原生安全攻防》-- 云原生应用风险分析

为了满足每位朋友的学习需求,并且支持课程的持续更新,本系列课程提供了免费版和付费视频版两种方式来提供课程内容。我们会持续更新课程内容,以确保内容的度和实用性。 在本节课程中,我们将一起探讨云原生应用在新的架构模式下可能…

怎么保证缓存与数据库的最终一致性?

目录 零.读数据的标准操作 一.Cache aside Patten--旁路模式 二.Read/Write Through Pattern--读写穿透 三.Write Back Pattern--写回 四.运用canal监听mysql的binlog实现缓存同步 零.读数据的标准操作 这里想说的是不管哪种模式读操作都是一样的,这是一种统一…

蓝桥杯刷题-09-三国游戏-贪心⭐⭐⭐

蓝桥杯2023年第十四届省赛真题-三国游戏 小蓝正在玩一款游戏。游戏中魏蜀吴三个国家各自拥有一定数量的士兵X, Y, Z (一开始可以认为都为 0 )。游戏有 n 个可能会发生的事件,每个事件之间相互独立且最多只会发生一次,当第 i 个事件发生时会分别让 X, Y,…

drawio画图编辑图形颜色

drawio画图编辑图形颜色 团队的安全第一图表。将您的存储空间带到我们的在线工具中,或使用桌面应用程序进行本地保存。 1.安装准备 1.1安装平台 多平台 1.2在线使用 浏览器打开网页使用 1.3软件下载 drawio官网github仓库下载 2.在浏览器的网页中使用drawio…

Mac 每次重启终端都要重新配置mysql环境变量解决办法

1、问题 Mac 每次关闭终端后,mysql环境配置就失效了,需要重新配置mysql环境变量 2、解决方法 在 " ~/.zshrc "文件添加" source ~/.bash_profile "即可 vim ~/.zshrc source ~/.bash_profile 3、验证 退出终端后重新打开终端 mys…

提取COCO数据集中特定的类—vehicle 4类

提取COCO数据集中特定的类—vehicle 4类 1 安装pycocotools2 下载COCO数据集3 提取特定的类别4 多类标签合并 1 安装pycocotools pycocotools github地址 pip install githttps://github.com/philferriere/cocoapi.git#subdirectoryPythonAPI2 下载COCO数据集 COCO官网下载2…

QT C++(QT对象树与内存泄漏管理,QT中文乱码问题)

文章目录 1. QT对象树与内存泄漏2. QT中文乱码 1. QT对象树与内存泄漏 #include "widget.h" #include "ui_widget.h" #include <QLabel>Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);//通过代码构…

Apache-Pulsar安装操作说明

说明 Pulsar 是一种用于服务器到服务器消息传递的多租户高性能解决方案。 Pulsar 的主要特性如下&#xff1a; 对 Pulsar 实例中的多个集群的本机支持&#xff0c;并跨集群无缝地复制消息。 极低的发布和端到端延迟。 无缝可扩展至超过一百万个主题。 一个简单的客户端 API&…

解决前端精度丢失问题:后端Long类型到前端的处理策略

在Web开发中&#xff0c;我们经常遇到前后端数据类型不匹配的问题&#xff0c;特别是当后端使用大数据类型如Long时&#xff0c;前端由于JavaScript的数字精度限制&#xff0c;可能导致精度丢失。本文将深入探讨这个问题&#xff0c;并提供两种有效的解决方法。 一、问题背景 …

Java常用类与基础API--String常见算法题目

文章目录 一、面试题&#xff08;1&#xff09;题1 二、常见算法题目&#xff08;1&#xff09;题1&#xff08;2&#xff09;题2&#xff08;3&#xff09;题3&#xff08;4&#xff09;题4&#xff08;5&#xff09;题5 三、案例 一、面试题 &#xff08;1&#xff09;题1 …

2024/4/1—力扣—删除字符使频率相同

代码实现&#xff1a; 思路&#xff1a; 步骤一&#xff1a;统计各字母出现频率 步骤二&#xff1a;频率从高到低排序&#xff0c;形成频率数组 步骤三&#xff1a;频率数组只有如下组合符合要求&#xff1a; 1, 0...0n 1, n...n (, 0)n...n, 1(, 0) bool equalFrequency(char…

CVE-2024-3148 DedeCms makehtml_archives_action sql注入漏洞分析

DedeCMS&#xff08;也称为织梦CMS&#xff09;是一款基于PHPMySQL的开源内容管理系统。 在 DedeCMS 5.7.112 中发现一个被归类为严重的漏洞。此漏洞会影响某些未知文件dede/makehtml_archives_action.php的处理。操作导致 sql 注入。攻击可能是远程发起的。该漏洞已向公众披露…

【服务器uwsgi + flask + nginx的搭建】

目录 服务器uwsgi flask nginx的搭建1. 安装必要的软件2. 启动nginx服务3. 测试Nginx4. 配置uwsgi和flask5. 配置nginx 服务器uwsgi flask nginx的搭建 1. 安装必要的软件 安装Python、uWSGI、Flask 和 Nginx。 # Ubuntu 安装命令 sudo apt-get update sudo apt-get ins…

03-JAVA设计模式-建造者模式

建造者模式 什么是建造者模式 建造者模式&#xff08;Builder Pattern&#xff09;是一种对象构建的设计模式&#xff0c;它允许你通过一步一步地构建一个复杂对象&#xff0c;来隐藏复杂对象的创建细节。 这种模式将一个复杂对象的构建过程与其表示过程分离&#xff0c;使得…

大语言模型上下文窗口初探(下)

由于篇幅原因&#xff0c;本文分为上下两篇&#xff0c;上篇主要讲解上下文窗口的概念、在LLM中的重要性&#xff0c;下篇主要讲解长文本能否成为LLM的护城河、国外大厂对长文本的态度。 3、长文本是护城河吗&#xff1f; 毫无疑问&#xff0c;Kimi从一开始就用“长文本”占领…

力扣 583. 两个字符串的删除操作

题目来源&#xff1a;https://leetcode.cn/problems/delete-operation-for-two-strings/description/ C题解1&#xff1a;动态规划 寻找word1和word2拥有的公共最长子序列&#xff0c;之后分别对word1和word2进行删除操作&#xff0c;即可使word1和word2相等。 寻找公共最长子…

【引子】C++从介绍到HelloWorld

C从介绍到HelloWorld 一、C的介绍1. 简介2. 应用场景3. C的标准![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/e3efb0f207f647729b92c0b5bcd4b330.png)4. C的运行过程 二、Visual Studio的安装1. 什么是Visual Studio2. Visual Studio的安装 三、完成HelloWorld1.…

Windows系统C盘空间优化进阶:磁盘清理与Docker日志管理

Windows系统C盘空间优化进阶&#xff1a;磁盘清理与Docker日志管理 文章目录 Windows系统C盘空间优化进阶&#xff1a;磁盘清理与Docker日志管理磁盘清理工具 使用“运行”命令访问磁盘清理利用存储感知自动管理空间清理WinSxS文件夹结合手动清理策略 小结删除临时文件总结&…

2024新版PHP在线客服系统多商户AI智能在线客服系统源码机器人自动回复即时通讯聊天系统源码PC+H5

搭建环境&#xff1a; 服务器 CPU 2核心 ↑ 运存 2G ↑ 宽带 5M ↑ 服务器操作系统 Linux Centos7.6-7.9 ↑ 运行环境&#xff1a; 宝塔面板 Nginx1.18- 1.22 PHP 7.1-7.3 MYSQL 5.6 -5.7 朵米客服系统是一款全功能的客户服务解决方案&#xff0c;提供多渠道支持…