第17篇:python进阶:详解数据分析与处理

第17篇:数据分析与处理

内容简介

本篇文章将深入探讨数据分析与处理在Python中的应用。您将学习如何使用pandas库进行数据清洗与分析,掌握matplotlibseaborn库进行数据可视化,以及处理大型数据集的技巧。通过丰富的代码示例和实战案例,您将能够高效地进行数据处理、分析和可视化,为数据驱动的决策提供有力支持。


目录

  1. 数据分析与处理概述
    • 什么是数据分析与处理
    • 数据分析的流程
  2. 使用pandas进行数据清洗与分析
    • pandas简介
    • 数据导入与导出
    • 数据清洗
      • 处理缺失值
      • 数据转换与标准化
      • 去除重复数据
    • 数据分析与操作
      • 数据筛选与过滤
      • 数据分组与聚合
      • 数据合并与连接
  3. 数据可视化
    • matplotlib简介
    • seaborn简介
    • 使用matplotlib进行基本绘图
      • 折线图
      • 柱状图
      • 散点图
    • 使用seaborn进行高级绘图
      • 热力图
      • 箱线图
      • 小提琴图
  4. 处理大型数据集
    • 优化pandas性能
      • 使用合适的数据类型
      • 向量化操作
      • 避免使用循环
    • 使用Dask处理大数据
      • Dask简介
      • 基本使用方法
      • pandas的集成
    • 分布式数据处理工具
      • Apache Spark
      • 其他工具介绍
  5. 示例代码
    • pandas数据清洗与分析示例
    • matplotlib数据可视化示例
    • seaborn数据可视化示例
    • 处理大型数据集示例
  6. 常见问题及解决方法
    • 问题1:如何处理pandas中的缺失数据?
    • 问题2:matplotlibseaborn的选择标准是什么?
    • 问题3:如何提升pandas处理大型数据集的效率?
    • 问题4:在数据可视化中如何选择合适的图表类型?
  7. 总结

数据分析与处理概述

什么是数据分析与处理

数据分析与处理是指通过对数据进行收集、清洗、转换、建模和可视化等步骤,从中提取有价值的信息和见解的过程。数据分析在各行各业中都有广泛应用,如商业决策、科学研究、市场营销等。

数据分析的流程

数据分析通常包括以下几个步骤:

  1. 数据收集:获取原始数据,可以来自数据库、API、文件等。
  2. 数据清洗:处理缺失值、异常值、重复数据等,确保数据质量。
  3. 数据转换:对数据进行格式转换、标准化、特征工程等。
  4. 数据分析:应用统计方法和机器学习算法,发现数据中的模式和关系。
  5. 数据可视化:通过图表和图形展示分析结果,帮助理解和传达信息。
  6. 结果解释与决策:根据分析结果制定相应的策略和决策。

使用pandas进行数据清洗与分析

pandas简介

pandas是Python中最常用的数据分析和数据处理库,提供了强大的数据结构和函数,特别是DataFrameSeries,能够高效地处理和分析结构化数据。

数据导入与导出

pandas支持多种数据格式的导入与导出,如CSV、Excel、JSON、SQL数据库等。

导入数据示例

import pandas as pd# 从CSV文件导入数据
df = pd.read_csv('data.csv')# 从Excel文件导入数据
df_excel = pd.read_excel('data.xlsx', sheet_name='Sheet1')# 从JSON文件导入数据
df_json = pd.read_json('data.json')

导出数据示例

# 导出到CSV文件
df.to_csv('output.csv', index=False)# 导出到Excel文件
df.to_excel('output.xlsx', sheet_name='Sheet1', index=False)# 导出到JSON文件
df.to_json('output.json', orient='records', lines=True)

数据清洗

数据清洗是数据分析的重要步骤,确保数据的准确性和一致性。

处理缺失值

缺失值在数据集中普遍存在,pandas提供了多种方法处理缺失值。

检测缺失值

# 检查每列的缺失值数量
print(df.isnull().sum())# 检查整个DataFrame是否有缺失值
print(df.isnull().values.any())

处理缺失值

  • 删除缺失值

    # 删除包含任何缺失值的行
    df_cleaned = df.dropna()# 删除所有列都为缺失值的行
    df_cleaned = df.dropna(how='all')
    
  • 填充缺失值

    # 用特定值填充缺失值
    df_filled = df.fillna(0)# 用前一个有效值填充缺失值
    df_filled = df.fillna(method='ffill')# 用后一个有效值填充缺失值
    df_filled = df.fillna(method='bfill')
    
数据转换与标准化

数据转换包括数据类型转换、数据标准化等操作。

数据类型转换

# 将某列转换为整数类型
df['age'] = df['age'].astype(int)# 将某列转换为日期类型
df['date'] = pd.to_datetime(df['date'])

数据标准化

# 标准化数值列
df['salary_normalized'] = (df['salary'] - df['salary'].mean()) / df['salary'].std()
去除重复数据

重复数据可能会影响分析结果,pandas提供了便捷的方法去除重复数据。

# 查看重复行
duplicates = df[df.duplicated()]
print(duplicates)# 删除重复行,保留第一次出现
df_unique = df.drop_duplicates()# 删除重复行,保留最后一次出现
df_unique = df.drop_duplicates(keep='last')

数据分析与操作

pandas提供了丰富的功能进行数据筛选、分组、聚合和合并等操作。

数据筛选与过滤

筛选特定行

# 筛选年龄大于30的行
df_filtered = df[df['age'] > 30]# 使用多个条件筛选
df_filtered = df[(df['age'] > 30) & (df['gender'] == 'F')]

选择特定列

# 选择单列
age_series = df['age']# 选择多列
subset = df[['name', 'age', 'salary']]
数据分组与聚合

分组操作

# 按性别分组
grouped = df.groupby('gender')# 计算每组的平均年龄
average_age = grouped['age'].mean()
print(average_age)

聚合操作

# 计算每组的总薪资和平均薪资
salary_summary = grouped['salary'].agg(['sum', 'mean'])
print(salary_summary)
数据合并与连接

合并操作

# 合并两个DataFrame,按共同列
merged_df = pd.merge(df1, df2, on='employee_id', how='inner')# 外连接
merged_df = pd.merge(df1, df2, on='employee_id', how='outer')

连接操作

# 上下拼接
concatenated_df = pd.concat([df1, df2], axis=0)# 左右拼接
concatenated_df = pd.concat([df1, df2], axis=1)

数据可视化

matplotlib简介

matplotlib是Python中最基础且功能强大的绘图库,能够创建各种类型的静态、动态和交互式图表。它提供了类似MATLAB的绘图接口,适用于需要高度自定义的可视化需求。

seaborn简介

seaborn是基于matplotlib构建的高级绘图库,专注于统计数据可视化。它简化了复杂图表的创建过程,并提供了美观的默认样式,适合快速生成专业级别的图表。

使用matplotlib进行基本绘图

折线图

折线图适用于展示数据随时间或顺序的变化趋势。

import matplotlib.pyplot as plt# 示例数据
months = ['Jan', 'Feb', 'Mar', 'Apr', 'May']
sales = [250, 300, 280, 350, 400]plt.figure(figsize=(8, 5))
plt.plot(months, sales, marker='o', linestyle='-', color='b')
plt.title('月销售额趋势')
plt.xlabel('月份')
plt.ylabel('销售额')
plt.grid(True)
plt.show()
柱状图

柱状图适用于比较不同类别的数据。

# 示例数据
products = ['Widget', 'Gizmo', 'Gadget']
sales = [150, 200, 120]plt.figure(figsize=(8, 5))
plt.bar(products, sales, color=['skyblue', 'salmon', 'lightgreen'])
plt.title('产品销售量比较')
plt.xlabel('产品')
plt.ylabel('销售量')
plt.show()
散点图

散点图适用于展示两个变量之间的关系。

# 示例数据
import numpy as npnp.random.seed(0)
x = np.random.rand(50)
y = x + np.random.normal(0, 0.1, 50)plt.figure(figsize=(8, 5))
plt.scatter(x, y, color='purple')
plt.title('变量X与Y的关系')
plt.xlabel('X')
plt.ylabel('Y')
plt.show()

使用seaborn进行高级绘图

热力图

热力图适用于展示变量之间的相关性或数据密度。

import seaborn as sns# 示例数据
data = sns.load_dataset('iris')
corr = data.corr()plt.figure(figsize=(8, 6))
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.title('Iris数据集特征相关性热力图')
plt.show()
箱线图

箱线图适用于展示数据的分布情况及异常值。

plt.figure(figsize=(8, 5))
sns.boxplot(x='species', y='sepal_length', data=data)
plt.title('不同物种的萼片长度分布')
plt.xlabel('物种')
plt.ylabel('萼片长度 (cm)')
plt.show()
小提琴图

小提琴图结合了箱线图和密度图的特点,展示数据分布的更详细信息。

plt.figure(figsize=(8, 5))
sns.violinplot(x='species', y='petal_length', data=data, palette='Pastel1')
plt.title('不同物种的花瓣长度分布')
plt.xlabel('物种')
plt.ylabel('花瓣长度 (cm)')
plt.show()

处理大型数据集

优化pandas性能

处理大型数据集时,pandas的性能可能成为瓶颈。以下是一些优化方法:

使用合适的数据类型

合理选择数据类型可以显著减少内存使用,提高处理速度。

# 查看数据类型
print(df.dtypes)# 将整数列转换为更小的整数类型
df['age'] = df['age'].astype('int8')# 将分类数据转换为类别类型
df['gender'] = df['gender'].astype('category')
向量化操作

尽量使用pandasnumpy的向量化操作,避免使用显式的Python循环。

# 向量化计算新列
df['total_price'] = df['quantity'] * df['price']# 使用`apply`进行高效计算
df['discounted_price'] = df['total_price'].apply(lambda x: x * 0.9)
避免使用循环

循环在pandas中效率较低,尽量使用内置函数和方法。

# 不推荐:使用循环进行数据操作
for index, row in df.iterrows():df.at[index, 'total'] = row['quantity'] * row['price']# 推荐:使用向量化操作
df['total'] = df['quantity'] * df['price']

使用Dask处理大数据

Dask是一个并行计算库,能够处理比内存更大的数据集,扩展pandas的功能。

Dask简介

Dask提供了与pandas类似的接口,但支持延迟计算和并行处理,适合处理大型数据集和复杂的计算任务。

基本使用方法
import dask.dataframe as dd# 从CSV文件读取数据
ddf = dd.read_csv('large_data.csv')# 进行数据清洗和转换
ddf = ddf.dropna()
ddf['total'] = ddf['quantity'] * ddf['price']# 进行分组与聚合
result = ddf.groupby('category')['total'].sum().compute()
print(result)
pandas的集成

Dask可以与pandas无缝集成,允许在必要时转换为pandas对象进行进一步处理。

# 将Dask DataFrame转换为pandas DataFrame
pdf = ddf.compute()# 继续使用pandas进行处理
pdf['average'] = pdf['total'] / pdf['quantity']

分布式数据处理工具

对于极其庞大的数据集和复杂的计算任务,分布式数据处理工具如Apache Spark提供了强大的能力。

Apache Spark

Apache Spark是一个快速、通用的大数据处理引擎,支持分布式数据处理和机器学习任务。PySpark是Spark的Python API,允许在Python中编写Spark应用。

基本使用示例

from pyspark.sql import SparkSession# 初始化SparkSession
spark = SparkSession.builder.appName('DataAnalysis').getOrCreate()# 读取数据
df = spark.read.csv('large_data.csv', header=True, inferSchema=True)# 数据清洗
df_clean = df.dropna()# 数据分析
df_grouped = df_clean.groupBy('category').sum('price')# 显示结果
df_grouped.show()# 关闭SparkSession
spark.stop()
其他工具介绍
  • Vaex:高性能的DataFrame库,适用于处理大规模数据集,支持内存映射和延迟计算。
  • Modin:通过多线程和分布式计算加速pandas操作,提供与pandas完全兼容的API。
  • Ray:用于构建分布式应用的框架,支持并行和分布式数据处理任务。

示例代码

pandas数据清洗与分析示例

以下示例展示了如何使用pandas进行数据导入、清洗、分析和导出。

import pandas as pddef clean_and_analyze(csv_file):# 导入数据df = pd.read_csv(csv_file)print("原始数据概览:")print(df.head())# 处理缺失值df = df.dropna()# 转换数据类型df['age'] = df['age'].astype(int)df['gender'] = df['gender'].astype('category')# 添加总价列df['total_price'] = df['quantity'] * df['price']# 分组聚合sales_summary = df.groupby('category')['total_price'].sum()print("\n按类别分组的总销售额:")print(sales_summary)# 导出清洗后的数据df.to_csv('cleaned_data.csv', index=False)print("\n清洗后的数据已保存到'cleaned_data.csv'")# 使用示例
clean_and_analyze('sales_data.csv')

输出(假设sales_data.csv内容如下):

原始数据概览:name  age gender category  quantity  price
0  A    25      M      A        5     20.0
1  B    30      F      B        3     15.0
2  C    22      M      A        2     20.0
3  D    28      F      C        4     25.0
4  E    35      M      B        1     15.0按类别分组的总销售额:
category
A    140.0
B     60.0
C    100.0
Name: total_price, dtype: float64清洗后的数据已保存到'cleaned_data.csv'

matplotlib数据可视化示例

以下示例展示了如何使用matplotlib绘制销售额折线图和柱状图。

import matplotlib.pyplot as plt
import pandas as pddef plot_sales_trends(csv_file):# 导入数据df = pd.read_csv(csv_file)# 按月份分组计算总销售额monthly_sales = df.groupby('month')['total_price'].sum()# 绘制折线图plt.figure(figsize=(10, 6))plt.plot(monthly_sales.index, monthly_sales.values, marker='o', linestyle='-', color='b')plt.title('月销售额趋势')plt.xlabel('月份')plt.ylabel('销售额')plt.grid(True)plt.show()# 绘制柱状图plt.figure(figsize=(10, 6))plt.bar(monthly_sales.index, monthly_sales.values, color='skyblue')plt.title('月销售额柱状图')plt.xlabel('月份')plt.ylabel('销售额')plt.show()# 使用示例
plot_sales_trends('cleaned_data.csv')

输出

两张图表分别展示了月销售额的折线趋势和柱状比较。

seaborn数据可视化示例

以下示例展示了如何使用seaborn绘制热力图和箱线图。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pddef visualize_data(csv_file):# 导入数据df = pd.read_csv(csv_file)# 计算相关性矩阵corr_matrix = df.corr()# 绘制热力图plt.figure(figsize=(8, 6))sns.heatmap(corr_matrix, annot=True, cmap='coolwarm')plt.title('特征相关性热力图')plt.show()# 绘制箱线图plt.figure(figsize=(8, 6))sns.boxplot(x='category', y='total_price', data=df)plt.title('各类别销售额分布箱线图')plt.xlabel('类别')plt.ylabel('总销售额')plt.show()# 使用示例
visualize_data('cleaned_data.csv')

输出

两张图表分别展示了数据特征的相关性热力图和各类别销售额的分布箱线图。

处理大型数据集示例

以下示例展示了如何使用Dask处理大型CSV文件,并进行分组聚合分析。

import dask.dataframe as dddef process_large_data(csv_file):# 使用Dask读取大型CSV文件ddf = dd.read_csv(csv_file)# 处理缺失值ddf = ddf.dropna()# 添加总价列ddf['total_price'] = ddf['quantity'] * ddf['price']# 按类别分组并计算总销售额sales_summary = ddf.groupby('category')['total_price'].sum().compute()print("按类别分组的总销售额:")print(sales_summary)# 使用示例
process_large_data('large_sales_data.csv')

输出(假设large_sales_data.csv内容如下):

按类别分组的总销售额:
category
A    150000.0
B     80000.0
C    120000.0
Name: total_price, dtype: float64

常见问题及解决方法

问题1:如何处理pandas中的缺失数据?

原因:缺失数据可能会影响数据分析的准确性和结果。

解决方法

  1. 检测缺失数据

    • 使用isnull()isna()方法检测缺失值。
    • 使用info()方法查看数据概况。
  2. 处理缺失数据

    • 删除缺失值:使用dropna()方法删除包含缺失值的行或列。
    • 填充缺失值:使用fillna()方法填充缺失值,可以选择特定值、均值、中位数或前后值等。

示例

import pandas as pd# 创建示例DataFrame
data = {'A': [1, 2, None, 4],'B': [5, None, 7, 8],'C': [9, 10, 11, None]}
df = pd.DataFrame(data)# 检测缺失值
print(df.isnull().sum())# 删除包含任何缺失值的行
df_dropped = df.dropna()
print(df_dropped)# 用列的均值填充缺失值
df_filled = df.fillna(df.mean())
print(df_filled)

输出

A    1
B    1
C    1
dtype: int64A    B     C
0  1.0  5.0   9.0A    B     C
0  1.0  5.0   9.0
1  2.0  6.0  10.0
2  2.333333  7.0  11.0
3  4.0  8.0  10.0

问题2:matplotlibseaborn的选择标准是什么?

原因matplotlibseaborn都是强大的数据可视化工具,选择合适的库可以提高工作效率和图表质量。

解决方法

  1. 自定义需求

    • 如果需要高度自定义的图表,适合使用matplotlib
    • 如果需要快速生成美观的统计图表,适合使用seaborn
  2. 统计可视化

    • seaborn内置了许多统计图表,如箱线图、小提琴图、热力图等,适合用于统计数据的可视化。
  3. 复杂图表

    • 对于复杂的多层次图表,matplotlib提供了更灵活的控制。
  4. 集成使用

    • 可以结合使用matplotlibseaborn,先用seaborn绘制基础图表,再使用matplotlib进行进一步的自定义。

示例

import matplotlib.pyplot as plt
import seaborn as sns# 使用seaborn绘制箱线图
sns.boxplot(x='category', y='total_price', data=df)
plt.title('各类别销售额分布')
plt.show()# 使用matplotlib进行进一步自定义
plt.figure(figsize=(10, 6))
sns.boxplot(x='category', y='total_price', data=df)
plt.title('各类别销售额分布')
plt.xlabel('类别')
plt.ylabel('总销售额')
plt.grid(True)
plt.show()

问题3:如何提升pandas处理大型数据集的效率?

原因:当数据集非常大时,pandas的内存占用和处理速度可能成为瓶颈。

解决方法

  1. 优化数据类型

    • 使用更小的数据类型,如int8float32,减少内存使用。
  2. 分块读取数据

    • 使用chunksize参数分块读取大文件,逐块处理数据。
    import pandas as pdchunksize = 10 ** 6
    for chunk in pd.read_csv('large_data.csv', chunksize=chunksize):process(chunk)
    
  3. 使用并行计算库

    • 使用DaskModin等库,利用多核处理器加速数据处理。
  4. 减少内存复制

    • 尽量避免不必要的数据复制,使用inplace=True参数进行原地操作。
  5. 向量化操作

    • 利用pandasnumpy的向量化功能,避免使用循环。

示例

import pandas as pd# 优化数据类型
df = pd.read_csv('large_data.csv', dtype={'age': 'int8', 'gender': 'category'})# 分块处理
chunksize = 500000
total = 0
for chunk in pd.read_csv('large_data.csv', chunksize=chunksize):total += chunk['quantity'].sum()
print(f"总数量: {total}")

问题4:在数据可视化中如何选择合适的图表类型?

原因:不同的图表类型适用于不同的数据和分析目的,选择合适的图表能够更有效地传达信息。

解决方法

  1. 了解数据类型和关系

    • 分类数据、数值数据、时间序列数据等需要不同的图表类型。
  2. 确定可视化目的

    • 比较、分布、关系、组成等不同的可视化目的对应不同的图表。
  3. 选择合适的图表

    可视化目的图表类型
    比较柱状图、条形图、折线图
    分布直方图、箱线图、小提琴图
    关系散点图、气泡图、热力图
    组成饼图、堆叠柱状图、面积图
  4. 考虑图表的可读性和美观性

    • 避免过度复杂的图表,保持清晰和简洁。

示例

  • 比较:使用柱状图比较不同类别的销售额。
  • 分布:使用箱线图展示销售额的分布情况。
  • 关系:使用散点图分析销售数量与价格的关系。
  • 组成:使用饼图展示各类别在总销售额中的比例。

总结

在本篇文章中,我们深入探讨了数据分析与处理的核心内容,重点介绍了如何使用pandas进行数据清洗与分析,掌握了matplotlibseaborn进行数据可视化的方法,并学习了处理大型数据集的优化技巧。通过丰富的代码示例和实战案例,您已经具备了进行高效数据分析和处理的基本能力。

学习建议

  1. 实践项目:尝试在实际项目中应用所学的pandas和可视化工具,如数据报告、商业分析或科学研究。
  2. 深入学习pandas:探索pandas的高级功能,如时间序列分析、合并复杂数据集等,提升数据处理能力。
  3. 掌握高级可视化技术:学习使用seaborn的高级功能和matplotlib的自定义技巧,创建更具表现力的图表。
  4. 处理更大规模的数据:通过学习DaskModin等工具,提升处理大型数据集的能力。
  5. 学习统计与机器学习基础:结合数据分析,学习统计学和机器学习的基本概念和方法,扩展分析深度。
  6. 参与数据科学社区:加入数据科学相关的社区和论坛,分享经验,学习他人的最佳实践。
  7. 阅读相关书籍和文档:如《Python for Data Analysis》、《Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow》,系统性地提升数据分析与处理能力。

接下来的系列文章将继续深入探讨Python的机器学习与人工智能,帮助您进一步掌握Python在智能应用中的核心概念和技术。保持学习的热情,持续实践,您将逐步成为一名优秀的数据科学家!


如果您有任何问题或需要进一步的帮助,请随时在评论区留言或联系相关技术社区。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/893608.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

20250124-注意力机制(5-7)【3/3完结】 ——已复现

Attention Is All You Need(注意力就是你所需要的一切)(5-7)【3/3完结】 ——已复现 20250124-注意力机制(1-2)【1/3】 ——已复现-CSDN博客 20250124-注意力机制(3-4)【2/3】 ——已…

22_解析XML配置文件_List列表

解析XML文件 需要先 1.【加载XML文件】 而 【加载XML】文件有两种方式 【第一种 —— 使用Unity资源系统加载文件】 TextAsset xml Resources.Load<TextAsset>(filePath); XmlDocument doc new XmlDocument(); doc.LoadXml(xml.text); 【第二种 —— 在C#文件IO…

[JavaScript] ES6及以后版本的新特性

文章目录 箭头函数&#xff08;Arrow Functions&#xff09;为什么需要箭头函数&#xff1f;箭头函数的完整语法箭头函数中的 this实用场景 解构赋值&#xff08;Destructuring Assignment&#xff09;为什么需要解构赋值&#xff1f;数组解构赋值的完整用法对象解构赋值的完整…

C语言进阶——3字符函数和字符串函数(2)

8 strsrt char * strstr ( const char *str1, const char * str2);查找子字符串 返回指向 str1 中第一次出现的 str2 的指针&#xff0c;如果 str2 不是 str1 的一部分&#xff0c;则返回 null 指针。匹配过程不包括终止 null 字符&#xff0c;但会在此处停止。 8.1 库函数s…

ThinkPHP 8请求处理-获取请求对象与请求上下文

【图书介绍】《ThinkPHP 8高效构建Web应用》-CSDN博客 《2025新书 ThinkPHP 8高效构建Web应用 编程与应用开发丛书 夏磊 清华大学出版社教材书籍 9787302678236 ThinkPHP 8高效构建Web应用》【摘要 书评 试读】- 京东图书 使用Composer初始化ThinkPHP 8应用_thinkphp8 compos…

飞行器半实物联合仿真:技术解析与应用实践

1.背景介绍 当前&#xff0c;飞行器已成为大国博弈复杂场景中的重要角色&#xff0c;其技术经过多次实践不断发展&#xff0c;性能持续提升&#xff0c;整体效能显著增强。随着计算机技术和系统仿真技术的发展&#xff0c;利用计算机模拟和仿真构造一个虚拟飞行器的飞行控制系…

c#配置config文件

1&#xff0c;引用命名空间 Configuration 及配置信息

【机器学习】机器学习引领数学难题攻克:迈向未知数学领域的新突破

我的个人主页 我的领域&#xff1a;人工智能篇&#xff0c;希望能帮助到大家&#xff01;&#xff01;&#xff01;&#x1f44d;点赞 收藏❤ 一、引言 在数学的浩瀚领域中&#xff0c;存在着诸多长期未解的难题&#xff0c;这些难题犹如高耸的山峰&#xff0c;吸引着无数数…

OS Copilot功能测评:智能助手的炫彩魔法

简介&#xff1a; OS Copilot 是一款融合了人工智能技术的智能助手&#xff0c;专为Linux系统设计&#xff0c;旨在提升系统管理和运维效率。本文详细介绍了在阿里云ECS实例上安装和体验OS Copilot的过程&#xff0c;重点评测了其三个核心参数&#xff1a;-t&#xff08;模式…

计算机网络 (55)流失存储音频/视频

一、定义与特点 定义&#xff1a;流式存储音频/视频是指经过压缩并存储在服务器上的多媒体文件&#xff0c;客户端可以通过互联网边下载边播放这些文件&#xff0c;也称为音频/视频点播。 特点&#xff1a; 边下载边播放&#xff1a;用户无需等待整个文件下载完成即可开始播放…

Oracle存储过程语法详解

简介 存储过程是一系列SQL语句的集合&#xff0c;可以封装复杂的逻辑&#xff0c;实现特定的功能&#xff0c;可以提高执行速度和代码的复用性&#xff0c;预先编译后存储在数据库中&#xff0c;可以通过指定存储过程的名称对其进行调用。 本文主要讲解Oracle存储过程语法&am…

推箱子游戏

java小游戏2 一游戏介绍 二图像准备 墙、箱子、人、箱子目的地&#xff0c;人左边、人右边、人上边、人下边 三结构准备 地图是什么&#xff0c;我们把地图想象成一个网格&#xff0c;每个格子就是工人每次移动的步长&#xff0c;也是箱子移动的距离&#xff0c;设置一个二维数…

如何分辨ddos攻击和cc攻击?

DDoS&#xff08;分布式拒绝服务&#xff09;攻击和 CC&#xff08;Challenge Collapsar&#xff09;攻击都属于网络攻击手段&#xff0c;主要通过消耗目标服务器资源使其无法正常提供服务&#xff0c;但它们在攻击原理、攻击特征等方面存在区别&#xff1a; 攻击原理 DDoS 攻…

期权帮|如何利用股指期货进行对冲套利?

锦鲤三三每日分享期权知识&#xff0c;帮助期权新手及时有效地掌握即市趋势与新资讯&#xff01; 如何利用股指期货进行对冲套利&#xff1f; 对冲就是通过股指期货来平衡投资组合的风险。它分为正向与反向两种策略&#xff1a; &#xff08;1&#xff09;正向对冲&#xff…

软件质量与测试报告5-压力测试 JMeter 与 Badboy

A&#xff0e;百度搜索引擎压力测试 通过在Badboy下执行如下的测试场景来生成压力测试的脚本&#xff1a; a) 在Badboy的地址栏里面输入www.baidu.com&#xff0c;回车&#xff1b; b) 在右下区域打开的百度的主页上输入搜索关键字JMeter&#xff0c;回车&#xff1b; c) 在…

Mybatis多条件查询:Map传参与对象传参解析

Mybatis 多条件查询常见且关键&#xff0c;本文探讨两种方法——Map 传参和 Java Bean 对象传参&#xff0c;展示用法及区别&#xff0c;总结应用场景和优缺点。 1. Map传参方式 原理&#xff1a;Mybatis允许我们通过一个Map对象来传递动态SQL中的参数。Map的键对应于SQL语句中…

wangEditor富文本编辑器,Laravel上传图片配置和使用

文章目录 前言步骤1. 构造好前端模版2. 搭建后端存储3. 调试 前言 由于最近写项目需要使用富文本编辑器&#xff0c;使用的是VUE3.0版本所以很多不兼容&#xff0c;实际测试以后推荐使用wangEditor 步骤 构造好前端模版搭建后端存储调试 1. 构造好前端模版 安装模版 模版安…

three.js+WebGL踩坑经验合集(2):3D场景被相机裁切后,被裁切的部分依然可以被鼠标碰撞检测得到(射线检测)

three.js内置了Raycaster类实现鼠标的碰撞检测&#xff0c;用它可以实现3D物体的鼠标点击&#xff0c;移入移出&#xff0c;触屏检测一类的业务功能。 该功能虽然强大&#xff0c;但同事们普遍反映不是那么好用&#xff0c;因为它不像其它配套了可视编辑的3D引擎一样&#xff…

Spring Boot spring.factories文件详细说明

优质博文&#xff1a;IT-BLOG-CN 前言&#xff1a;经常看到 spring.factories 文件&#xff0c;却没有对它进行深入的了解和分析&#xff0c;今天我们就一起揭开面纱看看它的内在。 spring.factories 文件是 Spring Boot 自动配置机制的核心部分之一。它位于每个 Spring Boo…

从前端视角看设计模式之行为型模式篇

上篇我们介绍了 设计模式之结构型模式篇&#xff0c;接下来介绍设计模式之行为型模式篇 责任链模式 责任链模式允许将请求沿着一条链传递&#xff0c;直到有一个对象处理它为止。每个处理者都有机会处理该请求&#xff0c;或者将其传递给链中的下一个处理者&#xff0c;每个处…