Spark_spark参数配置优先级

总结：

优先级低-》优先级高

spark-submit 提交的优先级 < scala/java代码中的配置参数 < spark SQL hint

spark submit 中提交参数

#!/usr/bin/env bashsource /home/work/batch_job/product/common/common.sh
spark_version="/home/work/opt/spark"
export SPARK_CONF_DIR=${spark_version}/conf/
spark_shell="/home/opt/spark/spark3-client/bin/spark-shell"
spark_sql="/home/work/opt/spark/spark3-client/bin/spark-sql"
echo ${spark_sql}
echo ${spark_shell}
${spark_shell} --master yarn \--queue test \--name "evelopment_sun-data-new_spark_shell" \--conf "spark.speculation=true" \--conf "spark.network.timeout=400s" \--conf "spark.executor.cores=2" \--conf "spark.executor.memory=4g" \--conf "spark.executor.instances=300" \--conf "spark.driver.maxResultSize=4g" \--conf "spark.sql.shuffle.partitions=800" \--conf "spark.driver.extraJavaOptions=-Dfile.encoding=utf-8" \--conf "spark.executor.extraJavaOptions=-Dfile.encoding=utf-8" \--conf "spark.driver.memory=8g" \--conf "spark.sql.autoBroadcastJoinThreshold=-1" \--conf "spark.sql.turing.pooledHiveClientEnable=false" \--conf "spark.sql.hive.metastore.jars=/home/work/opt/spark/spark3-client/hive_compatibility/*" \--conf "spark.driver.extraClassPath=./__spark_libs__/hive-extensions-2.0.0.0-SNAPSHOT.jar:./hive_jar/parquet-hadoop-bundle-1.6.0.jar:/home/work/opt/spark/spark3-client/hive_compatibility/parquet-hadoop-bundle-1.6.0.jar" \--conf spark.hadoop.mapreduce.fileoutputcommitter.algorithm.version=2 \--conf "spark.sql.legacy.timeParserPolicy=LEGACY" \--conf "spark.sql.storeAssignmentPolicy=LEGACY" \--conf spark.executor.extraJavaOptions="-XX:+UseG1GC" \--jars ./online-spark-1.0-SNAPSHOT.jar

scala/java代码中的配置参数

    val conf = new SparkConf().setAppName(s"production_data-new_UserOverview_${event_day}")val spark = SparkSession.builder().config("spark.debug.maxToStringFields", "500").config(conf).getOrCreate()

SQL hint

SELECT /*+ MERGEJOIN(t2) */ * FROM t1 INNER JOIN t2 ON t1.key = t2.key;

Hints - Spark 3.5.0 hints Documentation

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/182055.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Spark_spark参数配置优先级

spark submit 中提交参数

scala/java代码中的配置参数

SQL hint

相关文章

Linux线程池

利用VHDL实现一定系数范围内的信号分频电路

ANN人工神经网络：从基础认知到现实理解

排序算法基本原理及实现1

JAVAEE---多线程线程安全

c++ day2

23.解释不同方式的自动装配，spring 自动装配 bean 有哪些方式？

量子力学应用：探索科技前沿的奇幻之旅

JS 绘制半径不一致的环形图进度条

一文详解Python中常用数据类型

入门 PyTorch

SpringBoot自动装配和自动配置

你了解vue的diff算法吗？

【蓝桥杯选拔赛真题69】Scratch洗牌发牌少儿编程scratch图形化编程蓝桥杯创意编程选拔赛真题解析

(C++)字符串相乘

【c语言：常用字符串函数与内存函数的使用与实现】

1 NLP分类之：FastText

vue3+vite+ts项目打包时出错

AKConv：具有任意采样形状和任意数目参数的卷积核

【存储】blotdb的原理及实现(2)