【源码寿命】【hystrix线程池源码】【ai代码源码计划】spark on yarn 源码-皮皮网

【源码寿命】【hystrix线程池源码】【ai代码源码计划】spark on yarn 源码

2024-12-23 03:10:11 来源：企业信使源码分类：百科

1.在windows中spark的本地模式如何配置
2.Spark on Yarn ä¸ºä»ä¹åºç°ååè¶çcontainerè¢«kill

spark on yarn 源码

在windows中spark的本地模式如何配置

1、在Spark中采用本地模式启动pyspark的命令主要包含以下参数：master：这个参数表示当前的pyspark要连接到哪个master，如果是local[*]，就是源码寿命使用本地模式启动pyspark，其中，中括号内的hystrix线程池源码星号表示需要使用几个CPU核心(core)。

2、肯定第一步是配置spark环境：包括linux系统的安装，java，ssh，Hadoop，Scala，spark的ai代码源码计划安装与环境变量设置。虽说简单，但对于初学者说，尤其是西瓜视频带源码没有使用过linux系统的，还是有些挑战。其中遗漏一些细节问题，都会出错。竞彩手机源码

3、SparkonYarn模式备注：Yarn的连接信息在Hadoop客户端的配置文件中指定。通过spark-env.sh中的环境变量HADOOPCONFDIR指定Hadoop配置文件路径。

4、最后的PhysicalPlanexecution阶段用Spark代替HadoopMapReduce。通过配置Shark参数，Shark可以自动在内存中缓存特定的RDD，实现数据重用，进而加快特定数据集的检索。

Spark on Yarn ä¸ºä»ä¹åºç°ååè¶çcontainerè¢«kill

ä¸ä¸ªExecutorå¯¹åºä¸ä¸ªJVMè¿ç¨ã ä»Sparkçè§åº¦çï¼Executorå ç¨çåååä¸ºä¸¤é¨åï¼ ExecutorMemory å MemoryOverhead ãå¶ä¸ï¼ ExecutorMemory ä¸ºJVMè¿ç¨çJavaå åºåï¼ MemoryOverhead ä¸ºJVMè¿ç¨ä¸é¤Javaå ä»¥å¤å ç¨çç©ºé´å¤§å°ï¼åæ¬æ¹æ³åºï¼æ°¸ä¹ä»£ï¼ãJavaèææºæ ãæ¬å°æ¹æ³æ ãJVMè¿ç¨æ¬èº«æç¨çååãå å¤ååï¼Direct Memoryï¼çã

spark.driver.memory å spark.executor.memory åå«è®¾ç½®SparkçDriveråExecutorç ExecutorMemory .

spark.yarn.executor.memoryOverhead å spark.yarn.driver.memoryOverhead åå«è®¾ç½®SparkçDriveråExecutorç MemoryOverhead .

å¦å¤ï¼Sparkä¼å¤§éåéå å¤ååï¼å å¤ååé»è®¤æå¤§å¯ä»¥å ExecutorMemory ä¸æ ·ï¼å¯ä»¥éè¿javaOptionsä½¿ç¨ MaxDirectMemorySize éç½®æå¤§å¼ã

å å¤ååæå¤§å¯ä»¥å ExecutorMemory ä¸æ ·ï¼ä½æ¯å å¤åååå MemoryOverhead éå¶ï¼æä»¥å½ MaxDirectMemorySize , ExecutorMemory å MemoryOverhead è®¾ç½®ä¸åçæ¶ï¼ä¼åºç°containerååè¶éï¼è¢«Yarn killçæåµã

æ¯å¦ï¼ ExecutorMemory ä¸º8Gï¼ MemoryOverhead ä¸º4Gï¼ MaxDirectMemorySize æ²¡æè®¾ç½®ï¼æ¤æ¶yarnè®¤ä¸ºä¸ä¸ªcontaineræå¤§å¯ä»¥ä½¿ç¨Gååï¼ä½æ¯å å¤ååæå¤§å¯ä»¥ä½¿ç¨8Gï¼å¯¼è´containeræå¤§å¯ä»¥ä½¿ç¨è¶è¿Gåå(å ååå+ å å¤åå)ï¼æ¯Gå¤§ï¼ æç»è¢«Yarn killæã

åççè®¾ç½®è§åä¸º: ExecutorMemory + MemoryOverhead > ExecutorMemory + MaxDirectMemorySize

æä»¥ï¼Sparkåºç¨å ç¨éç¾¤ååçæ»å¤§å°ä¸º:

åæ°è°ä¼å»ºè®®ï¼

æ¯ä¸ªExecutorè¿ç¨çååè®¾ç½®4G~8Gè¾ä¸ºåéã

æ¯ä¸ªExecutorçCPU coreæ°éè®¾ç½®ä¸º2~4ä¸ªè¾ä¸ºåéã

ä»¥ä¸æ¯é¨åå»ºè®®çåæ°è®¾ç½®:

【源码寿命】【hystrix线程池源码】【ai代码源码计划】spark on yarn 源码

热点文章

重点关注