(word完整版)windows下非submit-方式运行spark-on-yarn(CDH集群).doc 立即下载
2024-09-09
约6.6千字
约20页
0
1.5MB
举报 版权申诉
预览加载中,请您耐心等待几秒...

(word完整版)windows下非submit-方式运行spark-on-yarn(CDH集群).doc

(word完整版)windows下非submit-方式运行spark-on-yarn(CDH集群).doc

预览

免费试读已结束,剩余 15 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(word完整版)windows下非submit方式运行sparkonyarn(CDH集群)
(word完整版)windows下非submit方式运行sparkonyarn(CDH集群)
(word完整版)windows下非submit方式运行sparkonyarn(CDH集群)
windows下运行sparkonyarn(非submit方式)
本地环境
本地操作系统:windows10.1709教育版
本地hadoop版本:hadoop-2。6。5
本地winutils版本:hadoop2。6.4-2。6。7
本地spark版本:spark—2.2.0—bin-hadoop2.6
本地scala版本:scala-2。11。11
本地java版本:jdk-1.8。0_151
本地IDEA版本:idea2017。01

远端环境
集群操作系统:ubuntu-14。04-server版
集群hadoop版本:cloudera—cdh—5.13.0
集群spark版本:SPARK2-2。2。0.cloudera1—1.cdh5.12.0。p0。142354
集群scala版本:clouderacdh5。13自带spark1。6(scala运行环境scala-2.9。2)spark2.2默认是用scala—2.11.8编译
集群java版本:jdk-1。8。0_151

资源下载地址
hadoop—2。6。5
HYPERLINK"http://mirrors。tuna.tsinghua。edu。cn/apache/hadoop/common/hadoop—2.6.5/hadoop-2。6.5。tar。gz"http://mirrors.tuna.tsinghua。edu.cn/apache/hadoop/common/hadoop-2。6。5/hadoop—2。6。5.tar.gz
spark—2.2。0
HYPERLINK"http://mirrors。tuna。tsinghua.edu。cn/apache/spark/spark—2。2.0/spark—2.2.0-bin—hadoop2。7。tgz”http://mirrors.tuna.tsinghua。edu。cn/apache/spark/spark-2.2。0/spark—2.2。0—bin-hadoop2。6.tgz
scala—2.11.11
https://downloads。lightbend.com/scala/2.11。11/scala—2.11。11.msi
winutils
HYPERLINK"https://github。com/steveloughran/winutils"https://github。com/steveloughran/winutils
java
HYPERLINK"http://www.oracle。com/technetwork/java/javase/downloads/jdk8—downloads-2133151。html"http://www。oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151。html


spark2-csd
http://archive.cloudera。com/spark2/csd/SPARK2_ON_YARN—2。2。0。cloudera1.jar
安装步骤
cdh5.13安装
该安装步骤不是本文重点,详细方法见文档ubuntu14.04搭建clouderaCDH。docx

idea安装
该安装步骤自行百度即可
cdh中安装spark2。2.0
由于cdh集成的spark依然是spark1。6,需要在集群中添加csd,然后安装spark2
将csd文件下载并放到clouderamanager节点的/opt/cloudera/csd/目录下

此处需要将SPARK2_ON_YARN-2.2。0。cloudera1.jar的用户的组修改为cloudera—scm:cloudera-scm
2。重启cloudera-scm—server服务
servicecloudera-scm—serverrestart
在clouderamanager的主机->parcel下


可找到spark2分配激活,并在集群中添加服务即可
配置系统环境变量
安装好scala和java后,分别配置JAVA_HOME和SCALA_HOME
同样,下载好hadoop和spark后配置SPARK_HOME和HADOOP_HOME。
并在path变量中添加%JAVA_HOME%\bin%SCALA_HOME%\bin%HADO
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

(word完整版)windows下非submit-方式运行spark-on-yarn(CDH集群)

文档大小:1.5MB

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用