在Cloudera Hadoop中使用SparkR[译]

原文转载自 「BIHell」 ( http://www.bihell.com/article/328 ) By None

预计阅读时间 0 分钟(共 0 个字, 0 张图片, 0 个链接)

部门新入职一位精通R语言的小伙伴,会用到SparkR,但是默认情况下Cloudera Hadoop 是不支持SparkR的。本来打算编译CDH官方的Spark源码然后替换掉自带版本,但总感觉会给自己挖坑,因此决定另外安装一个Spark环境连接Yarn执行SparkR程序,本文是对How to use SparkR in Cloudera Hadoop一文的翻译,并加入了一些自己的内容。

<!-

more_vert