Apache Spark 大数据机器学习场景[译](未完待续)

原文转载自 「BIHell」 ( http://www.bihell.com/article/325 ) By None

预计阅读时间 0 分钟(共 0 个字, 0 张图片, 0 个链接)

你想建立机器学习模型,发现你电脑的配置不够的时候,你通常会在群集中使用Apache Spark这样的分布式计算工具处理处理。然而Apache Spark是有本地(standalone mode)模式可以来处理超过你计算机内存的数据。本文会为你展示二元分类器(binary classification model)处理34.6GB的数据。该场景需要你的笔记本拥有4-8G内存,以及50G+的磁盘容量。

原文**[Beginners Guide: Apache Spark M
more_vert