Scala and Spark for Big Data and Machine Learning

src:
https://bitbucket.org/matematika/scala-and-spark-for-big-data-and-machine-learning.git

$ cd Spark_Dataframes

$ spark-shell
scala> :load DataFrame_Overview.scala

scala> :load DataFrame_Operations.scala

scala> :load GroupBy_and_Agg.scala

scala> :load MissingData.scala

scala> :load Dates_and_Timestamps.scala

scala> :load DataFrame_Project_Solution.scala

$ cd Machine_Learning_Sections/Regression/

scala> :load LinRegDocExample.scala

scala> :load LinRegWalkthrough.scala

scala> :load LinRegExerciseSolution.scala

Classification with Spark

$ cd Machine_Learning_Sections/Classification/

scala> :load Doc_LogReg.scala

scala> :load LogRegExample.scala

scala> :load LogRegProject_Solutions.scala

$ cd Model_Validation/

scala> :load DocModelEvalEx.scala

scala> :load TrainTestandGrids.scala

scala> :load Kmeans_Example.scala

scala> :load Kmeans_Project_Solutions.scala

$ cd PCA/

scala> :load PCA_Doc_Example.scala

scala> :load PCA_Project_Exercise_Solutions.scala

cd /Recommender_Systems/Recommender_Example.scala

Делает в облаке DataBricks.

А сам zeppelin.apache.org очень похож на jupyter notebook.