[PYTHON] Apache Spark Starter Kits
Ziel
Diejenigen, die nicht wissen, wo sie anfangen sollen, Apache Spark zu machen.
Hier sind einige Links zu Apache Spark. Ich spreche hauptsächlich Englisch. Der Edx-Kurs wird dringend empfohlen. Es ist sehr einfach zu verstehen, da es im Video erklärt wird und Sie lernen, indem Sie den Code tatsächlich in Python schreiben.
Ich werde Sie auf dem Laufenden halten! Bitte kommentieren Sie, wenn Sie andere gute Ressourcen haben.
Urheber
- http://spark.apache.org/
- Quick start
- https://spark.apache.org/docs/latest/quick-start.html
Overview
- Stanford CS347
- http://www.cs.berkeley.edu/~rxin/talks/2015-05-18_cs347-stanford.pdf
Compile and Run Example
- http://qiita.com/giwa/items/d701ad1f9bda42654093
Dieser Beitrag ist 1.4, sollte aber für 1.5 gleich sein.
Edx
Introduction to Big Data with Apache Spark
https://www.edx.org/course/introduction-big-data-apache-spark-uc-berkeleyx-cs100-1x
Scalable Machine Learning
https://www.edx.org/course/scalable-machine-learning-uc-berkeleyx-cs190-1x
Bigdata university
- http://bigdatauniversity.com/bdu-wp/bdu-course/spark-fundamentals/
- http://bigdatauniversity.com/bdu-wp/bdu-course/spark-fundamentals-ii/
Papers
- RDD
- http://people.csail.mit.edu/matei/papers/2012/nsdi_spark.pdf
- Shark(Spark SQL)
- http://people.csail.mit.edu/matei/papers/2013/sigmod_shark.pdf
- Spark (1.4) profile
- https://www.usenix.org/system/files/conference/nsdi15/nsdi15-paper-ousterhout.pdf
- Spark streaming
- http://people.csail.mit.edu/matei/papers/2012/hotcloud_spark_streaming.pdf
- http://people.csail.mit.edu/matei/papers/2013/sosp_spark_streaming.pdf
Slide-Anteil japanischer Unternehmen (NTT-Leute sind viel.
- http://www.slideshare.net/hadoopxnttdata/apache-spark
- http://www.slideshare.net/hadoopxnttdata/apache-spark-spark
- http://www.slideshare.net/hadoopxnttdata/hadoop-14006572
- http://www.slideshare.net/hadoopxnttdata/hadoop-ecosystem-nttdata-osc15tk
- http://www.slideshare.net/hadoopxnttdata/hadoopsiliconvalleytechbusinessmeetup
- http://www.slideshare.net/taroleo/spark-internal-hadoop-source-code-reading-16-in-japan
Books
- Learning Spark
- http://shop.oreilly.com/product/0636920028512.do
- Advanced Analytics with Spark
- http://shop.oreilly.com/product/0636920035091.do
- Spark in Action (in progress)
- https://www.manning.com/books/spark-in-action
- Einführung in Apache Spark Das neueste Framework für parallele verteilte Verarbeitung, das Sie durch Umzug lernen können (veröffentlicht am 20. Oktober 2015 von NTT DATA).
- http://www.amazon.co.jp/Apache-Spark%E5%85%A5%E9%96%80-%E5%8B%95%E3%81%8B%E3%81%97%E3%81%A6%E5%AD%A6%E3%81%B6%E6%9C%80%E6%96%B0%E4%B8%A6%E5%88%97%E5%88%86%E6%95%A3%E5%87%A6%E7%90%86%E3%83%95%E3%83%AC%E3%83%BC%E3%83%A0%E3%83%AF%E3%83%BC%E3%82%AF-NEXT-ONE-%E6%A0%AA%E5%BC%8F%E4%BC%9A%E7%A4%BENTT%E3%83%87%E3%83%BC%E3%82%BF/dp/4798142662/ref=pd_rhf_ee_s_cp_30?ie=UTF8&refRID=18NG6YKBRET078VK7FRK
Wenn Sie danach suchen, werden Sie verschiedene Dinge finden, aber was ist damit? Folgendes habe ich noch nicht gelesen.
-
Spark cookbook
- https://www.packtpub.com/big-data-and-business-intelligence/spark-cookbook
-
Fast dataprocessing with Spark
- https://www.packtpub.com/big-data-and-business-intelligence/fast-data-processing-spark-second-edition
-
Machine Learning with Spark
- https://www.packtpub.com/big-data-and-business-intelligence/machine-learning-spark
-
Apache Spark Graph processing
- https://www.packtpub.com/big-data-and-business-intelligence/apache-spark-graph-processing
-
Mastering Apache Spark
- https://www.packtpub.com/big-data-and-business-intelligence/mastering-apache-spark
Spark summit
- https://spark-summit.org/2013/
- https://spark-summit.org/2014/
- https://spark-summit.org/2015/
- https://spark-summit.org/east-2015/
- https://spark-summit.org/the-spark-spot/
Others
- AMP Lab, where spark was invented
- https://amplab.cs.berkeley.edu/
- Reynold personal page (Spark PMC)
- http://www.cs.berkeley.edu/~rxin/
- Matei Zaharia personal page (Spark inventor, PMC, CEO of Databricks and Associate Professor in MIT)
- http://people.csail.mit.edu/matei/
- MLbase, base of Spark MLlib
- http://mlbase.org/
Meetup in Japan
- http://connpass.com/event/8465/
- http://cloudera.connpass.com/event/18857/
- http://www.meetup.com/Tokyo-Spark-Meetup/
E-Mail festschreiben (Danke an kou, dass du es gemacht hast.
- http://www.commit-email.info
Da die Unterschiede farbig sind, ist sie leichter zu erkennen als die ursprüngliche Festschreibungs-E-Mail. Sie können unten abonnieren.
To: [email protected]
Cc: [email protected]
Subject: Subscribe
--
subscribe
Melden Sie hier alle JIRA-Fehler
- https://issues.apache.org/jira/browse/spark
Diejenigen, die einen Beitrag leisten wollen
- https://cwiki.apache.org/confluence/display/SPARK/Contributing+to+Spark
- http://www.slideshare.net/hadoopxnttdata/apache-spark-commnity-nttdata-sarutak