2014年に最初の Spark がリリースされた頃と比べると、Spark は大きな成長を遂げました。企業における採用ペースやコントリビューション数を見ても前代未聞と言ってもよく、これが急速な成長を支えています。反面、開発者が Spark の変化やベストプラクティスについていくのが難しくなってきています。このトークでは、DataSet (DataFrame, RDD と比較していつ使えばいいのか?) など比較的新しい機能や Spark 2.0 での改善点を中心に紹介します。
票中 票投票済み