RDD(Resilient Distributed Dataset) ? ์ธ๋ฉ๋ชจ๋ฆฌ ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐฉ์์ ํ๊ธฐ ์ํ ๋ฐ์ดํฐ ๋ชจ๋ธ ์ต์ด์ Disk์์ ๋ฐ์ดํฐ๋ฅผ ์ฝ์ด์จ ๋ค, ๋ฐ์ดํฐ์ ๋ํ ์ฌ๋ฌ ๋ฒ์ ๋ฉ๋ชจ๋ฆฌ์์ ์ฐ์ฐ(operation)์ ์ํํ๋๋ก ์ฐ์ฐ ํจ์ ์ ๊ณต RDD ํน์ฑ In-memory Computation RDD์์ ์ ๊ณตํ๋ operation์ ์ฐ์ฐ์ ์ค๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๋์คํฌ์ ์ ์ฅํ์ง ์๊ณ , ๋ฉ๋ชจ๋ฆฌ์์ ์์ฃผ์ํด Transformations : RDD์์ ๋ค๋ฅธ RDD๋ฅผ ๋ง๋๋ ๋ณํ ์ฐ์ฐ Actions : RDD์ ์ต์ข ์ฐ์ฐ์ผ๋ก RDD์์ RDD๊ฐ ์๋ data๋ก ์ ์ฅ Immutable RDD๋ ํ ๋ฒ ๋ง๋ค์ด์ง๋ฉด ๋ด์ฉ ๋ณํ์ด ํ์ฉ๋์ง ์์ Lineage RDD์ transformation์ผ๋ก ๋ฐ์ํ๋ ๋ชจ๋ RDD..