Hadoop ?
๋์ฉ๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ฐ ์ฒ๋ฆฌํ ์ ์๋ JAVA ๊ธฐ๋ฐ์ ์คํ์์ค ํ๋ ์์ํฌ
- ๋ถ์ฐํ์ผ(HDFS)์ ๋ถ์ฐ ์ฒ๋ฆฌ ํ๋ก๊ทธ๋๋ฐ ๋ชจ๋ธ(MapReduce)์ ์ ๊ณต
- ๋ฐ์ดํฐ๋ฅผ ๋ฏธ๋ฆฌ HDFS ํํ๋ก ์๊ฒ ์ชผ๊ฐ์ด ์ ์ฅ์์ผ ๋์ ๋ค, MapReduce๋ฅผ ์ด์ฉํด ๋ถ์ฐ ์ฒ๋ฆฌ
- Hadoop์ ์ด์ฉํ๋ฉด ๋ค์์ ์ปดํจํ ๋ ธ๋๋ฅผ ๋ง์น ํ๋์ ์ปดํจํฐ์์ ์ฌ์ฉํ๋ ๊ฒ์ฒ๋ผ ๋ถ์ฐ์์คํ ์ ์ฌ์ฉ ๊ฐ๋ฅ
- ๋ฐฐ์น ์ฒ๋ฆฌ์ ์ต์ ํ๋์ด ์ค๊ณ๋จ
Hadoop ์ ์ค๊ณ ์ฒ ํ
- Fault tolerance (๊ฒฐํจ ํ์ฉ์ฑ)
- ์์คํ ์ํ ์ค ๊ฒฐํจ์ด ๋ฐ์ํ๋๋ผ๋, ๊ฒฐํจ์ ๊ทน๋ณตํ๊ณ ๊ณ์์ ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋๋ก ์ค๊ณ
- ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ๊ณณ์ ๋ณต์ ํด๋์ ํน์ ๋ ธ๋์ ์์์ด ๋ฐ์ํ๋๋ผ๋ ์์ ์ ๊ณ์์ ์ผ๋ก ์ด์ด๋๊ฐ ์ ์์
- Scalability (ํ์ฅ์ฑ)
- ๋ ธ๋๋ฅผ ํ์ฅํ๋๋ผ๋ ์์คํ ์ ์ฑ๋ฅ์ด ์ ํ์ ์ผ๋ก ์ฆ๊ฐ
- Data Locality (๋ฐ์ดํฐ ์ง์ญ์ฑ)
- ๋ฐ์ดํฐ ์ฐ์ฐ์ ํ๊ธฐ ์ํด ๋ฐ์ดํฐ ์ฐ์ฐ ๋ก์ง์ด ์๋ ๊ณณ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ์ด๋์ํค์ง ์๊ณ , ๋ฐ์ดํฐ๊ฐ ์๋ ๊ณณ์์ ์ฐ์ฐํจ
Hadoop์ ๊ตฌ์กฐ
- Yarn(Yet Another Resource Negotiator) ์ ํ์ฉํ ํ๋ก ํด๋ฌ์คํฐ ๊ด๋ฆฌ
- Yarn ์ ๊ตฌ์ฑ์์
- Resource Manager(RM) : Master์์ ๊ตฌ๋๋๋ฉฐ, ํด๋ฌ์คํฐ์ ์์ ํ ๋น์ ๊ด๋ฆฌ
- Node Manager(NM) : Worker์์ ๊ตฌ๋๋๋ฉฐ, ๊ฐ ๋จ์ผ ๋ ธ๋์ Task ์คํ์ ๋ด๋น
- Application Master(AM) : ํ๋์ ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ด๋ฆฌ
- Container : CPU, ๋ฉ๋ชจ๋ฆฌ, ๋์คํฌ, ๋คํธ์ํฌ ๊ฐ์ ์์คํ ์์์ ์ปจํ ์ด๋ ๋จ์๋ก ํจํค์ง
- Yarn ์ ๊ตฌ์ฑ์์
'software engineering > ๋น ๋ฐ์ดํฐ ์ฒ๋ฆฌ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[BigData] Spark(์คํํฌ) (0) | 2024.01.05 |
---|---|
[BigData] MapReduce(๋งต๋ฆฌ๋์ค) ํ๋ก๊ทธ๋๋ฐ ๋ชจ๋ธ (1) | 2024.01.05 |
[BigData] HDFS (Hadoop File System) (1) | 2024.01.03 |
[BigData] ๋ถ์ฐ ํ์ผ ์์คํ (1) | 2024.01.03 |
[BigData] ๋ถ์ฐ์์คํ ๊ณผ ๋ฆฌ๋ ์ค, ๊ฐ์ํ ๊ธฐ์ (0) | 2024.01.03 |