์นดํ
๊ณ ๋ฆฌ ์์
๋น
๋ฐ์ดํฐ์ ๋ถ์ฐ์ฒ๋ฆฌ ํ๋ ์ ์ํฌ | presto | hive
๋น
๋ฐ์ดํฐ์ ๋ถ์ฐ์ฒ๋ฆฌ ๋๊ท๋ชจ ๋ถ์ฐ ์ฒ๋ฆฌ์ ํ๋ ์ ์ํฌ ๊ตฌ์กฐํ ๋ฐ์ดํฐ์ ๋น๊ตฌ์กฐํ ๋ฐ์ดํฐ ๋น์ ํํ๋ ๋ฐ์ดํฐ๋ SQL๋ก ์ ๋๋ก ์ง๊ณํ ์ ์๋ค. NoSQL ๋ฐ์ดํฐ ๋ฒ ์ด์ค๊ฐ ์ด๋ฌํ ์คํค๋ง๋ฆฌ์ค ๋ฐ์ดํฐ์ ๋์ํ๊ณ ์๋ค. ๋ค์ํ ํํ์ ๋ฐ์ดํฐ๋ฅผ ์ฐ์ ๋ฐ์ดํฐ ๋ ์ดํฌ์ ์ ์ฅํ ํ, ๋ถ์ํ๊ธฐ ์ฉ์ดํ๊ฒ ๋ถ์ฐ์คํ ๋ฆฌ์ง์ ์ฎ๊ธฐ๋ ํ์ดํ๋ผ์ธ์ด ํ์ํ๋ค. ํ๋ก์ ์ด์งํฅ ์คํ ๋ฆฌ์ง Apache ORC ๊ตฌ์กฐํ ๋ฐ์ดํฐ๋ฅผ ์ํ ์ด์งํฅ ์คํ ๋ฆฌ์ง๋ก ์ฒ์์ ์คํค๋ง๋ฅผ ์ ํ ํ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๋ค. Apache Parquet ์คํค๋ง๋ฆฌ์ค์ ๊ฐ๊น์ด ๋ฐ์ดํฐ ๊ตฌ์กฐ๋ก ๋์ด์์ด json๊ฐ์ ๋ฐ์ดํฐ๋ ๊ทธ๋๋ก ์ ์ฅํ ์ ์๋ค. ์ด ๋ ๋น ๊ตฌ์กฐํ ๋ฐ์ดํฐ๋ ์ด์งํฅ ์คํ ๋ฆฌ์ง๋ก ๋ณํํ๋ ๊ณผ์ ์ ๊ฑฐ์ณ์ผ ํ๋๋ฐ, ์ฌ์ฉ๋๋ ๊ฒ์ด Hadoop๊ณผ Spark ๋ค. Hadoop ๋ถ์ฐ ๋ฐ..
2022. 7. 26. 14:54