๋น…๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ
1 ๊ฐœ์˜ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

๋น…๋ฐ์ดํ„ฐ์˜ ๋ถ„์‚ฐ์ฒ˜๋ฆฌ ํ”„๋ ˆ์ž„ ์›Œํฌ | presto | hive

๋น…๋ฐ์ดํ„ฐ์˜ ๋ถ„์‚ฐ์ฒ˜๋ฆฌ ๋Œ€๊ทœ๋ชจ ๋ถ„์‚ฐ ์ฒ˜๋ฆฌ์˜ ํ”„๋ ˆ์ž„ ์›Œํฌ ๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ์™€ ๋น„๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ ๋น„์ •ํ˜•ํ™”๋œ ๋ฐ์ดํ„ฐ๋Š” SQL๋กœ ์ œ๋Œ€๋กœ ์ง‘๊ณ„ํ•  ์ˆ˜ ์—†๋‹ค. NoSQL ๋ฐ์ดํ„ฐ ๋ฒ ์ด์Šค๊ฐ€ ์ด๋Ÿฌํ•œ ์Šคํ‚ค๋งˆ๋ฆฌ์Šค ๋ฐ์ดํ„ฐ์— ๋Œ€์‘ํ•˜๊ณ  ์žˆ๋‹ค. ๋‹ค์–‘ํ•œ ํ˜•ํƒœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์šฐ์„  ๋ฐ์ดํ„ฐ ๋ ˆ์ดํฌ์— ์ €์žฅํ•œ ํ›„, ๋ถ„์„ํ•˜๊ธฐ ์šฉ์ดํ•˜๊ฒŒ ๋ถ„์‚ฐ์Šคํ† ๋ฆฌ์ง€์— ์˜ฎ๊ธฐ๋Š” ํŒŒ์ดํ”„๋ผ์ธ์ด ํ•„์š”ํ•˜๋‹ค. ํ•˜๋‘ก์˜ ์—ด์ง€ํ–ฅ ์Šคํ† ๋ฆฌ์ง€ Apache ORC ๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ๋ฅผ ์œ„ํ•œ ์—ด์ง€ํ–ฅ ์Šคํ† ๋ฆฌ์ง€๋กœ ์ฒ˜์Œ์— ์Šคํ‚ค๋งˆ๋ฅผ ์ •ํ•œ ํ›„ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•œ๋‹ค. Apache Parquet ์Šคํ‚ค๋งˆ๋ฆฌ์Šค์— ๊ฐ€๊นŒ์šด ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ๋กœ ๋˜์–ด์ž‡์–ด json๊ฐ™์€ ๋ฐ์ดํ„ฐ๋„ ๊ทธ๋Œ€๋กœ ์ €์žฅํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด ๋•Œ ๋น„ ๊ตฌ์กฐํ™” ๋ฐ์ดํ„ฐ๋„ ์—ด์ง€ํ–ฅ ์Šคํ† ๋ฆฌ์ง€๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ณผ์ •์„ ๊ฑฐ์ณ์•ผ ํ•˜๋Š”๋ฐ, ์‚ฌ์šฉ๋˜๋Š” ๊ฒƒ์ด Hadoop๊ณผ Spark ๋‹ค. Hadoop ๋ถ„์‚ฐ ๋ฐ..