º»¹®/³»¿ë
1.Áö¿ø µ¿±â
µ¥ÀÌÅÍ ¿£Áö´Ï¾î´Â Çö´ë ±â¾÷ÀÇ µ¥ÀÌÅÍ Á᫐ ÀÇ»ç°áÁ¤°ú Çõ½ÅÀ» À§ÇÑ ÇÙ½É ¿ªÇÒÀ» ´ã´çÇϰí ÀÖ´Ù´Â Á¡¿¡¼ Å« ¸Å·ÂÀ» ´À³§´Ï´Ù. µ¥ÀÌÅÍ´Â ½Ã°£°ú Àå¼Ò¸¦ ÃÊ¿ùÇÏ¿© ÀÇ»ç°áÁ¤À» Áö¿øÇϰí, ±â¾÷ÀÇ ¼ºÀå Àü·«À» ¼ö¸³Çϸç, °í°´ °æÇèÀ» °³¼±ÇÏ´Â µ¥ ÇʼöÀûÀÎ ¿ªÇÒÀ» ÇÕ´Ï´Ù. ÀÌ·¯ÇÑ µ¥ÀÌÅÍÀÇ Á߿伺Àº ³¯·Î Áõ°¡Çϰí ÀÖÀ¸¸ç, À̸¦ È¿°úÀûÀ¸·Î ´Ù·ç±â À§ÇÑ ±â¼ú°ú Àü¹®¼ºÀÌ ÇÊ¿äÇÕ´Ï´Ù. ÀÌ ºÐ¾ß¿¡ ´ëÇÑ ¿Á¤°ú È£±â½ÉÀ» °¡Áö°í ´Ù¾çÇÑ µ¥ÀÌÅÍ È¯°æ°ú µµ±¸µéÀ» ÇнÀÇϰí Àû¿ëÇÏ´Â °úÁ¤¿¡¼ ½ÇÁ¦ ¹®Á¦¸¦ ÇØ°áÇÏ¸ç °¡Ä¡¸¦ âÃâÇÏ´Â °æÇèÀ» ½×¾Ò½À´Ï´Ù. ƯÈ÷ ETL(Extract, Transform, Load) ÇÁ·Î¼¼½º¿Í µ¥ÀÌÅÍ ¸ðµ¨¸µ¿¡ ´ëÇÑ °ü½ÉÀÌ ±í½À´Ï´Ù. µ¥ÀÌÅ͸¦ ¼öÁýÇÏ°í º¯È¯ÇÏ¿© ´Ù¾çÇÑ Çü½ÄÀ¸·Î ÀúÀåÇÏ´Â °úÁ¤¿¡¼ ¹ß»ýÇÒ ¼ö ÀÖ´Â ¹®Á¦¸¦ ÀνÄÇϰí À̸¦ ÇØ°áÇϱâ À§ÇÑ Á¢±Ù ¹æ½ÄÀ» Áö¼ÓÀûÀ¸·Î ¸ð»öÇØ¿Ô½À´Ï´Ù. µ¥ÀÌÅÍ È帧À» ÃÖÀûÈÇϰí, È¿À²ÀûÀÎ µ¥ÀÌÅÍ ÀúÀå ¹× °Ë»öÀ» À§ÇÑ ¸ðµ¨¸µÀ» ÅëÇØ ´õ ³ªÀº ¼º°ú¸¦ ÀÌ·ç´Â µ¥ ±â¿©ÇϰíÀÚ ÇÕ´Ï´Ù. ¶ÇÇÑ ºòµ¥ÀÌÅÍ Ã³¸® ±â¼úÀÎ Hadoop, Spark µîÀ» Ȱ¿ëÇÑ ´ë¿ë·® µ¥ÀÌÅÍ ºÐ¼® °æÇèÀ» ÅëÇØ µ¥ÀÌÅÍ Ã³¸®¿Í ºÐ¼®ÀÇ Á߿伺À» ü°¨ÇÏ¿´½À´Ï´Ù¡¦(»ý·«)