ÀÚ·á¼³¸í
±³À縦 Áß½ÉÀ¸·Î ´Ù¾çÇÑ ¹®ÇåÀ» Âü°íÇÏ¿©
°úÁ¦¹°¿¡ ÀûÇÕÇÑ Çü½Ä°ú ³»¿ëÀ¸·Î Á¤¼ºÀ» ´ÙÇØ ÀÛ¼ºÇß½À´Ï´Ù.
±¸¸ÅÀںеéÀÌ ¹Ù»Û ÀÏ»ó ¼Ó¿¡¼µµ ¾çÁúÀÇ ¸®Æ÷Æ®¸¦ ÀÛ¼ºÇϽô µ¥
½Ã°£°ú ³ë·ÂÀ» ÃÖ¼ÒÈÇÒ ¼ö ÀÖ´Â °úÁ¦¹°ÀÔ´Ï´Ù.
¸®Æ÷Æ® ÀÛ¼º¿¡ Âü°íÇϽþî ÁÁÀº ¼ºÀû ¹ÞÀ¸¼¼¿ä.^^
4¹øÀº rÄڵ带 ½ÇÇàÇÑ °á°ú¸¦ htmlÆÄÀÏ(4¹ø¹®Á¦.html)·Î ÷ºÎÇß½À´Ï´Ù.
¹®´Ü ¸ð¾ç(¿ÞÂÊ
¸ñÂ÷/Â÷·Ê
1. °³ÀÎÁ¤º¸, °¡¸íÁ¤º¸, À͸íÁ¤º¸ÀÇ °³³äÀ» ¾à¼úÇÏ°í °¢ °³³ä¿¡ ´ëÇØ ±¸Ã¼ÀûÀÎ (±³Àç ¿ÜÀÇ µ¶Ã¢ÀûÀÎ) »ç·Ê¸¦ µé¾î ¼³¸íÇϽÿÀ. ¶ÇÇÑ °¡¸íÁ¤º¸ Ȱ¿ëÀÌ °³Àο¡°Ô ¹ÌÄ¡´Â ¿µÇâ¿¡ °üÇØ °³ÀÎÁ¤º¸ º¸È£ÀÇ ÀÔÀå¿¡¼ ³íÇϽÿÀ. (9Á¡)
1) °³ÀÎÁ¤º¸, °¡¸íÁ¤º¸, À͸íÁ¤º¸ÀÇ °³³äÀ» ¾à¼úÇÏ°í °¢ °³³ä¿¡ ´ëÇØ ±¸Ã¼ÀûÀÎ (±³Àç ¿ÜÀÇ µ¶Ã¢ÀûÀÎ) »ç·Ê¸¦ µé¾î ¼³¸íÇϽÿÀ.
¨ç°³ÀÎÁ¤º¸ ¨è°¡¸íÁ¤º¸ ¨éÀ͸íÁ¤º¸ ¨ê±³Àç ¿Ü »ç·Ê
2) °¡¸íÁ¤º¸ Ȱ¿ëÀÌ °³Àο¡°Ô ¹ÌÄ¡´Â ¿µÇâ¿¡ °üÇØ °³ÀÎÁ¤º¸ º¸È£ÀÇ ÀÔÀå¿¡¼ ³íÇϽÿÀ.
2. ºòµ¥ÀÌÅÍ ½Ã´ë¿¡ Á¢¾îµé¾î ºñÁ¤Çüµ¥ÀÌÅÍ ºÐ¼®ÀÇ Á߿伺ÀÌ ºÎ°¢µÇ´Â ÀÌÀ¯´Â ¹«¾ùÀÎÁö ±â¼úÇϰí ÀÚ½ÅÀÌ ºñÁ¤Çüµ¥ÀÌÅÍ ºÐ¼®ÀÚ¶ó°í °¡Á¤ÇÒ ¶§, ¾î¶°ÇÑ ¾î·Á¿òÀÌ ¿¹»óµÇ¸ç ¾î¶² ÇØ°áÃ¥À» Á¦½ÃÇÒ ¼ö ÀÖÀ»Áö (µ¶Ã¢ÀûÀ¸·Î) ³íÇϽÿÀ. (9Á¡)
1) ºñÁ¤Çüµ¥ÀÌÅÍ ºÐ¼®ÀÇ Á߿伺ÀÌ ºÎ°¢µÇ´Â ÀÌÀ¯
2) ºñÁ¤Çüµ¥ÀÌÅÍ ºÐ¼®ÀÇ ¾î·Á¿ò°ú ÇØ°áÃ¥
3. ´ÙÀ½ [º¸±â]¿Í °°Àº ÅØ½ºÆ® µ¥ÀÌÅͰ¡ Á¸ÀçÇÑ´Ù°í °¡Á¤ÇÏÀÚ. ÀÌ µ¥ÀÌÅͰ¡ ¸Ê¸®µà½º °úÁ¤ÀÇ input µ¥ÀÌÅͶó¸é ÀÌÈÄÀÇ ¸Ê¸®µà½º °úÁ¤Àº ¾î¶»°Ô ÁøÇàµÉ °ÍÀÎÁö ´Ü°èº°·Î µµ½ÃÇÏ°í ¼³¸íÇϽÿÀ. (´Ü, Splitting ´Ü°è¿¡¼´Â ¹®À屸Á¶¿¡ »ó°ü¾øÀÌ Ã¹ ´Ü¾îºÎÅÍ ½ÃÀÛÇÏ¿© ¼¼ ´Ü¾î¾¿ ³ª´©¾îÁø´Ù°í °¡Á¤ÇÏ°í ´ë¼Ò¹®ÀÚ´Â ±¸º°ÇÏÁö ¾ÊÀ½) (6Á¡)
4. RÀÇ ¡®rvest ¹× ¡®dplyr ÆÐŰÁö¸¦ ÀÌ¿ëÇÏ¿© À¥ÆäÀÌÁö(±³Àç »ç·Ê ¿Ü)ÀÇ ÅØ½ºÆ®¸¦ Àоî¿À´Â Äڵ带 ÀÛ¼ºÇÏ°í ½ÇÇà°á°ú¸¦ Á¦½ÃÇϽÿÀ. ´Ü, °úÁ¦ ÀÛ¼ºÀÏÀ» ¸í½ÃÇÏ°í ´çÀÏ Ãֽа»½ÅµÈ À¥ÆäÀÌÁöÀÇ ³»¿ëÀ» Àоî¿Í¾ß ÇÕ´Ï´Ù. (6Á¡)
5. Âü°í¹®Çå
º»¹®/³»¿ë
1. °³ÀÎÁ¤º¸, °¡¸íÁ¤º¸, À͸íÁ¤º¸ÀÇ °³³äÀ» ¾à¼úÇÏ°í °¢ °³³ä¿¡ ´ëÇØ ±¸Ã¼ÀûÀÎ (±³Àç ¿ÜÀÇ µ¶Ã¢ÀûÀÎ) »ç·Ê¸¦ µé¾î ¼³¸íÇϽÿÀ. ¶ÇÇÑ °¡¸íÁ¤º¸ Ȱ¿ëÀÌ °³Àο¡°Ô ¹ÌÄ¡´Â ¿µÇâ¿¡ °üÇØ °³ÀÎÁ¤º¸ º¸È£ÀÇ ÀÔÀå¿¡¼ ³íÇϽÿÀ. (9Á¡)
1) °³ÀÎÁ¤º¸, °¡¸íÁ¤º¸, À͸íÁ¤º¸ÀÇ °³³äÀ» ¾à¼úÇÏ°í °¢ °³³ä¿¡ ´ëÇØ ±¸Ã¼ÀûÀÎ (±³Àç ¿ÜÀÇ µ¶Ã¢ÀûÀÎ) »ç·Ê¸¦ µé¾î ¼³¸íÇϽÿÀ.
°³ÀÎÁ¤º¸, °¡¸íÁ¤º¸, À͸íÁ¤º¸ÀÇ Â÷À̸¦ ¼³¸íÇϱ⿡ ¾Õ¼, ºñ½Äº°ÈÀÇ °³³äºÎÅÍ Á¤¸®ÇÒ Çʿ䰡 ÀÖ´Ù. ºñ½Äº°È¶õ, ºòµ¥ÀÌÅÍ ºÐ¼® °á°ú¹°¿¡¼ °³ÀÎ ½Äº°ÀÚ °ªÀÌ Á¦°Å ¶Ç´Â ¾Ë¾Æº¼ ¼ö ¾øµµ·Ï º¯È¯µÇ°Å³ª °³ÀÎÁ¤º¸°¡ Ç¥º»°ª, Æò±Õ°ª, ÃÖ´ëÃÖ¼Ò°ª µîÀ¸·Î ¹üÁÖȵǴ µîÀ¸·Î ÀÎÇØ °³Àο¡ ´ëÇÑ ½Äº°¼ºÀÌ Á¦°ÅµÇ¾îµµ ºòµ¥ÀÌÅÍÀÇ È°¿ë ¸ñÀûÀÌ »ó´çºÎºÐ ´Þ¼ºµÉ ¼ö ÀÖ´Ù´Â Á¡¿¡ Âø¾ÈÇÏ¿©, ÀÌ °æ¿ì ¡®°³ÀÎÁ¤º¸¡¯¿¡ ´ëÇØ ºÎ°úµÇ´Â ¾ö°ÝÇÑ ±ÔÁ¦ÀÇ Àû¿ëÀ» ÀüºÎ ¶Ç´Â ÀϺΠ¸éÇØÁÖ´Â Á¢±Ù¹æ½ÄÀÌ´Ù.
À̶§ ºñ½Äº°ÈÀÇ ÇÙ½ÉÀº ¾î´À Á¤µµ·Î °³ÀÎÀ» ¾Ë¾Æº¸±â ¾î·Æµµ·Ï Á¶Ä¡ÇØ¾ß ÇÏ´À³ÄÀÌ´Ù. ÀÌ¿¡ ´ëÇØ À¯·´ÀÇ ÀÏ¹Ý °³ÀÎÁ¤º¸ º¸È£¹ý(GDPR, General Data Protection Regulation)Àº °¡¸íÈ(pseudonymisation) ¹× À͸íÈ(anonymisation)¶ó´Â¡¦(»ý·«)
Âü°í¹®Çå
À念À硤¼Õ¿ø¡¤È²ÈñÁø, ºñÁ¤Çüµ¥ÀÌÅͺм®, Çѱ¹¹æ¼ÛÅë½Å´ëÇб³ÃâÆÇ¹®È¿ø, 2020.
R Documentation : https://www.r-project.org/other-docs.html
°¡¸íÁ¤º¸ ó¸® °¡À̵å¶óÀÎ, °³ÀÎÁ¤º¸º¸È£À§¿øÈ¸, 2022.4.
Àü½ÂÀ硤±ÇÇ念(2018), ¡º°³ÀÎÁ¤º¸, °¡¸íÁ¤º¸, À͸íÁ¤º¸¿¡ °üÇÑ4°³±¹ ¹ýÁ¦ ºñ±³ºÐ¼®¡». Á¤º¸¹ýÇÐ Á¦22±Ç Á¦3È£.
±¹°¡¹ý·ÉÁ¤º¸¼¾ÅÍ https://www.law.go.kr/
°³ÀÎÁ¤º¸º¸È£Æ÷ÅÐ https://www.privacy.go.kr/nns/ntc/inf/personalInfo.do
°³ÀÎÁ¤º¸º¸È£À§¿øÈ¸ https://www.pipc.go.kr/np/
°³ÀÎÁ¤º¸º¸È£À§¿øÈ¸¡¤º¸°Çº¹ÁöºÎ, º¸°ÇÀÇ·á µ¥ÀÌÅÍȰ¿ë °¡À̵å¶óÀÎ 2020.8.
±ÝÀ¶À§¿øÈ¸¡¤±ÝÀ¶°¨µ¶¿ø, ±ÝÀ¶ºÐ¾ß °¡¸í¡¤À͸íó¸® 20¾È³»¼(2022.01).
ºñÁ¤Çü µ¥ÀÌÅͷκÎÅÍ »õ·Î¿îºñÁî´Ï½º ÀλçÀÌÆ®¸¦ ã¾Æ³»´Â ¹æ¹ý
https://www.ibm.com/downloads/cas/NDJYNLAV