비지도 ν•™μŠ΅ ν΄λŸ¬μŠ€ν„°λ§

비지도 ν•™μŠ΅ ν΄λŸ¬μŠ€ν„°λ§

비지도 ν•™μŠ΅

방법 - λ‹΅μ•ˆμ§€ 없이 ν•™μŠ΅μ§€λ§Œ

비지도 ν•™μŠ΅μ€ μ‹œν—˜μ§€μ™€ λ‹΅μ•ˆμ§€ μ€‘μ—μ„œ μ‹œν—˜μ§€λ§Œ 인곡 지λŠ₯ 엔진에 μ œκ³΅ν•˜λŠ” λ°©μ‹μž…λ‹ˆλ‹€. μ‚¬μ§„μ˜ 경우라면 사진 속이 사물이 무엇인지 κ·Έ 이름은 λΊ€ μ±„λ‘œ μ΄λ―Έμ§€λ§Œ λ‹¬λž‘ μ£ΌλŠ” κ²ƒμž…λ‹ˆλ‹€. 수백만 μž₯의 사진 μ΄λ―Έμ§€λ§Œ 인곡 지λŠ₯이 ν•™μŠ΅ν•˜κ²Œ 되면 κ·Έ 인곡 지λŠ₯ λͺ¨λΈμ€ μƒˆλ‘œμš΄ μž…λ ₯ 사진 속 μ‚¬λ¬Όμ˜ 이름을 맞힐 μˆ˜λŠ” μ—†μŠ΅λ‹ˆλ‹€.

μ“Έλͺ¨ - λΉ„μŠ·ν•œ 것듀끼리 λ¬Άμ–΄λ‚΄κΈ°

μ‚¬λ¬Όμ˜ 이름을 μ•Œμ•„ λ§žνžˆμ§€ λͺ»ν•˜λŠ” 인곡 지λŠ₯은 μ“Έλͺ¨κ°€ μ—†λ‹€κ³ μš”? 그렇지 μ•ŠμŠ΅λ‹ˆλ‹€. 이름은 λͺ°λΌλ„ μƒˆλ‘œμš΄ 사진이 기쑴의 사진과 λΉ„μŠ·ν•œμ§€ μ—¬λΆ€λ₯Ό μ•Œμ•„λ‚Ό 수 μžˆλ‹€λ©΄ κ½€ μ“Έλͺ¨κ°€ 있게 λ©λ‹ˆλ‹€. μ•„μ˜ˆ λΉ„μŠ·ν•œ 사진듀끼리 λͺ¨μ•„μ€€λ‹€λ©΄ 더 κΈ΄μš”ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 비지도 ν•™μŠ΅μ˜ μœΌλœΈμ€ λΉ„μŠ·ν•œ 것듀끼리 λ¬Άμ–΄λ‚΄κΈ°μž…λ‹ˆλ‹€.

ν΄λŸ¬μŠ€ν„°λ§: ν΄λŸ¬μŠ€ν„°μ™€ 아웃라이어

ν΄λŸ¬μŠ€ν„°λ§ (λΉ„μŠ·ν•œ 것듀끼리 λ¬ΆκΈ°) κ²°κ³Ό: ν΄λŸ¬μŠ€ν„°μ™€ 아웃라이어

비지도 ν•™μŠ΅ μ€‘μ—μ„œ 단연 제일 μ€‘μš”ν•œ λͺ©ν‘œλŠ” λΉ„μŠ·ν•œ 데이터듀끼리 λ¬Άμ–΄λ‚΄λŠ” 것인데, 이 μž‘μ—…μ„ ν΄λŸ¬μŠ€ν„°λ§μ΄λΌκ³  λΆ€λ¦…λ‹ˆλ‹€. ν΄λŸ¬μŠ€ν„°λ§μ„ ν•˜κ³  λ‚œ 결과둜 μ–»μ–΄μ§€λŠ” 것은 λ‹€μˆ˜μ˜ ν΄λŸ¬μŠ€ν„°μ™€ μ•„μ›ƒλΌμ΄μ–΄μž…λ‹ˆλ‹€. ν•˜λ‚˜μ˜ ν΄λŸ¬μŠ€ν„° μ•ˆμ—λŠ” λΉ„μŠ·ν•œ 데이터듀이 λ“€μ–΄κ°€κ²Œ λ©λ‹ˆλ‹€. μ–΄λŠ ν΄λŸ¬μŠ€ν„°μ—λ„ μ†ν•˜μ§€ μ•Šμ€ 것듀은 λ³„λ‚˜κ²Œ 생긴 κ²ƒλ“€μΈλ°μš”, 이λ₯Ό 아웃라이어라고 λΆ€λ¦…λ‹ˆλ‹€.

λΉ„μŠ·ν•˜λ‹€λŠ” νŒλ‹¨μ€ 인곡 지λŠ₯이 κ·Έλ•Œ κ·Έλ•Œ μ•Œμ•„μ„œ

κ·Έλ ‡λ‹€λ©΄, κ³Όμ—° μ–΄λ–€ κΈ°μ€€μœΌλ‘œ 두 데이터가 λΉ„μŠ·ν•˜λ‹€κ³  νŒλ‹¨μ„ ν• κΉŒμš”? λ°”λ‘œ 이 λŒ€λͺ©μ—μ„œ 인곡 지λŠ₯의 μ—­λŸ‰μ΄ λ°œνœ˜κ°€ λ©λ‹ˆλ‹€. λͺ¨λ“  데이터λ₯Ό λ‹€ κ³ λ €ν•΄μ„œ κ°€μž₯ μ μ ˆν•œ 기쀀을 λ„μΆœν•˜λŠ” κ²ƒμ΄μ§€μš”. λ¬Όλ‘  이 기쀀은 μƒˆλ‘œμš΄ 데이터가 μž…λ ₯될 λ•Œλ§ˆλ‹€ μƒˆλ‘­κ²Œ 쑰정이 λ©λ‹ˆλ‹€.

인간, 인곡 지λŠ₯의 감독관

인곡 지λŠ₯이 μ •ν•œ 기쀀이 μš°λ¦¬κ°€ μ›ν•˜λŠ” λͺ©ν‘œμ— λΆ€ν•©ν•˜λŠ” κ²ƒμΌκΉŒμš”? 늘 κ·Έλ ‡μ§€λŠ” μ•ŠμŠ΅λ‹ˆλ‹€. λ°”λ‘œ 이 λŒ€λͺ©μ—μ„œ 인간 μ§€μ„±μ˜ μ—­λŸ‰μ΄ ν•„μš”ν•˜κ²Œ λ©λ‹ˆλ‹€. 인곡 지λŠ₯의 κ²°κ³Όλ₯Ό 인간이 κ²€ν† ν•˜κ³  νŒλ‹¨ν•΄μ„œ ν•„μš”ν•˜λ‹€λ©΄ 인곡 지λŠ₯μ—κ²Œ 기쀀을 바꾸라고 μ§€μ‹œν•΄μ•Ό ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

ν΄λŸ¬μŠ€ν„°λ§μ˜ ν™œμš©: 비정상 탐지

λΉ„μŠ·ν•œ 것끼리 λ¬Άμ–΄μ„œ λΉ„μŠ·ν•˜μ§€ μ•Šμ€ 것 μ°ΎκΈ°

λΉ„μŠ·ν•œ 것듀끼리 λ¬Άμ–΄λ‚΄λŠ” ν΄λŸ¬μŠ€ν„°λ§μ΄ 어디에 효용이 μžˆμ„κΉŒμš”? ν₯λ―Έλ‘­κ²Œλ„ β€œλΉ„μŠ·ν•˜μ§€ μ•Šμ€ 것”을 μ°ΎλŠ” 데에 큰 효용이 μžˆμŠ΅λ‹ˆλ‹€. 우리의 관심사 μ€‘μ—μ„œ λ‹€λ₯Έ 데이터듀과 λΉ„μŠ·ν•˜μ§€ μ•Šμ€ 경우 비정상이라고 봐도 λ λ§Œν•œ 것듀이 μ œλ²• 많이 μžˆμŠ΅λ‹ˆλ‹€. ν”νžˆ β€œμ‚¬κ³ β€λΌκ³  λΆ€λ₯Ό 수 μžˆλŠ” 것듀은 λŒ€κ°œ λ‹€μˆ˜μ˜ λ‹€λ₯Έ κ²ƒλ“€κ³ΌλŠ” λΉ„μŠ·ν•˜μ§€ μ•Šμ€ 경우일 수 μžˆμŠ΅λ‹ˆλ‹€.

λΉ„μŠ·ν•˜μ§€ μ•Šμ€ 것은 비정상 μ˜μ‹¬ λŒ€μƒ

μ•„μ›ƒλΌμ΄μ–΄λ‚˜ μ†ŒλŸ‰μ˜ λ°μ΄ν„°λ§Œ ν¬ν•¨ν•˜λŠ” μž‘μ€ ν΄λŸ¬μŠ€ν„°λ“€μ€ 비정상일 κ°€λŠ₯성이 μžˆμŠ΅λ‹ˆλ‹€. λ¬Όλ‘  데이터λ₯Ό μΆ”κ°€ν•΄μ„œ ν΄λŸ¬μŠ€ν„°λ§μ„ ν•˜κ²Œ 되면 이듀은 큰 ν΄λŸ¬μŠ€ν„°μ— 포함될 μˆ˜λ„ 있고, κ·Έλ ‡κ²Œ 되면 λ§Žμ€ λ‹€λ₯Έ 데이터와 λΉ„μŠ·ν•˜κΈ° λ•Œλ¬Έμ— 정상일 κ°€λŠ₯성이 λ†’μ•„μ§‘λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜, μ‹œκ°„μ΄ μ§€λ‚˜λ„ 계속 μ•„μ›ƒλΌμ΄μ–΄λ‚˜ μž‘μ€ ν΄λŸ¬μŠ€ν„°λ‘œ λ‚¨λŠ”λ‹€λ©΄ μ˜μ‹¬ν•΄ 봐도 μ’‹μŠ΅λ‹ˆλ‹€.

비정상 νƒμ§€μ˜ 으뜸, ν΄λŸ¬μŠ€ν„°λ§

λ­”κ°€ 평상 μ‹œμ™€ 달리 비정상인 데이터λ₯Ό μ°Ύμ•„λ‚΄κ³  μ‹Άλ‹€λ©΄ ν΄λŸ¬μŠ€ν„°λ§μ΄ 효과적인 μ ‘κ·Όλ²•μž…λ‹ˆλ‹€.

ν΄λŸ¬μŠ€ν„°λ§μ˜ ν™œμš©: 반볡 μž‘μ—…

λΉ„μŠ·ν•œ 것듀끼리 잘 λ¬Άμ˜€λ‹€λ©΄, 그듀을 λͺ¨λ‘ ν•˜λ‚˜λ‘œ 간주해도 무방할 λ•Œκ°€ μ’…μ’… μžˆμŠ΅λ‹ˆλ‹€.

고객의 μ—¬λŸ¬ 정보λ₯Ό λ°”νƒ•μœΌλ‘œ ν΄λŸ¬μŠ€ν„°λ§μ„ ν•˜κ²Œ 되면 λΉ„μŠ·ν•œ 고객듀이 ν•˜λ‚˜μ˜ ν΄λŸ¬μŠ€ν„°μ— λͺ¨μ΄κ²Œ λ©λ‹ˆλ‹€. κ³ κ°λ§ˆλ‹€ 맞좀 정보λ₯Ό μ œκ³΅ν•˜κ³ μž ν•  λ•Œ 각각의 고객에 λŒ€ν•΄μ„œ 같은 일을 λ°˜λ³΅ν•˜κΈ° λ³΄λ‹€λŠ”, 같은 ν΄λŸ¬μŠ€ν„°μ— ν¬ν•¨λœ κ³ κ°μ—κ²Œ 같은 정보λ₯Ό μ œκ³΅ν•˜λŠ” 방식이 더 νš¨μœ¨μ μž…λ‹ˆλ‹€.

λ³΄μ•ˆκ³Ό 인곡 지λŠ₯

λ³΄μ•ˆμ— 인곡 지λŠ₯이 ν•„μš”ν•œκ°€?

μœ„ν˜‘ 탐지, 사고 λŒ€μ‘, μ‚¬μš©μž 인증, κ°œμΈμ •λ³΄ 보호, 유좜 탐지, μ•”ν˜Έν™” λ“± λ³΄μ•ˆμ˜ μ˜μ—­μ€ λ‹€μ–‘ν•©λ‹ˆλ‹€. 이 μ€‘μ—μ„œ κ°€μž₯ 기본이 λ˜λŠ” μœ„ν˜‘ 탐지λ₯Ό 생각해 λ³΄κ² μŠ΅λ‹ˆλ‹€.

전톡적인 β€œκ·œμΉ™β€μ— λ”°λ₯Έ 탐지 - κ·œμΉ™ λ°”κΉ₯은 μ†μˆ˜λ¬΄μ±…

과거의 μœ„ν˜‘ 탐지 방식은 β€œκ·œμΉ™β€μ— λ”°λ₯Έ νƒμ§€μž…λ‹ˆλ‹€. κ·œμΉ™μ΄ 100개 λ§ˆλ ¨λ˜μ–΄ μžˆλ‹€λ©΄ 100κ°€μ§€μ˜ μœ„ν˜‘μ„ 탐지할 μˆ˜κ°€ μžˆλŠ” κ²ƒμž…λ‹ˆλ‹€. 이 100가지에 μ†ν•˜μ§€ μ•Šμ€ μœ„ν˜‘μ€ μ–΄λ–»κ²Œ λ κΉŒμš”? λ‹Ήμ—°νžˆ νƒμ§€ν•˜μ§€ λͺ»ν•©λ‹ˆλ‹€.

μ‚¬λžŒμ΄ λ§Œλ“œλŠ” κ·œμΉ™ - λΆ€μ‘±ν•œ 인적 νŒŒμ›Œ

κ·œμΉ™μ„ λ§Œλ“œλŠ” μ£Όμ²΄λŠ” μ‚¬λžŒμž…λ‹ˆλ‹€. ν•œ μ‚¬λžŒμ˜ λ³΄μ•ˆ μ „λ¬Έκ°€κ°€ μ—΄μ‹¬νžˆ 데이터λ₯Ό λΆ„μ„ν•˜κ³  μ‹€ν—˜ν•΄μ„œ 1년에 λ§Œλ“€ 수 μžˆλŠ” κ·œμΉ™μ΄ λͺ‡ κ°œλ‚˜ λ κΉŒμš”? κ·Έ κ·œμΉ™μ€ μ–Όλ§ˆλ‚˜ 믿을 수 μžˆμ„κΉŒμš”?

μ‚¬λžŒμ΄ λ§Œλ“œλŠ” κ·œμΉ™ - μ‹ μ’…κ³Ό 변쒅은 λ†“μΉœλ‹€

β€œμ‚¬λžŒμ΄ λ§Œλ“œλŠ” κ·œμΉ™β€μœΌλ‘œλŠ” μƒˆλ‘œμš΄ μœ„ν˜‘, 즉 μ‹ μ’… 곡격, λ˜λŠ” μ‘°κΈˆμ”© 바뀐 μœ„ν˜‘, 즉 λ³€μ’… 곡격을 νƒμ§€ν•˜λŠ” 것이 λΆˆκ°€λŠ₯ν•©λ‹ˆλ‹€. μ„€λ Ή κ·œμΉ™μ— λΆ€ν•©ν•˜λŠ” 이벀트λ₯Ό νƒμ§€ν–ˆλ‹€κ³  해도, κ·Έ κ·œμΉ™μ„ λ§Œλ“  μ‚¬λžŒμ΄ κ·Έμ•Όλ§λ‘œ μ™„λ²½ν•˜κ²Œ μž‘μ„±ν•œ 것이 μ•„λ‹ˆλΌλ©΄, νƒμ§€λœ κ·Έ μ΄λ²€νŠΈλŠ” 정상인 이벀트일 수 μžˆμŠ΅λ‹ˆλ‹€. μ•žμ˜ 경우λ₯Ό β€œλ―Ένƒβ€ λ’€μ˜ 경우λ₯Ό β€œμ˜€νƒβ€μ΄λΌκ³  λΆ€λ₯΄λŠ”데, 이 λ‘˜ λͺ¨λ‘ μ‹¬κ°ν•œ μˆ˜μ€€μœΌλ‘œ μ·¨μ•½ν•œ 것이 였랜 ν˜„μ‹€μ΄μ—ˆμŠ΅λ‹ˆλ‹€.

미탐 λ°©μ§€λŠ” 포기, μ˜€νƒ λ°©μ§€μ—λŠ” μ†Œλͺ¨μ „

μœ„ν˜‘μœΌλ‘œ λ°œμƒν•˜λŠ” ν”Όν•΄λ₯Ό κ³ λ €ν•˜λ©΄ 미탐을 μ€„μ΄λŠ” 것이 더 μ€‘μš”ν•œ λͺ©ν‘œμΈ 것은 λΆ„λͺ…ν•©λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ κ·Έλ™μ•ˆ ν˜„μž₯μ—μ„œλŠ” 미탐을 λ°©μ§€ν•˜λŠ” 것은 ν¬κΈ°ν•˜λ‹€μ‹œν”Ό ν•˜μ˜€μŠ΅λ‹ˆλ‹€. 미탐 방지λ₯Ό ν¬κΈ°ν•œ 것을 감좔렀고 μ˜€νƒμ„ μ€„μ΄λŠ” μΌμ—λŠ” μ˜¨κ°– λ…Έλ ₯을 κΈ°μšΈμ—¬ μ™”λ˜ μ›ƒν”ˆ ν˜„μ‹€.

μ‚¬λžŒμ΄ λ§Œλ“œλŠ” κ·œμΉ™ λŒ€μ‹  인곡 지λŠ₯으둜

β€œμ‚¬λžŒμ΄ λ§Œλ“œλŠ” κ·œμΉ™β€ λŒ€μ‹ μ— 인곡 지λŠ₯을 ν™œμš©ν•΄ λ΄μ•Όκ² λ‹€λŠ” 생각은, λ°”μ•Όνλ‘œ νŽΌμ³μ§€λŠ” 인곡 지λŠ₯의 μ‹œλŒ€μ—, λˆ„κ΅¬λΌλ„ λ‹Ήμ—°ν•˜κ²Œ λ–  올릴 λ§Œν•©λ‹ˆλ‹€.

ν•œκ΅­μ—μ„œ 인곡 지λŠ₯ λ³΄μ•ˆμ˜ μ‹œλ„μ™€ μ‹€νŒ¨

ν•œκ΅­μ—μ„œ 인곡 지λŠ₯ λ³΄μ•ˆμ˜ 연이은 μ‹€νŒ¨ - 지도 ν•™μŠ΅μ—λ§Œ 의쑴

λˆ„κ΅¬λΌλ„ λ‹Ήμ—°ν•˜κ²Œ λ–  μ˜¬λ¦¬λŠ” 아이디어, 인곡 지λŠ₯을 ν™œμš©ν•œ λ³΄μ•ˆ, 이 μ‹œλ„λ₯Ό 우리 λ‚˜λΌμ—μ„œλ„ 2017λ…„ κ²½λΆ€ν„° λ‹€μ–‘ν•œ κΈ°κ΄€μ—μ„œ μ‹€ν—˜ν–ˆμŠ΅λ‹ˆλ‹€. ꡳ이 μ‹€ν—˜μ΄λΌκ³  λ§ν•œ μ΄μœ λŠ” 이 μ‹œλ„λ“€μ΄ μ•„μ‰½κ²Œλ„ μ„±κ³΅ν•˜μ§€ μ•Šμ•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

μ΄λ“€μ˜ μ‹€νŒ¨ μ‚¬μœ λŠ” ν•œκ²° κ°™μŠ΅λ‹ˆλ‹€. 지도 ν•™μŠ΅μ—λ§Œ μ˜μ‘΄ν–ˆκΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

λ³΄μ•ˆμ—μ„œλŠ” 지도 ν•™μŠ΅μ„ μœ„ν•œ μ‹œν—˜μ§€μ™€ λ‹΅μ•ˆμ§€λ₯Ό μΆ©λΆ„νžˆ 잘 λ§Œλ“€ 수 μ—†λ‹€

지도 ν•™μŠ΅μ€ μ‚¬λžŒμ΄ 인곡 지λŠ₯μ—κ²Œ μ‹œν—˜μ§€μ™€ λ‹΅μ•ˆμ§€λ₯Ό ν•¨κ»˜ μ£Όμ–΄μ•Όλ§Œ κ°€λŠ₯ν•©λ‹ˆλ‹€. λ³΄μ•ˆμ—μ„œ μ‹œν—˜μ§€λŠ” 이벀트 데이터이고, λ‹΅μ•ˆμ§€λŠ” μœ„ν˜‘ μ—¬λΆ€ 및 μœ„ν˜‘μ˜ μ΄λ¦„μž…λ‹ˆλ‹€.

μš°μ„  μœ„ν˜‘ 이벀트λ₯Ό ν™•λ³΄ν•˜λŠ” 것뢀터 쉽지 μ•ŠμŠ΅λ‹ˆλ‹€. μ‹ μ’… λ˜λŠ” λ³€μ’… 곡격을 νƒμ§€ν•˜μ§€ λͺ» ν•˜κ³  μžˆλŠ”λ°, κ·Έ 사둀λ₯Ό 확보해야 ν•œλ‹€λŠ” 게 μ–΄λΆˆμ„±μ„€μΈ κ²ƒμ΄μ§€μš”. μ²œμ‹ λ§Œκ³  끝에 μœ„ν˜‘ 사둀λ₯Ό μ’€ ν™•λ³΄ν–ˆλ‹€κ³  해도, 그것이 μΆ©λΆ„ν•œ μ‹œν—˜μ§€μΈμ§€ μž₯λ‹΄ν•  μˆ˜κ°€ μ—†μŠ΅λ‹ˆλ‹€. μ–΄λ–€ μœ„ν˜‘μ€ ν•œ μˆœκ°„μ˜ λ°μ΄ν„°λ§ŒμœΌλ‘œλŠ” 정상과 ꡬ별이 μ•ˆ λ˜λŠ” κ²½μš°κ°€ 많기 λ•Œλ¬Έμž…λ‹ˆλ‹€. μœ„ν˜‘ 이벀트λ₯Ό μΆ©λΆ„νžˆ ν™•λ³΄ν•˜κ³  λ”λΆˆμ–΄ μΆ©λΆ„ν•œ μ‹œν—˜μ§€ κ΅¬μ„±κΉŒμ§€ κ°€λŠ₯ν•œ κ²½μš°λŠ”, κ²°κ΅­, 기쑴에 μ•Œλ €μ§„ μœ„ν˜‘ 일뢀에 λΆˆκ³Όν•˜κ²Œ λ©λ‹ˆλ‹€. 이런 μ’…λ₯˜μ˜ μœ„ν˜‘μ€ 이미 탐지해 왔을 κ²ƒμ΄λ‹ˆ, μ• μ΄ˆμ— μ• μ¨μ„œ 인곡 지λŠ₯ λͺ¨λΈμ„ λ§Œλ“€ 것도 μ•„λ‹™λ‹ˆλ‹€.

신변쒅은 λͺ¨λ₯΄λŠ” κ²ƒμ΄λ―€λ‘œ 지도 ν•™μŠ΅ν•  수 μ—†λ‹€

그전에 λͺ°λžλ˜ 것을 μ•Œκ³ μž ν•˜λŠ” 경우라면 지도 ν•™μŠ΅μ΄ λ“€μ–΄ λ§žκΈ°κ°€ μ–΄λ ΅μŠ΅λ‹ˆλ‹€. 지도 ν•˜λ €λ©΄ μ•Œμ•„μ•Ό ν•˜λ‹ˆκΉŒμš”. λͺ¨λ₯΄λŠ” 것을 μ°ΎλŠ”λ° 지도 ν•™μŠ΅μ„ λ™μ›ν•˜λŠ” 것은 λͺ¨μˆœμ— κ°€κΉμŠ΅λ‹ˆλ‹€. λ”°λΌμ„œ, 비지도 ν•™μŠ΅μ„ ν•΄μ•Ό ν•©λ‹ˆλ‹€. κ·Έλ™μ•ˆ λͺ» μ°Ύκ³  μžˆλŠ” μ‹ μ’… λ˜λŠ” λ³€μ’… 곡격을 μ°Ύμ•„ λ‚΄λ €λ©΄ 비지도 ν•™μŠ΅μœΌλ‘œλΆ€ν„° μΆœλ°œν•΄μ•Ό ν•œλ‹€λŠ” 것은 인곡 지λŠ₯을 쑰금만 κ³΅λΆ€ν•˜λ©΄ μ‰½κ²Œ μ•Œ 수 μžˆμŠ΅λ‹ˆλ‹€.

그런데, κ·Έλ™μ•ˆ 우리 λ‚˜λΌλŠ” λ³΄μ•ˆμ—μ„œ μ™œ 지도 ν•™μŠ΅μ—λ§Œ λ§€λ‹¬λ Έμ„κΉŒμš”?

κΈ€λ‘œλ²Œμ—μ„œμ˜ 성곡

κΈ€λ‘œλ²Œ ν™˜κ²½ - λ³΄μ•ˆμ—μ„œλŠ” 비지도 ν•™μŠ΅μ„ μ€‘μ‹¬μœΌλ‘œ

κΈ€λ‘œλ²Œ 상황은 우리 λ‚˜λΌμ™€λŠ” λ‹¬λžμŠ΅λ‹ˆλ‹€. 그듀은 λ³΄μ•ˆμ—μ„œ 비지도 ν•™μŠ΅μ΄ μ€‘μš”ν•˜λ‹€λŠ” 것을 μ§„μž‘ μ•Œκ³  μžˆμ—ˆμŠ΅λ‹ˆλ‹€. λ‹Ήμ—°νžˆ μ μ ˆν•œ νˆ¬μžμ™€ 그에 λ”°λ₯Έ 연ꡬ μ„±κ³Όκ°€ μ΄μ–΄μ‘ŒμŠ΅λ‹ˆλ‹€.

2018λ…„ μ¦ˆμŒμ— λ―Έκ΅­κ³Ό 영ꡭ의 λͺ‡λͺ‡ νšŒμ‚¬λ“€μ΄ 비지도 ν•™μŠ΅ 기반의 λ³΄μ•ˆ μ œν’ˆμ„ μ‹œμž₯에 λ‚΄ 놓고 μ„±κ³Όλ₯Ό 보여 μ£ΌκΈ° μ‹œμž‘ν•©λ‹ˆλ‹€. μ΄λ ‡κ²Œ 타당성과 νš¨μš©μ„±μ΄ μ–΄λŠ 정도 μž…μ¦λ˜μž, μ—¬λŸ¬ νšŒμ‚¬λ“€μ΄ λ›°μ–΄λ“€μ–΄ 비지도 ν•™μŠ΅μ„ λ³΄μ•ˆμ— μ μš©ν•˜λŠ” 방법을 λ‹€κ°λ„λ‘œ μ—°κ΅¬ν•˜λ©° κ²½μŸν•˜κ²Œ λ©λ‹ˆλ‹€.

κΈ€λ‘œλ²Œ κΈ°μ—… ν•œκ΅­ μ‹œμž₯ μž μ‹ 쀑

이 κΈ€λ‘œλ²Œ νšŒμ‚¬λ“€μ€ ν•œκ΅­μ—λ„ μ§„μΆœν•˜μ—¬ μ°¨μΈ° 고객측을 λ„“ν˜”λŠ”λ°, μ΄λŸ¬λŠ” 사이 ν•œκ΅­μ—μ„œλŠ” 지도 ν•™μŠ΅μ—λ§Œ μ˜μ‘΄ν•˜λŠ” 방식에 맀달렀 μ‹€νŒ¨λ₯Ό κ±°λ“­ν•œ κ²ƒμž…λ‹ˆλ‹€.

기술의 λ°œμ „ 속도λ₯Ό κ³ λ €ν•  λ•Œ κΈ€λ‘œλ²Œ 업체듀이 ν•œκ΅­μ˜ λ³΄μ•ˆ μ‹œμž₯을 λ‹€ 차지할지도 λͺ¨λ₯Έλ‹€λŠ” λΆˆμ•ˆκ°μ΄ ν•œκ΅­μ˜ λ³΄μ•ˆ 업계 κ΄€κ³„μžλ“€ 마음 속에 λ“€κΈ° μ‹œμž‘ν•©λ‹ˆλ‹€.

ν•œκ΅­μ—μ„œμ˜ μ‹€νŒ¨ 이유

κ°€μž₯ 큰 μ΄μœ λŠ” μ›μ²œ 기술의 λΆ€μž¬μž…λ‹ˆλ‹€.

지도 ν•™μŠ΅μ€ κ°€μž₯ μš°μˆ˜ν•œ 엔진이 곡짜 (ꡬ글, 페이슀뢁 κ³ λ§ˆμ›Œ)

λˆ„κ΅¬λΌλ„ 지도 ν•™μŠ΅μ„ μ‚¬μš©ν•˜κ³ μž ν•˜λ©΄ μ›μ²œ 기술이 ν•„μš”ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. ꡬ글, 페이슀뢁과 같은 λŒ€ν˜• κΈ€λ‘œλ²Œ 업체듀이 μ—¬λŸ¬ 가지 이유둜 μžμ‹ λ“€μ΄ μ—„μ²­λ‚œ λˆμ„ λ“€μ—¬ κ°œλ°œν•΄ 온 지도 ν•™μŠ΅ 기반의 μ›μ²œ κΈ°μˆ μ„ 무료둜 λ°°ν¬ν•˜κ³  있기 λ•Œλ¬Έμž…λ‹ˆλ‹€. 지도 ν•™μŠ΅ μ€‘μ—μ„œ λŒ€μž₯ 격이라고 ν•  수 μžˆλŠ” 것은 λ”₯λŸ¬λ‹μΈλ°, 이 νšŒμ‚¬λ“€μ΄ λ”₯λŸ¬λ‹μ„ ν¬ν•¨ν•œ λ‹€μ–‘ν•œ μ•Œκ³ λ¦¬μ¦˜μ„ κ΅¬ν˜„ν•΄ 놓은 엔진을 연ꡬ λͺ©μ μ€ λ¬Όλ‘  상업적 λͺ©μ μœΌλ‘œλ„ λˆ„κ΅¬λ‚˜ λ‹€μš΄λ°›μ•„μ„œ 자유둭게 μ‚¬μš©ν•  μˆ˜κ°€ μžˆμŠ΅λ‹ˆλ‹€.

비지도 ν•™μŠ΅μ„ ν•˜λ €λ©΄ 엔진을 직접 κ°œλ°œν•΄μ•Ό ν•˜λŠ”λ°β€¦

κ²°κ΅­ κ³ μ„±λŠ₯ 비지도 ν•™μŠ΅ 엔진이 ν•„μš”ν•œλ° 곡개된 것이 μ—†μœΌλ―€λ‘œ 직접 λ§Œλ“€μ–΄μ•Ό ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. κ·Έλ™μ•ˆ 인곡 지λŠ₯ 엔진을 μ‚¬μš©ν•˜κΈ°λ§Œ ν•΄ 온 ν•œκ΅­μ˜ 기업듀이 직접 λ§Œλ“€ μˆ˜κ°€ μžˆμ„κΉŒμš”?

쉽지 μ•Šμ€, 직접 κ°œλ°œμ— ν•„μš”ν•œ μ›μ²œ 기술

인곡 지λŠ₯ 엔진을 λ§Œλ“œλŠ” 것은 μ‚¬μš©ν•˜λŠ” κ²ƒκ³ΌλŠ” 차원이 λ‹€λ₯Έ μΌμž…λ‹ˆλ‹€. λ¨Έμ‹ λŸ¬λ‹ μ•Œκ³ λ¦¬μ¦˜μ— λŒ€ν•œ κΉŠμ€ 지식을 ν•„μš”λ‘œ ν•©λ‹ˆλ‹€. κ³ λ„μ˜ μˆ˜ν•™κ³Ό 컴퓨터 μ—”μ§€λ‹ˆμ–΄λ§μ„ ν•„μš”λ‘œ ν•©λ‹ˆλ‹€. νƒ„νƒ„ν•œ 기초 κ³Όν•™ μœ„μ— κ΅¬ν˜„κ³Ό 검증을 λ°˜λ³΅ν•΄μ•Ό ν•©λ‹ˆλ‹€. 이 κ³Όμ •μ—μ„œ ν•„μ—°μ μœΌλ‘œ 인곡 지λŠ₯ λ°”κΉ₯의 λ§Žμ€ 지식듀도 λ™μ›λ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€. ν•œλ§ˆλ””λ‘œ, 인곡 지λŠ₯은 λ¬Όλ‘  κ΄€λ ¨λœ μ—¬λŸ¬ λΆ„μ•Όμ˜ μ›μ²œ 기술이 ν•„μš”ν•œ κ²ƒμž…λ‹ˆλ‹€.

μ›μ²œ κΈ°μˆ μ€ λͺ¨λ‘κ°€ μ•„λŠ” κ²ƒμ²˜λŸΌ 단기간에 λ§Œλ“€μ–΄ λ‚Ό 수 μ—†μŠ΅λ‹ˆλ‹€.

λ³΄μ•ˆμ— ν•„μš”ν•œ 인곡 지λŠ₯ 기술

κ³ μ„±λŠ₯ 비지도 ν•™μŠ΅ 엔진
- ν΄λŸ¬μŠ€ν„°λ§ 엔진

비지도 ν•™μŠ΅ 엔진은 κ³ μ„±λŠ₯이어야 ν•œλ‹€

μƒˆλ‘œμš΄ μœ„ν˜‘μ„ νƒμ§€ν•˜κΈ° μœ„ν•΄μ„œλŠ” 지도 ν•™μŠ΅ λŒ€μ‹ μ— 비지도 ν•™μŠ΅μ„ μš°μ„ μ μœΌλ‘œ ν™œμš©ν•΄μ•Ό ν•©λ‹ˆλ‹€. 비지도 ν•™μŠ΅ 엔진은 μ„±λŠ₯이 맀우 μ€‘μš”ν•©λ‹ˆλ‹€. λŠμž„μ—†μ΄ λ“€μ–΄μ˜€λŠ” μƒˆλ‘œμš΄ μ‚¬μš©μž 데이터λ₯Ό 계산해야 ν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

비지도 ν•™μŠ΅ 엔진은 λ‹€μ–‘ν•œ μ•Œκ³ λ¦¬μ¦˜μ„ μ‚¬μš©ν•΄μ•Ό ν•œλ‹€

λ‹€μ–‘ν•œ 비지도 ν•™μŠ΅ μ•Œκ³ λ¦¬μ¦˜μ„ ν™œμš©ν•  수 μžˆμ–΄μ•Ό ν•©λ‹ˆλ‹€. 데이터 μ’…λ₯˜λ‚˜ μ–΄λ–€ κ²°κ³Όλ₯Ό λ‚΄κ³  싢은지에 따라 μ—¬λŸ¬ μ•Œκ³ λ¦¬μ¦˜ μ€‘μ—μ„œ κ°€μž₯ μ ν•©ν•œ 것을 ν™œμš©ν•΄μ•Ό ν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

지도 ν•™μŠ΅ ν™œμš©

지도 ν•™μŠ΅μ΄ κ°€λŠ₯ν•  λ•ŒλŠ” 적극 ν™œμš©ν•΄μ•Ό

νŠΉμ •ν•œ μœ„ν˜‘μ„ 잘 νƒμ§€ν•˜κ³  싢을 λ•Œμ—λŠ” 지도 ν•™μŠ΅ 엔진을 ν™œμš©ν•  ν•„μš”κ°€ μžˆμŠ΅λ‹ˆλ‹€. λ³΄μ•ˆμ˜ νŠΉμ„± 상 지도 ν•™μŠ΅μ— ν•„μš”ν•œ ν•™μŠ΅μ§€ 데이터와 λ‹΅μ•ˆμ§€ 데이터λ₯Ό μΆ©λΆ„ν•œ μˆ˜λŸ‰μœΌλ‘œ ꡬ비할 μˆ˜λŠ” μ—†μŠ΅λ‹ˆλ‹€. λ”°λΌμ„œ μ™„μ „ν•œ 지도 ν•™μŠ΅ λͺ¨λΈμ„ λ§Œλ“€ 수 μ—†μœΌλ―€λ‘œ 이에 μ „μ μœΌλ‘œ μ˜μ‘΄ν•  μˆ˜λŠ” μ—†μ§€λ§Œ, 이λ₯Ό 잘 ν™œμš©ν•˜λŠ” 것은 ν•„μš”ν•œ μΌμž…λ‹ˆλ‹€.

100% 지도 ν•™μŠ΅μ΄ μ•„λ‹ˆλ―€λ‘œ κ²°κ³Όλ₯Ό λ³΄κ°•ν•˜λŠ” 기술 ν•„μš”

지도 ν•™μŠ΅μ— μ „μ μœΌλ‘œ μ˜μ‘΄ν•  수 μ—†μœΌλ―€λ‘œ, λ‹Ήμ—°ν•˜κ²Œλ„, λ¨Έμ‹ λŸ¬λ‹ μ™Έμ˜ λ‹€μ–‘ν•œ 기술둜 지도 ν•™μŠ΅μ˜ κ²°κ³Όλ₯Ό 보좩할 수 μžˆμ–΄μ•Ό ν•©λ‹ˆλ‹€.

λŒ€μš©λŸ‰ 데이터 처리 ν”Œλž«νΌ

λŒ€μš©λŸ‰ 데이터에 λŒ€ν•΄μ„œ μ‰΄ν‹ˆμ—†λŠ” 비지도 ν•™μŠ΅

λ³΄μ•ˆμ—μ„œ λ‹€λ£¨λŠ” λ°μ΄ν„°λŠ” κ·Έ 양이 μ–΄λ§ˆμ–΄λ§ˆν•©λ‹ˆλ‹€. 사진 인식 λͺ¨λΈμ²˜λŸΌ 데이터λ₯Ό ν•œ 번 λͺ¨μ•„μ„œ λͺ¨λΈλ§ν•˜λ©΄ κ·Έ λͺ¨λΈμ„ μƒλ‹Ήν•œ κΈ°κ°„ λ™μ•ˆ μ‚¬μš©ν•  수 μžˆλŠ” 방식이 μ•„λ‹™λ‹ˆλ‹€. λ³΄μ•ˆμ—μ„œλŠ” μ‚¬μš©μžμ˜ 데이터가 λŠμž„μ—†μ΄ λ§Œλ“€μ–΄μ§€κ³ , 곡격자의 μœ„ν˜‘λ„ 늘 μƒˆλ‘œμš΄ 것이 μΆœν˜„ν•©λ‹ˆλ‹€. λ”°λΌμ„œ, μ‰΄ν‹ˆμ—†μ΄ λ¨Έμ‹ λŸ¬λ‹ 엔진에 데이터λ₯Ό λ„£κ³  ν•™μŠ΅ μ‹œν‚€κ³  뢄석해야 ν•©λ‹ˆλ‹€.

λ°μ΄ν„°μ˜ μ‹œμž‘κ³Ό 끝의 μ „ μ§€μ μ—μ„œ 병λͺ© 제거

그런데, κ³ μ„±λŠ₯ λ¨Έμ‹ λŸ¬λ‹ μ—”μ§„λ§ŒμœΌλ‘œ μΆ©λΆ„ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. 엔진에 데이터λ₯Ό μž…λ ₯ν•˜λŠ” κ³Όμ •, 엔진이 ν•™μŠ΅ 및 뢄석 κ²°κ³Όλ₯Ό 좜λ ₯ν•˜λŠ” κ³Όμ •, κ·Έ κ²°κ³Όλ₯Ό μ‚¬μš©μžκ°€ 뢄석할 수 μžˆλ„λ‘ ν•΄ μ£ΌλŠ” κ³Όμ •, 이 λͺ¨λ“  κ³Όμ •μ—μ„œ ν•œ ꡰ데라도 병λͺ©μ΄ μžˆμ–΄μ„œλŠ” μ•ˆ λ©λ‹ˆλ‹€. λ”°λΌμ„œ, λŒ€μš©λŸ‰ 데이터λ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ μ„±λŠ₯의 μ €ν•˜μ—†μ΄ λ‹€λ£° 수 μžˆλŠ” ν”Œλž«νΌμ΄ ν•„μš”ν•©λ‹ˆλ‹€. κ³ λ„μ˜ 컴퓨터 μ—”μ§€λ‹ˆμ–΄λ§μ΄ μš”κ΅¬λ˜λŠ” 것은 λ‹Ήμ—°ν•©λ‹ˆλ‹€.

μžλ™ 라벨링

라벨이 μ—†κ±°λ‚˜ ν™•μ‹€ν•˜μ§€ μ•Šκ±°λ‚˜

비지도 ν•™μŠ΅μ˜ κ²°κ³ΌλŠ” 지도 ν•™μŠ΅κ³Ό 달리 라벨을 νŠΉμ •ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. 지도 ν•™μŠ΅μ˜ κ²½μš°λΌλ„ ν•™μŠ΅μ§€μ™€ λ‹΅μ•ˆμ§€λ₯Ό μΆ©λΆ„νžˆ μ œκ³΅λ°›μ§€ λͺ»ν•œ 지도 ν•™μŠ΅ λͺ¨λΈμ΄λΌλ©΄ λͺ¨λΈμ˜ κ²°κ³Όκ°€ μ œμ‹œν•˜λŠ” 라벨을 마음 놓고 μ‚¬μš©ν•  μˆ˜λŠ” μ—†μŠ΅λ‹ˆλ‹€.

μžλ™ 라벨링 λ˜λŠ” 라벨링 보강 기술이 ν•„μš”ν•˜λ‹€

비지도 ν•™μŠ΅μ˜ κ²½μš°μ—λŠ” 라벨을 λΆ™μ—¬μ£Όμ–΄μ•Ό ν•˜κ³ , 지도 ν•™μŠ΅μ˜ κ²½μš°μ—λŠ” 라벨을 보강해 μ£Όμ–΄μ•Ό ν•©λ‹ˆλ‹€. 이λ₯Ό μœ„ν•΄ λ¨Έμ‹ λŸ¬λ‹ μ˜μ—­ λ°”κΉ₯μ—μ„œλ„ ν•„μš”ν•œ μ›μ²œ κΈ°μˆ μ„ 확보할 수 μžˆμ–΄μ•Ό ν•©λ‹ˆλ‹€.

ν΄λŸΌμ—˜μ˜ ν˜μ‹ μ  μ›μ²œ 기술

μ΄ˆκ³ μ† 비지도 ν•™μŠ΅ ν΄λŸ¬μŠ€ν„°λ§ 엔진

자체 기술둜 κ°œλ°œν•œ ν΄λŸ¬μŠ€ν„°λ§ 엔진

ν΄λŸΌμ—˜μ€ ν΄λŸ¬μŠ€ν„°λ§ 엔진을 자체 기술둜 λ§Œλ“€μ—ˆμŠ΅λ‹ˆλ‹€. μ •ν˜• λ°μ΄ν„°λŠ” λ¬Όλ‘  λΉ„μ •ν˜• 데이터도 가리지 μ•Šκ³  ν΄λŸ¬μŠ€ν„°λ§μ„ ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

μ•Œκ³ λ¦¬μ¦˜λΆ€ν„° 직접 개발

ν΄λŸΌμ—˜μ˜ ν΄λŸ¬μŠ€ν„°λ§ 엔진 ν΄λŸΌμž‡(Clumit)은 μ‚¬μš© κ°€λŠ₯ν•œ 타 μ˜€ν”ˆμ†ŒμŠ€ 기반 ν΄λŸ¬μŠ€ν„°λ§ μ—”μ§„κ³ΌλŠ” 비ꡐ할 수 없을 μ •λ„λ‘œ λΉ λ₯΄κ³  μœ μ—°ν•©λ‹ˆλ‹€. μ΄λŠ” ν΄λŸ¬μŠ€ν„°λ§μ˜ λŒ€ν‘œμ μΈ μ•Œκ³ λ¦¬μ¦˜μ„ 자체 기술둜 κ΅¬ν˜„ν–ˆκΈ° λ•Œλ¬Έμ— κ°€λŠ₯ν•œ κ²ƒμž…λ‹ˆλ‹€.

μ‹€μ‹œκ°„ νŠΈλž˜ν”½λ„ ν΄λŸ¬μŠ€ν„°λ§ν•˜λŠ” κ³ μ„±λŠ₯ 엔진

νŒ¨ν„΄ 인식, 계측, DBSCAN, OPTICS λ“± μ£Όμš” ν΄λŸ¬μŠ€ν„°λ§ μ•Œκ³ λ¦¬μ¦˜μ„ 직접 κ΅¬ν˜„ν•˜μ˜€μŠ΅λ‹ˆλ‹€. κ°€μž₯ μ€‘μš”ν•œ 도전은 μ‹€μ œ νŠΈλž˜ν”½ ν™˜κ²½μ—μ„œ μ‚¬μš©ν•  수 μžˆμ„ μ •λ„λ‘œ 높은 μ„±λŠ₯을 λ‚΄λŠλƒ ν•˜λŠ” κ²ƒμ΄μ—ˆμŠ΅λ‹ˆλ‹€. ν΄λŸΌμ—˜μ€ 5λ…„ 이상 각고의 λ…Έλ ₯을 μŸμ•„ λΆ€μ—ˆμŠ΅λ‹ˆλ‹€. λ§ˆμΉ¨λ‚΄ λ†€λΌμšΈ μ •λ„λ‘œ ν–₯μƒλœ μ„±λŠ₯을 μžλž‘ν•˜λŠ” μ΄ˆκ³ μ† ν΄λŸ¬μŠ€ν„°λ§ 엔진 ν΄λŸΌμž‡(Clumit)을 λ§Œλ“€μ—ˆμŠ΅λ‹ˆλ‹€.

μ •κ·œν‘œν˜„μ‹ 생성과 μžλ™ 라벨링

λ¨Έμ‹ λŸ¬λ‹μ˜ 연산값은 숫자, 문자 지식과 비ꡐ λΆˆκ°€λŠ₯ν•œλ°β€¦

비지도 ν•™μŠ΅μ˜ 결과물에 라벨을 λΆ™μ΄λŠ” 것은 μ‰¬μš΄ 일이 μ•„λ‹™λ‹ˆλ‹€. μ• μ΄ˆμ— 지도 ν•™μŠ΅μœΌλ‘œ μ‚¬μš©ν•  데이터가 λΆ€μ‘±ν•œ 상황인 탓에 비지도 ν•™μŠ΅μ„ μ„ νƒν•˜μ˜€μœΌλ―€λ‘œ 라벨링에 μ‚¬μš©ν•  κ³Όκ±° 데이터가 λΆ€μ‘±ν•œ 것은 λ‹Ήμ—°ν•©λ‹ˆλ‹€. λ”κ΅¬λ‚˜ κ³Όκ±° 데이터와 비지도 ν•™μŠ΅μ˜ κ²°κ³Όλ₯Ό μƒν˜Έ λΉ„κ΅ν•˜λŠ” 것은 ꡉμž₯히 μ–΄λ ΅μŠ΅λ‹ˆλ‹€. μ™œλƒν•˜λ©΄ 지도 ν•™μŠ΅μ΄λ“  비지도 ν•™μŠ΅μ΄λ“  λ¨Έμ‹ λŸ¬λ‹μ˜ 연산값듀은 μ‚¬λžŒμ—κ² μ˜λ―Έκ°€ μ—†λŠ” μˆ«μžμ— λΆˆκ³Όν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

λ¨Έμ‹ λŸ¬λ‹μ˜ 숫자λ₯Ό 비ꡐ κ°€λŠ₯ν•œ 문자, μ •κ·œν‘œν˜„μ‹μœΌλ‘œ κ΅¬μ„±ν•˜μ—¬ 라벨 μ°Ύμ•„μ£ΌκΈ°

ν΄λŸΌμ—˜μ€ ν˜μ‹ μ μΈ 방법을 κ°œλ°œν•˜μ˜€μŠ΅λ‹ˆλ‹€. ν΄λŸ¬μŠ€ν„°μ— μ†ν•œ λ°μ΄ν„°λ“€μ˜ 곡톡 νŒ¨ν„΄μ„ κΈ°μˆ ν•˜λŠ” μ •κ·œν‘œν˜„μ‹μ„ μ‹€μ‹œκ°„μœΌλ‘œ λ§Œλ“€μ–΄ μ‚¬μš©ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. μ •κ·œν‘œν˜„μ‹μ€ μˆ«μžκ°€ μ•„λ‹ˆλΌ νŒ¨ν„΄μ„ κΈ°μˆ ν•œ λ¬Έμžμ΄λ―€λ‘œ, κΈ°μ‘΄ 문자 데이터와 비ꡐ가 κ°€λŠ₯ν•©λ‹ˆλ‹€. μ •κ·œν‘œν˜„μ‹μ„ 맀개둜 ν•˜μ—¬ λ¨Έμ‹ λŸ¬λ‹μ˜ μ—°μ‚°κ°’κ³Ό κΈ°μ‘΄ 지식을 λΉ„κ΅ν•˜κ³ , κΈ°μ‘΄ 지식에 ν¬ν•¨λ˜μ–΄ μžˆλŠ” 라벨 μ€‘μ—μ„œ μœ μ‚¬ν•œ 것을 μ°Ύμ•„ λƒ…λ‹ˆλ‹€.

μ‹€μ‹œκ°„ μ •κ·œν‘œν˜„μ‹ 생성

λ°μ΄ν„°λ‘œλΆ€ν„° μ •κ·œν‘œν˜„μ‹μ„ μ‹€μ‹œκ°„μœΌλ‘œ λ§Œλ“œλŠ” κΈ°μˆ μ€ ν΄λŸΌμ—˜μ˜ νŠΉλ³„ν•œ μ›μ²œ κΈ°μˆ μž…λ‹ˆλ‹€. λ‹Ήμ—°ν•˜κ²Œλ„ νŠΉν—ˆ κΈ°μˆ μž…λ‹ˆλ‹€.

빅데이터 ν”Œλž«νΌ

인곡 지λŠ₯ μƒνƒœκ³„λŠ” 아직 어리닀

인곡 지λŠ₯을 ν™œμš©ν•˜κΈ°μ—λŠ” μƒνƒœκ³„κ°€ 아직 λ―Έμ„±μˆ™ν•œ κ²½μš°κ°€ λ§ŽμŠ΅λ‹ˆλ‹€. ν΄λŸΌμ—˜μ΄ μ›μ²œ 기술 기반으둜 자체 ν΄λŸ¬μŠ€ν„°λ§ 엔진을 λ§Œλ“€μ–΄ 비지도 ν•™μŠ΅ 인곡 지λŠ₯을 κ°œμ²™ν•˜λ‹€ λ³΄λ‹ˆ, κ΄€λ ¨ μƒνƒœκ³„κ°€ 아직 μΆ©λΆ„νžˆ λ’·λ°›μΉ¨λ˜μ§€ μ•Šμ€ 상황에 계속 맞λ‹₯λœ¨λ ΈμŠ΅λ‹ˆλ‹€.

비지도 ν•™μŠ΅ ν΄λŸ¬μŠ€ν„°λ§μ˜ μƒνƒœκ³„κ°€ ν•„μš”ν•˜λ‹€

데이터λ₯Ό 일단 λͺ¨μœΌκ³  ν•œ 번 ν•™μŠ΅ μ‹œν‚€κ³  λ‚˜μ„œ 일정 μ‹œκ°„ 후에 데이터λ₯Ό 또 λͺ¨μ•„μ„œ ν•™μŠ΅ μ‹œν‚€λŠ” 지도 ν•™μŠ΅κ³Ό λΉ„κ΅ν•˜μ—¬ 비지도 ν•™μŠ΅μ€ 많이 λ‹€λ¦…λ‹ˆλ‹€. 연속적인 데이터에 λŒ€ν•΄μ„œλ„ 계속 ν΄λŸ¬μŠ€ν„°λ§μ„ ν•  수 μžˆμ–΄μ•Ό ν•΄μ„œ ν΄λŸ¬μŠ€ν„°λ§ 엔진에 데이터λ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ μ œκ³΅ν•˜λŠ” κΈ°λŠ₯이 ν•„μš”ν•˜κ³ , λ”κ΅¬λ‚˜ λ³΄μ•ˆ μ˜μ—­μ—μ„œλŠ” λŒ€μš©λŸ‰ 데이터도 감당할 수 μžˆμ–΄μ•Ό ν•©λ‹ˆλ‹€.

λ”°λΌμ„œ, λŒ€μš©λŸ‰ 데이터, 즉 λΉ…λ°μ΄ν„°μ˜ 전달, μ €μž₯, 전솑, 관리 λ“± 데이터 μ£ΌκΈ° 전체에 λŒ€ν•΄μ„œ μ™„μ „νžˆ μƒˆλ‘œμš΄ 접근이 ν•„μš”ν–ˆμŠ΅λ‹ˆλ‹€.

λŒ€μš©λŸ‰ ν΄λŸ¬μŠ€ν„°λ§μ„ μœ„ν•œ 빅데이터 ν”Œλž«νΌμ„ λ§Œλ“€λ‹€

ν΄λŸΌμ—˜μ€ 톡신 ν”„λ‘œν† μ½œ, 데이터 μ €μž₯ 관리, API 호좜, μ‹¬μ§€μ–΄λŠ” 개발 μ–Έμ–΄κΉŒμ§€λ„ μ„±λŠ₯을 μ΅œμš°μ„ μœΌλ‘œ κ³ λ €ν•˜μ—¬ μ„ νƒν•˜μ˜€μŠ΅λ‹ˆλ‹€. κ°€μž₯ μ΅œμ²¨λ‹¨ 방식을 μ‚¬μš©ν•  μˆ˜λ°–μ— μ—†μ—ˆμŠ΅λ‹ˆλ‹€. μ–΄λŠ ν•œ μ§€μ μ—μ„œ κ³Όκ±° 방식을 λ‹΅μŠ΅ν–ˆλ‹€κ°€λŠ” λ°”λ‘œ κ·Έ 지점이 병λͺ©μ΄ λ˜λŠ” 것을 μˆ˜μ°¨λ‘€ λͺ©κ²©ν•˜λ©΄μ„œ μ–΄λŠ ν•œ 지점도 μ†Œν™€νžˆ ν•  수 μ—†μ—ˆμŠ΅λ‹ˆλ‹€.

μ•ˆμ •μ„±λ„ μ€‘μš”ν•œλ°β€¦

μ„±λŠ₯에 μ£Όμ•ˆμ μ„ λ‘˜ 경우 ν•„μ—°μ μœΌλ‘œ λΆ€λ”ͺ히게 λ˜λŠ” μ•ˆμ •μ„±μ˜ 문제λ₯Ό ν•΄κ²°ν•˜λŠ” 것도 쉽지 μ•Šμ•˜μŠ΅λ‹ˆλ‹€. μ„±λŠ₯κ³Ό μ•ˆμ •μ„±μ΄λΌλŠ” μƒν˜Έ λͺ¨μˆœλ˜λŠ” κ²ƒμ²˜λŸΌ λ³΄μ΄λŠ” 이 두 λͺ©ν‘œλ₯Ό λ‹¬μ„±ν•˜λŠ” 것이 μ†Œν”„νŠΈμ›¨μ–΄ 개발의 핡심 과제인 것은 λ‹Ήμ—°ν•©λ‹ˆλ‹€.

Rustλ₯Ό 메인 개발 μ–Έμ–΄λ‘œ μ±„νƒν•˜λ‹€

이λ₯Ό μœ„ν•˜μ—¬, ν΄λŸΌμ—˜μ€ 개발 μ–Έμ–΄λ‘œ Rustλ₯Ό μ‚¬μš©ν•˜μ˜€μŠ΅λ‹ˆλ‹€. μ²˜μŒλΆ€ν„° Rustλ₯Ό μ‚¬μš©ν•œ 것은 μ•„λ‹ˆμ—ˆμŠ΅λ‹ˆλ‹€. μ„±λŠ₯κ³Ό μ•ˆμ •μ„±μ΄ λͺ¨λ‘ μš”κ΅¬λ˜λŠ” λͺ¨λ“ˆμ„ ν•˜λ‚˜μ”© Rust둜 μž¬κ°œλ°œν•˜λ‹€ λ³΄λ‹ˆ μ–΄λŠμƒˆ ν΄λŸΌμ—˜ μ†Œν”„νŠΈμ›¨μ–΄μ˜ 거의 λŒ€λΆ€λΆ„μ€ Rust둜 μž‘μ„±λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€.

μ˜€ν”ˆ ν”Œλž«νΌμ„ ν–₯ν•˜μ—¬

ν΄λŸΌμ—˜μ˜ 빅데이터 ν”Œλž«νΌμ€ μ˜€ν”ˆ ν”Œλž«νΌμ„ 지ν–₯ν•©λ‹ˆλ‹€. λ‹€μ–‘ν•œ ν™˜κ²½μ—μ„œλ„ νš¨μš©μ„ λ‚˜νƒ€λ‚΄λ„λ‘ λ°œμ „μ‹œμΌœ λ‚˜κ°ˆ κ²ƒμž…λ‹ˆλ‹€.

ν΄λŸΌμ—˜μ˜ ν˜μ‹ μ  μ›μ²œ 기술

μ΄ˆκ³ μ† 비지도 ν•™μŠ΅ ν΄λŸ¬μŠ€ν„°λ§ 엔진

자체 기술둜 κ°œλ°œν•œ ν΄λŸ¬μŠ€ν„°λ§ 엔진

ν΄λŸΌμ—˜μ€ ν΄λŸ¬μŠ€ν„°λ§ 엔진을 자체 기술둜 λ§Œλ“€μ—ˆμŠ΅λ‹ˆλ‹€. μ •ν˜• λ°μ΄ν„°λŠ” λ¬Όλ‘  λΉ„μ •ν˜• 데이터도 가리지 μ•Šκ³  ν΄λŸ¬μŠ€ν„°λ§μ„ ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

μ•Œκ³ λ¦¬μ¦˜λΆ€ν„° 직접 개발

ν΄λŸΌμ—˜μ˜ ν΄λŸ¬μŠ€ν„°λ§ 엔진 ν΄λŸΌμž‡(Clumit)은 μ‚¬μš© κ°€λŠ₯ν•œ 타 μ˜€ν”ˆμ†ŒμŠ€ 기반 ν΄λŸ¬μŠ€ν„°λ§ μ—”μ§„κ³ΌλŠ” 비ꡐ할 수 없을 μ •λ„λ‘œ λΉ λ₯΄κ³  μœ μ—°ν•©λ‹ˆλ‹€. μ΄λŠ” ν΄λŸ¬μŠ€ν„°λ§μ˜ λŒ€ν‘œμ μΈ μ•Œκ³ λ¦¬μ¦˜μ„ 자체 기술둜 κ΅¬ν˜„ν–ˆκΈ° λ•Œλ¬Έμ— κ°€λŠ₯ν•œ κ²ƒμž…λ‹ˆλ‹€.

μ‹€μ‹œκ°„ νŠΈλž˜ν”½λ„ ν΄λŸ¬μŠ€ν„°λ§ν•˜λŠ” κ³ μ„±λŠ₯ 엔진

νŒ¨ν„΄ 인식, 계측, DBSCAN, OPTICS λ“± μ£Όμš” ν΄λŸ¬μŠ€ν„°λ§ μ•Œκ³ λ¦¬μ¦˜μ„ 직접 κ΅¬ν˜„ν•˜μ˜€μŠ΅λ‹ˆλ‹€. κ°€μž₯ μ€‘μš”ν•œ 도전은 μ‹€μ œ νŠΈλž˜ν”½ ν™˜κ²½μ—μ„œ μ‚¬μš©ν•  수 μžˆμ„ μ •λ„λ‘œ 높은 μ„±λŠ₯을 λ‚΄λŠλƒ ν•˜λŠ” κ²ƒμ΄μ—ˆμŠ΅λ‹ˆλ‹€. ν΄λŸΌμ—˜μ€ 5λ…„ 이상 각고의 λ…Έλ ₯을 μŸμ•„ λΆ€μ—ˆμŠ΅λ‹ˆλ‹€. λ§ˆμΉ¨λ‚΄ λ†€λΌμšΈ μ •λ„λ‘œ ν–₯μƒλœ μ„±λŠ₯을 μžλž‘ν•˜λŠ” μ΄ˆκ³ μ† ν΄λŸ¬μŠ€ν„°λ§ 엔진 ν΄λŸΌμž‡(Clumit)을 λ§Œλ“€μ—ˆμŠ΅λ‹ˆλ‹€.

μ •κ·œν‘œν˜„μ‹ 생성과 μžλ™ 라벨링

λ¨Έμ‹ λŸ¬λ‹μ˜ 연산값은 숫자, 문자 지식과 비ꡐ λΆˆκ°€λŠ₯ν•œλ°β€¦

비지도 ν•™μŠ΅μ˜ 결과물에 라벨을 λΆ™μ΄λŠ” 것은 μ‰¬μš΄ 일이 μ•„λ‹™λ‹ˆλ‹€. μ• μ΄ˆμ— 지도 ν•™μŠ΅μœΌλ‘œ μ‚¬μš©ν•  데이터가 λΆ€μ‘±ν•œ 상황인 탓에 비지도 ν•™μŠ΅μ„ μ„ νƒν•˜μ˜€μœΌλ―€λ‘œ 라벨링에 μ‚¬μš©ν•  κ³Όκ±° 데이터가 λΆ€μ‘±ν•œ 것은 λ‹Ήμ—°ν•©λ‹ˆλ‹€. λ”κ΅¬λ‚˜ κ³Όκ±° 데이터와 비지도 ν•™μŠ΅μ˜ κ²°κ³Όλ₯Ό μƒν˜Έ λΉ„κ΅ν•˜λŠ” 것은 ꡉμž₯히 μ–΄λ ΅μŠ΅λ‹ˆλ‹€. μ™œλƒν•˜λ©΄ 지도 ν•™μŠ΅μ΄λ“  비지도 ν•™μŠ΅μ΄λ“  λ¨Έμ‹ λŸ¬λ‹μ˜ 연산값듀은 μ‚¬λžŒμ—κ² μ˜λ―Έκ°€ μ—†λŠ” μˆ«μžμ— λΆˆκ³Όν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

λ¨Έμ‹ λŸ¬λ‹μ˜ 숫자λ₯Ό 비ꡐ κ°€λŠ₯ν•œ 문자, μ •κ·œν‘œν˜„μ‹μœΌλ‘œ κ΅¬μ„±ν•˜μ—¬ 라벨 μ°Ύμ•„μ£ΌκΈ°

ν΄λŸΌμ—˜μ€ ν˜μ‹ μ μΈ 방법을 κ°œλ°œν•˜μ˜€μŠ΅λ‹ˆλ‹€. ν΄λŸ¬μŠ€ν„°μ— μ†ν•œ λ°μ΄ν„°λ“€μ˜ 곡톡 νŒ¨ν„΄μ„ κΈ°μˆ ν•˜λŠ” μ •κ·œν‘œν˜„μ‹μ„ μ‹€μ‹œκ°„μœΌλ‘œ λ§Œλ“€μ–΄ μ‚¬μš©ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. μ •κ·œν‘œν˜„μ‹μ€ μˆ«μžκ°€ μ•„λ‹ˆλΌ νŒ¨ν„΄μ„ κΈ°μˆ ν•œ λ¬Έμžμ΄λ―€λ‘œ, κΈ°μ‘΄ 문자 데이터와 비ꡐ가 κ°€λŠ₯ν•©λ‹ˆλ‹€. μ •κ·œν‘œν˜„μ‹μ„ 맀개둜 ν•˜μ—¬ λ¨Έμ‹ λŸ¬λ‹μ˜ μ—°μ‚°κ°’κ³Ό κΈ°μ‘΄ 지식을 λΉ„κ΅ν•˜κ³ , κΈ°μ‘΄ 지식에 ν¬ν•¨λ˜μ–΄ μžˆλŠ” 라벨 μ€‘μ—μ„œ μœ μ‚¬ν•œ 것을 μ°Ύμ•„ λƒ…λ‹ˆλ‹€.

μ‹€μ‹œκ°„ μ •κ·œν‘œν˜„μ‹ 생성

λ°μ΄ν„°λ‘œλΆ€ν„° μ •κ·œν‘œν˜„μ‹μ„ μ‹€μ‹œκ°„μœΌλ‘œ λ§Œλ“œλŠ” κΈ°μˆ μ€ ν΄λŸΌμ—˜μ˜ νŠΉλ³„ν•œ μ›μ²œ κΈ°μˆ μž…λ‹ˆλ‹€. λ‹Ήμ—°ν•˜κ²Œλ„ νŠΉν—ˆ κΈ°μˆ μž…λ‹ˆλ‹€.

빅데이터 ν”Œλž«νΌ

인곡 지λŠ₯ μƒνƒœκ³„λŠ” 아직 어리닀

인곡 지λŠ₯을 ν™œμš©ν•˜κΈ°μ—λŠ” μƒνƒœκ³„κ°€ 아직 λ―Έμ„±μˆ™ν•œ κ²½μš°κ°€ λ§ŽμŠ΅λ‹ˆλ‹€. ν΄λŸΌμ—˜μ΄ μ›μ²œ 기술 기반으둜 자체 ν΄λŸ¬μŠ€ν„°λ§ 엔진을 λ§Œλ“€μ–΄ 비지도 ν•™μŠ΅ 인곡 지λŠ₯을 κ°œμ²™ν•˜λ‹€ λ³΄λ‹ˆ, κ΄€λ ¨ μƒνƒœκ³„κ°€ 아직 μΆ©λΆ„νžˆ λ’·λ°›μΉ¨λ˜μ§€ μ•Šμ€ 상황에 계속 맞λ‹₯λœ¨λ ΈμŠ΅λ‹ˆλ‹€.

비지도 ν•™μŠ΅ ν΄λŸ¬μŠ€ν„°λ§μ˜ μƒνƒœκ³„κ°€ ν•„μš”ν•˜λ‹€

데이터λ₯Ό 일단 λͺ¨μœΌκ³  ν•œ 번 ν•™μŠ΅ μ‹œν‚€κ³  λ‚˜μ„œ 일정 μ‹œκ°„ 후에 데이터λ₯Ό 또 λͺ¨μ•„μ„œ ν•™μŠ΅ μ‹œν‚€λŠ” 지도 ν•™μŠ΅κ³Ό λΉ„κ΅ν•˜μ—¬ 비지도 ν•™μŠ΅μ€ 많이 λ‹€λ¦…λ‹ˆλ‹€. 연속적인 데이터에 λŒ€ν•΄μ„œλ„ 계속 ν΄λŸ¬μŠ€ν„°λ§μ„ ν•  수 μžˆμ–΄μ•Ό ν•΄μ„œ ν΄λŸ¬μŠ€ν„°λ§ 엔진에 데이터λ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ μ œκ³΅ν•˜λŠ” κΈ°λŠ₯이 ν•„μš”ν•˜κ³ , λ”κ΅¬λ‚˜ λ³΄μ•ˆ μ˜μ—­μ—μ„œλŠ” λŒ€μš©λŸ‰ 데이터도 감당할 수 μžˆμ–΄μ•Ό ν•©λ‹ˆλ‹€.

λ”°λΌμ„œ, λŒ€μš©λŸ‰ 데이터, 즉 λΉ…λ°μ΄ν„°μ˜ 전달, μ €μž₯, 전솑, 관리 λ“± 데이터 μ£ΌκΈ° 전체에 λŒ€ν•΄μ„œ μ™„μ „νžˆ μƒˆλ‘œμš΄ 접근이 ν•„μš”ν–ˆμŠ΅λ‹ˆλ‹€.

λŒ€μš©λŸ‰ ν΄λŸ¬μŠ€ν„°λ§μ„ μœ„ν•œ 빅데이터 ν”Œλž«νΌμ„ λ§Œλ“€λ‹€

ν΄λŸΌμ—˜μ€ 톡신 ν”„λ‘œν† μ½œ, 데이터 μ €μž₯ 관리, API 호좜, μ‹¬μ§€μ–΄λŠ” 개발 μ–Έμ–΄κΉŒμ§€λ„ μ„±λŠ₯을 μ΅œμš°μ„ μœΌλ‘œ κ³ λ €ν•˜μ—¬ μ„ νƒν•˜μ˜€μŠ΅λ‹ˆλ‹€. κ°€μž₯ μ΅œμ²¨λ‹¨ 방식을 μ‚¬μš©ν•  μˆ˜λ°–μ— μ—†μ—ˆμŠ΅λ‹ˆλ‹€. μ–΄λŠ ν•œ μ§€μ μ—μ„œ κ³Όκ±° 방식을 λ‹΅μŠ΅ν–ˆλ‹€κ°€λŠ” λ°”λ‘œ κ·Έ 지점이 병λͺ©μ΄ λ˜λŠ” 것을 μˆ˜μ°¨λ‘€ λͺ©κ²©ν•˜λ©΄μ„œ μ–΄λŠ ν•œ 지점도 μ†Œν™€νžˆ ν•  수 μ—†μ—ˆμŠ΅λ‹ˆλ‹€.

μ•ˆμ •μ„±λ„ μ€‘μš”ν•œλ°β€¦

μ„±λŠ₯에 μ£Όμ•ˆμ μ„ λ‘˜ 경우 ν•„μ—°μ μœΌλ‘œ λΆ€λ”ͺ히게 λ˜λŠ” μ•ˆμ •μ„±μ˜ 문제λ₯Ό ν•΄κ²°ν•˜λŠ” 것도 쉽지 μ•Šμ•˜μŠ΅λ‹ˆλ‹€. μ„±λŠ₯κ³Ό μ•ˆμ •μ„±μ΄λΌλŠ” μƒν˜Έ λͺ¨μˆœλ˜λŠ” κ²ƒμ²˜λŸΌ λ³΄μ΄λŠ” 이 두 λͺ©ν‘œλ₯Ό λ‹¬μ„±ν•˜λŠ” 것이 μ†Œν”„νŠΈμ›¨μ–΄ 개발의 핡심 과제인 것은 λ‹Ήμ—°ν•©λ‹ˆλ‹€.

Rustλ₯Ό 메인 개발 μ–Έμ–΄λ‘œ μ±„νƒν•˜λ‹€

이λ₯Ό μœ„ν•˜μ—¬, ν΄λŸΌμ—˜μ€ 개발 μ–Έμ–΄λ‘œ Rustλ₯Ό μ‚¬μš©ν•˜μ˜€μŠ΅λ‹ˆλ‹€. μ²˜μŒλΆ€ν„° Rustλ₯Ό μ‚¬μš©ν•œ 것은 μ•„λ‹ˆμ—ˆμŠ΅λ‹ˆλ‹€. μ„±λŠ₯κ³Ό μ•ˆμ •μ„±μ΄ λͺ¨λ‘ μš”κ΅¬λ˜λŠ” λͺ¨λ“ˆμ„ ν•˜λ‚˜μ”© Rust둜 μž¬κ°œλ°œν•˜λ‹€ λ³΄λ‹ˆ μ–΄λŠμƒˆ ν΄λŸΌμ—˜ μ†Œν”„νŠΈμ›¨μ–΄μ˜ 거의 λŒ€λΆ€λΆ„μ€ Rust둜 μž‘μ„±λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€.

μ˜€ν”ˆ ν”Œλž«νΌμ„ ν–₯ν•˜μ—¬

ν΄λŸΌμ—˜μ˜ 빅데이터 ν”Œλž«νΌμ€ μ˜€ν”ˆ ν”Œλž«νΌμ„ 지ν–₯ν•©λ‹ˆλ‹€. λ‹€μ–‘ν•œ ν™˜κ²½μ—μ„œλ„ νš¨μš©μ„ λ‚˜νƒ€λ‚΄λ„λ‘ λ°œμ „μ‹œμΌœ λ‚˜κ°ˆ κ²ƒμž…λ‹ˆλ‹€.

ν΄λŸΌμ—˜μ˜ ν˜μ‹ μ  μ›μ²œ 기술

μ΄ˆκ³ μ† 비지도 ν•™μŠ΅ ν΄λŸ¬μŠ€ν„°λ§ 엔진

자체 기술둜 κ°œλ°œν•œ ν΄λŸ¬μŠ€ν„°λ§ 엔진

ν΄λŸΌμ—˜μ€ ν΄λŸ¬μŠ€ν„°λ§ 엔진을 자체 기술둜 λ§Œλ“€μ—ˆμŠ΅λ‹ˆλ‹€. μ •ν˜• λ°μ΄ν„°λŠ” λ¬Όλ‘  λΉ„μ •ν˜• 데이터도 가리지 μ•Šκ³  ν΄λŸ¬μŠ€ν„°λ§μ„ ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

μ•Œκ³ λ¦¬μ¦˜λΆ€ν„° 직접 개발

ν΄λŸΌμ—˜μ˜ ν΄λŸ¬μŠ€ν„°λ§ 엔진 ν΄λŸΌμž‡(Clumit)은 μ‚¬μš© κ°€λŠ₯ν•œ 타 μ˜€ν”ˆμ†ŒμŠ€ 기반 ν΄λŸ¬μŠ€ν„°λ§ μ—”μ§„κ³ΌλŠ” 비ꡐ할 수 없을 μ •λ„λ‘œ λΉ λ₯΄κ³  μœ μ—°ν•©λ‹ˆλ‹€. μ΄λŠ” ν΄λŸ¬μŠ€ν„°λ§μ˜ λŒ€ν‘œμ μΈ μ•Œκ³ λ¦¬μ¦˜μ„ 자체 기술둜 κ΅¬ν˜„ν–ˆκΈ° λ•Œλ¬Έμ— κ°€λŠ₯ν•œ κ²ƒμž…λ‹ˆλ‹€.

μ‹€μ‹œκ°„ νŠΈλž˜ν”½λ„ ν΄λŸ¬μŠ€ν„°λ§ν•˜λŠ” κ³ μ„±λŠ₯ 엔진

νŒ¨ν„΄ 인식, 계측, DBSCAN, OPTICS λ“± μ£Όμš” ν΄λŸ¬μŠ€ν„°λ§ μ•Œκ³ λ¦¬μ¦˜μ„ 직접 κ΅¬ν˜„ν•˜μ˜€μŠ΅λ‹ˆλ‹€. κ°€μž₯ μ€‘μš”ν•œ 도전은 μ‹€μ œ νŠΈλž˜ν”½ ν™˜κ²½μ—μ„œ μ‚¬μš©ν•  수 μžˆμ„ μ •λ„λ‘œ 높은 μ„±λŠ₯을 λ‚΄λŠλƒ ν•˜λŠ” κ²ƒμ΄μ—ˆμŠ΅λ‹ˆλ‹€. ν΄λŸΌμ—˜μ€ 5λ…„ 이상 각고의 λ…Έλ ₯을 μŸμ•„ λΆ€μ—ˆμŠ΅λ‹ˆλ‹€. λ§ˆμΉ¨λ‚΄ λ†€λΌμšΈ μ •λ„λ‘œ ν–₯μƒλœ μ„±λŠ₯을 μžλž‘ν•˜λŠ” μ΄ˆκ³ μ† ν΄λŸ¬μŠ€ν„°λ§ 엔진 ν΄λŸΌμž‡(Clumit)을 λ§Œλ“€μ—ˆμŠ΅λ‹ˆλ‹€.

μ •κ·œν‘œν˜„μ‹ 생성과 μžλ™ 라벨링

λ¨Έμ‹ λŸ¬λ‹μ˜ 연산값은 숫자, 문자 지식과 비ꡐ λΆˆκ°€λŠ₯ν•œλ°β€¦

비지도 ν•™μŠ΅μ˜ 결과물에 라벨을 λΆ™μ΄λŠ” 것은 μ‰¬μš΄ 일이 μ•„λ‹™λ‹ˆλ‹€. μ• μ΄ˆμ— 지도 ν•™μŠ΅μœΌλ‘œ μ‚¬μš©ν•  데이터가 λΆ€μ‘±ν•œ 상황인 탓에 비지도 ν•™μŠ΅μ„ μ„ νƒν•˜μ˜€μœΌλ―€λ‘œ 라벨링에 μ‚¬μš©ν•  κ³Όκ±° 데이터가 λΆ€μ‘±ν•œ 것은 λ‹Ήμ—°ν•©λ‹ˆλ‹€. λ”κ΅¬λ‚˜ κ³Όκ±° 데이터와 비지도 ν•™μŠ΅μ˜ κ²°κ³Όλ₯Ό μƒν˜Έ λΉ„κ΅ν•˜λŠ” 것은 ꡉμž₯히 μ–΄λ ΅μŠ΅λ‹ˆλ‹€. μ™œλƒν•˜λ©΄ 지도 ν•™μŠ΅μ΄λ“  비지도 ν•™μŠ΅μ΄λ“  λ¨Έμ‹ λŸ¬λ‹μ˜ 연산값듀은 μ‚¬λžŒμ—κ² μ˜λ―Έκ°€ μ—†λŠ” μˆ«μžμ— λΆˆκ³Όν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

λ¨Έμ‹ λŸ¬λ‹μ˜ 숫자λ₯Ό 비ꡐ κ°€λŠ₯ν•œ 문자, μ •κ·œν‘œν˜„μ‹μœΌλ‘œ κ΅¬μ„±ν•˜μ—¬ 라벨 μ°Ύμ•„μ£ΌκΈ°

ν΄λŸΌμ—˜μ€ ν˜μ‹ μ μΈ 방법을 κ°œλ°œν•˜μ˜€μŠ΅λ‹ˆλ‹€. ν΄λŸ¬μŠ€ν„°μ— μ†ν•œ λ°μ΄ν„°λ“€μ˜ 곡톡 νŒ¨ν„΄μ„ κΈ°μˆ ν•˜λŠ” μ •κ·œν‘œν˜„μ‹μ„ μ‹€μ‹œκ°„μœΌλ‘œ λ§Œλ“€μ–΄ μ‚¬μš©ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. μ •κ·œν‘œν˜„μ‹μ€ μˆ«μžκ°€ μ•„λ‹ˆλΌ νŒ¨ν„΄μ„ κΈ°μˆ ν•œ λ¬Έμžμ΄λ―€λ‘œ, κΈ°μ‘΄ 문자 데이터와 비ꡐ가 κ°€λŠ₯ν•©λ‹ˆλ‹€. μ •κ·œν‘œν˜„μ‹μ„ 맀개둜 ν•˜μ—¬ λ¨Έμ‹ λŸ¬λ‹μ˜ μ—°μ‚°κ°’κ³Ό κΈ°μ‘΄ 지식을 λΉ„κ΅ν•˜κ³ , κΈ°μ‘΄ 지식에 ν¬ν•¨λ˜μ–΄ μžˆλŠ” 라벨 μ€‘μ—μ„œ μœ μ‚¬ν•œ 것을 μ°Ύμ•„ λƒ…λ‹ˆλ‹€.

μ‹€μ‹œκ°„ μ •κ·œν‘œν˜„μ‹ 생성

λ°μ΄ν„°λ‘œλΆ€ν„° μ •κ·œν‘œν˜„μ‹μ„ μ‹€μ‹œκ°„μœΌλ‘œ λ§Œλ“œλŠ” κΈ°μˆ μ€ ν΄λŸΌμ—˜μ˜ νŠΉλ³„ν•œ μ›μ²œ κΈ°μˆ μž…λ‹ˆλ‹€. λ‹Ήμ—°ν•˜κ²Œλ„ νŠΉν—ˆ κΈ°μˆ μž…λ‹ˆλ‹€.

빅데이터 ν”Œλž«νΌ

인곡 지λŠ₯ μƒνƒœκ³„λŠ” 아직 어리닀

인곡 지λŠ₯을 ν™œμš©ν•˜κΈ°μ—λŠ” μƒνƒœκ³„κ°€ 아직 λ―Έμ„±μˆ™ν•œ κ²½μš°κ°€ λ§ŽμŠ΅λ‹ˆλ‹€. ν΄λŸΌμ—˜μ΄ μ›μ²œ 기술 기반으둜 자체 ν΄λŸ¬μŠ€ν„°λ§ 엔진을 λ§Œλ“€μ–΄ 비지도 ν•™μŠ΅ 인곡 지λŠ₯을 κ°œμ²™ν•˜λ‹€ λ³΄λ‹ˆ, κ΄€λ ¨ μƒνƒœκ³„κ°€ 아직 μΆ©λΆ„νžˆ λ’·λ°›μΉ¨λ˜μ§€ μ•Šμ€ 상황에 계속 맞λ‹₯λœ¨λ ΈμŠ΅λ‹ˆλ‹€.

비지도 ν•™μŠ΅ ν΄λŸ¬μŠ€ν„°λ§μ˜ μƒνƒœκ³„κ°€ ν•„μš”ν•˜λ‹€

데이터λ₯Ό 일단 λͺ¨μœΌκ³  ν•œ 번 ν•™μŠ΅ μ‹œν‚€κ³  λ‚˜μ„œ 일정 μ‹œκ°„ 후에 데이터λ₯Ό 또 λͺ¨μ•„μ„œ ν•™μŠ΅ μ‹œν‚€λŠ” 지도 ν•™μŠ΅κ³Ό λΉ„κ΅ν•˜μ—¬ 비지도 ν•™μŠ΅μ€ 많이 λ‹€λ¦…λ‹ˆλ‹€. 연속적인 데이터에 λŒ€ν•΄μ„œλ„ 계속 ν΄λŸ¬μŠ€ν„°λ§μ„ ν•  수 μžˆμ–΄μ•Ό ν•΄μ„œ ν΄λŸ¬μŠ€ν„°λ§ 엔진에 데이터λ₯Ό μ‹€μ‹œκ°„μœΌλ‘œ μ œκ³΅ν•˜λŠ” κΈ°λŠ₯이 ν•„μš”ν•˜κ³ , λ”κ΅¬λ‚˜ λ³΄μ•ˆ μ˜μ—­μ—μ„œλŠ” λŒ€μš©λŸ‰ 데이터도 감당할 수 μžˆμ–΄μ•Ό ν•©λ‹ˆλ‹€.

λ”°λΌμ„œ, λŒ€μš©λŸ‰ 데이터, 즉 λΉ…λ°μ΄ν„°μ˜ 전달, μ €μž₯, 전솑, 관리 λ“± 데이터 μ£ΌκΈ° 전체에 λŒ€ν•΄μ„œ μ™„μ „νžˆ μƒˆλ‘œμš΄ 접근이 ν•„μš”ν–ˆμŠ΅λ‹ˆλ‹€.

λŒ€μš©λŸ‰ ν΄λŸ¬μŠ€ν„°λ§μ„ μœ„ν•œ 빅데이터 ν”Œλž«νΌμ„ λ§Œλ“€λ‹€

ν΄λŸΌμ—˜μ€ 톡신 ν”„λ‘œν† μ½œ, 데이터 μ €μž₯ 관리, API 호좜, μ‹¬μ§€μ–΄λŠ” 개발 μ–Έμ–΄κΉŒμ§€λ„ μ„±λŠ₯을 μ΅œμš°μ„ μœΌλ‘œ κ³ λ €ν•˜μ—¬ μ„ νƒν•˜μ˜€μŠ΅λ‹ˆλ‹€. κ°€μž₯ μ΅œμ²¨λ‹¨ 방식을 μ‚¬μš©ν•  μˆ˜λ°–μ— μ—†μ—ˆμŠ΅λ‹ˆλ‹€. μ–΄λŠ ν•œ μ§€μ μ—μ„œ κ³Όκ±° 방식을 λ‹΅μŠ΅ν–ˆλ‹€κ°€λŠ” λ°”λ‘œ κ·Έ 지점이 병λͺ©μ΄ λ˜λŠ” 것을 μˆ˜μ°¨λ‘€ λͺ©κ²©ν•˜λ©΄μ„œ μ–΄λŠ ν•œ 지점도 μ†Œν™€νžˆ ν•  수 μ—†μ—ˆμŠ΅λ‹ˆλ‹€.

μ•ˆμ •μ„±λ„ μ€‘μš”ν•œλ°β€¦

μ„±λŠ₯에 μ£Όμ•ˆμ μ„ λ‘˜ 경우 ν•„μ—°μ μœΌλ‘œ λΆ€λ”ͺ히게 λ˜λŠ” μ•ˆμ •μ„±μ˜ 문제λ₯Ό ν•΄κ²°ν•˜λŠ” 것도 쉽지 μ•Šμ•˜μŠ΅λ‹ˆλ‹€. μ„±λŠ₯κ³Ό μ•ˆμ •μ„±μ΄λΌλŠ” μƒν˜Έ λͺ¨μˆœλ˜λŠ” κ²ƒμ²˜λŸΌ λ³΄μ΄λŠ” 이 두 λͺ©ν‘œλ₯Ό λ‹¬μ„±ν•˜λŠ” 것이 μ†Œν”„νŠΈμ›¨μ–΄ 개발의 핡심 과제인 것은 λ‹Ήμ—°ν•©λ‹ˆλ‹€.

Rustλ₯Ό 메인 개발 μ–Έμ–΄λ‘œ μ±„νƒν•˜λ‹€

이λ₯Ό μœ„ν•˜μ—¬, ν΄λŸΌμ—˜μ€ 개발 μ–Έμ–΄λ‘œ Rustλ₯Ό μ‚¬μš©ν•˜μ˜€μŠ΅λ‹ˆλ‹€. μ²˜μŒλΆ€ν„° Rustλ₯Ό μ‚¬μš©ν•œ 것은 μ•„λ‹ˆμ—ˆμŠ΅λ‹ˆλ‹€. μ„±λŠ₯κ³Ό μ•ˆμ •μ„±μ΄ λͺ¨λ‘ μš”κ΅¬λ˜λŠ” λͺ¨λ“ˆμ„ ν•˜λ‚˜μ”© Rust둜 μž¬κ°œλ°œν•˜λ‹€ λ³΄λ‹ˆ μ–΄λŠμƒˆ ν΄λŸΌμ—˜ μ†Œν”„νŠΈμ›¨μ–΄μ˜ 거의 λŒ€λΆ€λΆ„μ€ Rust둜 μž‘μ„±λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€.

μ˜€ν”ˆ ν”Œλž«νΌμ„ ν–₯ν•˜μ—¬

ν΄λŸΌμ—˜μ˜ 빅데이터 ν”Œλž«νΌμ€ μ˜€ν”ˆ ν”Œλž«νΌμ„ 지ν–₯ν•©λ‹ˆλ‹€. λ‹€μ–‘ν•œ ν™˜κ²½μ—μ„œλ„ νš¨μš©μ„ λ‚˜νƒ€λ‚΄λ„λ‘ λ°œμ „μ‹œμΌœ λ‚˜κ°ˆ κ²ƒμž…λ‹ˆλ‹€.

ν΄λŸΌμ—˜μ˜ ν˜μ‹ μ  인곡 지λŠ₯ λ³΄μ•ˆ

ν΄λŸΌμ—˜μ˜ ν˜μ‹ μ  인곡 지λŠ₯ λ³΄μ•ˆ

μ‹ μ’…κ³Ό λ³€μ’… 탐지

μž μ‹œ λ°˜μ§ν•˜κ³  λ§ˆλŠ” κΈ°μ‘΄ λ³΄μ•ˆ μ†”λ£¨μ…˜

μ–Έμ œλ‚˜ μƒˆλ‘œμš΄ λ³΄μ•ˆ μ†”λ£¨μ…˜μ€ κΈ°μ‘΄ λ³΄μ•ˆ μ†”λ£¨μ…˜λ³΄λ‹€ μ•žμ„  점을 μžλž‘ν•©λ‹ˆλ‹€. κ·Έ μ€‘μ—μ„œλ„ κ°€μž₯ μ€‘μš”ν•œ 것은 μœ„ν˜‘ νƒμ§€μ˜ λŠ₯λ ₯일 κ²ƒμž…λ‹ˆλ‹€. κΈ°μ‘΄ AλŠ” 10쒅을 νƒμ§€ν•˜λŠ”λ° μƒˆλ‘œμš΄ Bκ°€ 20쒅을 νƒμ§€ν•œλ‹€λ©΄, Bκ°€ μžλž‘ν•  λ§Œν•©λ‹ˆλ‹€. 그런데, B도 μ–Όλ§ˆ λͺ»κ°€μ„œ μ‚¬μš©μžλ“€μ—κ²ŒλŠ” μ•„μ‰¬μš΄ μ†”λ£¨μ…˜μ΄ 될 μˆ˜λ°–μ— μ—†μŠ΅λ‹ˆλ‹€. 20쒅을 λ„˜μ–΄μ„œ νƒμ§€ν•˜μ§€ λͺ»ν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

μƒˆλ‘œμš΄ μœ„ν˜‘μ„ νƒμ§€ν•˜μ§€ λͺ»ν•˜λŠ” κΈ°μ‘΄ λ³΄μ•ˆ μ†”λ£¨μ…˜

10쒅이냐 20쒅이냐 κ°œμˆ˜κ°€ μ€‘μš”ν•œ 것은 μ•„λ‹™λ‹ˆλ‹€. 계속 λ³€ν™”ν•˜λŠ” 컴퓨터 ν™˜κ²½μœΌλ‘œ μΈν•΄μ„œ 과거의 μœ„ν˜‘ μ€‘μ—μ„œ ν˜„μž¬ μ˜λ―Έκ°€ μ—†λŠ” 것도 λ§ŽμŠ΅λ‹ˆλ‹€. 더 μ€‘μš”ν•œ 것은 μƒˆλ‘œμš΄ μœ„ν˜‘μ˜ λ“±μž₯μž…λ‹ˆλ‹€. μ™„μ „νžˆ μƒˆλ‘­μ§€λŠ” μ•Šμ•„λ„ 과거의 μœ„ν˜‘μ„ 일뢀 λ°”κΎΈκΈ°λ§Œ 해도 κΈ°μ‘΄ λ³΄μ•ˆ μ†”λ£¨μ…˜μ΄ νƒμ§€ν•˜κΈ° μ–΄λ ΅μŠ΅λ‹ˆλ‹€.

μƒˆλ‘œμš΄ μœ„ν˜‘μ„ μ§€μ†μ μœΌλ‘œ 탐지할 수 μžˆμ„κΉŒ?

λ‹Ήμ—°ν•˜κ²Œλ„ μ‚¬μš©μžλŠ” μ‹ μ’…μ΄λ‚˜ λ³€μ’… 곡격을 νƒμ§€ν•˜λŠ” λ³΄μ•ˆ μ†”λ£¨μ…˜μ„ κ°€μž₯ μ›ν•©λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜, μ§€κΈˆκΉŒμ§€ μ–΄λ– ν•œ λ³΄μ•ˆ μ†”λ£¨μ…˜λ„ μ‹ μ’…μ΄λ‚˜ λ³€μ’… 곡격을 μ§€μ†μ μœΌλ‘œ νƒμ§€ν•˜λŠ” 방법을 μ œμ‹œν•˜μ§€ λͺ»ν–ˆμŠ΅λ‹ˆλ‹€. 인곡 지λŠ₯ λ°©μ‹μœΌλ‘œ μœ„ν˜‘μ„ νƒμ§€ν•˜κΈ° μ „κΉŒμ§€λŠ” κ·Έλž¬μŠ΅λ‹ˆλ‹€.

인곡 지λŠ₯, μ‹ λ³€μ’… μœ„ν˜‘ νƒμ§€μ˜ μœ μΌν•œ 방법

인곡 지λŠ₯을 λ³΄μ•ˆμ— λ„μž…ν•˜κ³ μž ν•˜λŠ” μ΄μœ λŠ” λ°”λ‘œ μ΄κ²ƒμž…λ‹ˆλ‹€. μ‹ μ’…μ΄λ‚˜ λ³€μ’… 곡격을 νƒμ§€ν•˜λŠ” 것 λ§μ΄μ§€μš”. κΈ°μ‘΄ λ³΄μ•ˆ μ†”λ£¨μ…˜μ€ μ™œ μ‹ μ’…μ΄λ‚˜ λ³€μ’… μœ„ν˜‘μ„ νƒμ§€ν•˜μ§€ λͺ»ν–ˆμ„κΉŒμš”?

κ·œμΉ™ 기반 IPSκ°€ 탐지 λͺ»ν•˜λŠ” μœ„ν˜‘ 탐지

κΈ°μ‘΄ λ³΄μ•ˆ μ†”λ£¨μ…˜ - κ·œμΉ™ 기반

인곡 지λŠ₯을 λ³΄μ•ˆμ— μ μš©ν•˜κΈ° μ „κΉŒμ§€μ˜ 거의 λͺ¨λ“  λ³΄μ•ˆ μ†”λ£¨μ…˜μ€ κ·œμΉ™ 기반으둜 μž‘λ™ν•˜μ˜€μŠ΅λ‹ˆλ‹€. 미리 μ •ν•΄ 놓은 κ·œμΉ™μ— λ“€μ–΄ λ§žλŠ” λ°μ΄ν„°λŠ” μœ„ν˜‘μœΌλ‘œ κ°„μ£Όν•˜λŠ” λ°©μ‹μž…λ‹ˆλ‹€. 이러 μ΄λŸ¬ν•œ λ°μ΄ν„°λŠ” μœ„ν˜‘μΈ 것을 μ‚¬λžŒμ΄ 미리 μ•Œκ³  μžˆλ‹€λ©΄, λ°”λ‘œ 이러 μ΄λŸ¬ν•œ 것을 κ·œμΉ™μœΌλ‘œ λ§Œλ“€μ–΄ λ†“λŠ” κ²ƒμž…λ‹ˆλ‹€. μœ„ν˜‘ 데이터 내에 νŠΉλ³„ν•œ ν‘œμ‹μ΄ ν•„μ—°μ μœΌλ‘œ λ˜λŠ” κ²½ν—˜μ μœΌλ‘œ λ‚˜νƒ€λ‚œλ‹€λ©΄, κ·Έ ν‘œμ‹μ„ κ·œμΉ™μœΌλ‘œ λ§Œλ“€κΈ°λ„ ν•˜μ˜€λŠ”λ° 이 ν‘œμ‹μ„ μ‹œκ·Έλ‹ˆμ²˜(signature)라고 λΆ€λ¦…λ‹ˆλ‹€.

μƒˆλ‘œμš΄ μœ„ν˜‘μ— λŒ€ν•œ κ·œμΉ™μ€ μ—†λ‹€

λ¬Έμ œλŠ” μ΄λŸ¬ν•œ κ·œμΉ™μ„ μ‚¬λžŒμ΄ λ§Œλ“€μ–΄μ•Ό ν•œλ‹€λŠ” κ²ƒμž…λ‹ˆλ‹€. λ”°λΌμ„œ, 해컀듀이 μƒˆλ‘­κ²Œ κ³ μ•ˆν•΄ λ‚Έ μœ„ν˜‘μ„ μ‹€μ œλ‘œ κ²½ν—˜ν•˜κ³  이λ₯Ό ν™•μ‹€ν•˜κ²Œ λΆ„μ„ν•΄μ„œ κ·œμΉ™μ„ λ§Œλ“€κΈ° 전에 κ·Έ μœ„ν˜‘μ€ 탐지가 λΆˆκ°€λŠ₯ν•©λ‹ˆλ‹€. μ΄λŠ”, ν•œλ§ˆλ””λ‘œ, μƒˆλ‘œμš΄ μœ„ν˜‘μ€ 탐지 λΆˆκ°€λŠ₯ν•˜λ‹€λŠ” 말과 κ°™μŠ΅λ‹ˆλ‹€.

미리 μ •ν•΄ 놓은 κ·œμΉ™ λŒ€μ‹  인곡 지λŠ₯으둜 탐지해야

λ°”λ‘œ 인곡 지λŠ₯이 ν•„μš”ν•œ μ΄μœ μž…λ‹ˆλ‹€. 인곡 지λŠ₯ μ€‘μ—μ„œλ„ 비지도 ν•™μŠ΅ 방식이 ν•„μš”ν•œ μ΄μœ μž…λ‹ˆλ‹€. 비지도 ν•™μŠ΅ ν΄λŸ¬μŠ€ν„°λ§μ€ 비정상 탐지에 κ°€μž₯ μ ν•©ν•œ 인곡 지λŠ₯ λ°©μ‹μž…λ‹ˆλ‹€. ν΄λŸ¬μŠ€ν„°λ§μ˜ μ€‘μš”ν•œ λͺ©μ  쀑에 ν•˜λ‚˜κ°€ 아웃라이어, 즉 비정상을 κ°€λ €λ‚΄λŠ” 것이기도 ν•©λ‹ˆλ‹€.

Clumit Security - μ œλŒ€λ‘œ 된 μ‹ λ³€μ’… μœ„ν˜‘ 탐지 μ†”λ£¨μ…˜

ν΄λŸΌμ—˜μ˜ 인곡 지λŠ₯ λ³΄μ•ˆ μ†”λ£¨μ…˜ ν΄λŸΌμž‡μ€ μƒˆλ‘œμš΄ μœ„ν˜‘ 탐지에 κ°€μž₯ μ ν•©ν•œ μ†”λ£¨μ…˜μž…λ‹ˆλ‹€. λͺ¨λ“  λ³΄μ•ˆ λ‹΄λ‹Ήμžκ°€ 늘 μ›ν•˜λŠ” λ°”λ‘œ κ·Έ μ‹ λ³€μ’… μœ„ν˜‘ 탐지 κΈ°λŠ₯을 ν΄λŸΌμž‡μ΄ μ œκ³΅ν•©λ‹ˆλ‹€.

λ³΄μ•ˆ μ „λ¬Έκ°€ λ˜λŠ” μ‚¬μš©μžμ™€ μ‘°ν™”

λ³΄μ•ˆ μ†”λ£¨μ…˜μ˜ κ²°κ³ΌλŠ” μ‚¬λžŒμ΄ 확인해야

μ–΄λ–€ λ³΄μ•ˆ μ†”λ£¨μ…˜μ΄λΌλ„ νƒμ§€ν•œ κ²°κ³Όλ₯Ό μ‚¬λžŒμ΄ ν™•μΈν•˜μ§€ μ•Šμ„ μˆ˜λŠ” μ—†μŠ΅λ‹ˆλ‹€. μƒˆλ‘œμš΄ μœ„ν˜‘μ΄λΌλ©΄, 인곡 지λŠ₯을 ν™œμš©ν•œ 것이라면 λ”μš± κ·ΈλŸ¬ν•©λ‹ˆλ‹€.

인곡 지λŠ₯ λ¨Έμ‹ λŸ¬λ‹μ€ μ‚¬λžŒμ΄ 관리해야

인곡 지λŠ₯, κ·Έ μ€‘μ—μ„œλ„ λ¨Έμ‹ λŸ¬λ‹μ€ κ³Όκ±° 데이터λ₯Ό ν•™μŠ΅ν•œ κ²ƒμ΄λ―€λ‘œ 논리가 μ•„λ‹ˆλΌ κ²½ν—˜μ— κ·Όκ±°ν•©λ‹ˆλ‹€. κ³Όκ±° κ²½ν—˜μ΄ λͺ¨λ‘ λ§žλ‹€κ³  λ³Ό 수 μ—†μœΌλ―€λ‘œ λ¨Έμ‹ λŸ¬λ‹μ˜ κ²°κ³Όλ₯Ό μ™„μ „νžˆ μ‹ λ’°ν•  수 μ—†μŠ΅λ‹ˆλ‹€. 비지도 ν•™μŠ΅μ€ 지도 ν•™μŠ΅μ— λΉ„ν•˜μ—¬ λ”μš± μ‚¬λžŒμ˜ κ°œμž…μ„ ν•„μš”λ‘œ ν•©λ‹ˆλ‹€.

인곡 지λŠ₯의 결과에 인간 지성을 더해야 ν•œλ‹€

비지도 ν•™μŠ΅μ˜ 결과둜 μ œμ‹œλœ μƒˆλ‘œμš΄ μœ„ν˜‘ 후보듀은 μ‚¬λžŒμ΄ ν™•μΈν•΄μ•Όλ§Œ λΉ„λ‘œμ†Œ μƒˆλ‘œμš΄ μœ„ν˜‘μœΌλ‘œ 확정될 수 μžˆμŠ΅λ‹ˆλ‹€. 이 λŒ€λͺ©μ—μ„œ λ§Žμ€ μ‚¬μš©μžλ“€μ΄ λΆˆνŽΈν•¨μ„ λŠλ‚λ‹ˆλ‹€. 인곡 지λŠ₯이라면 μ‚¬λžŒλ³΄λ‹€ λ›°μ–΄λ‚˜μ•Ό λ˜λŠ” 것 μ•„λ‹Œκ°€ ν•˜λŠ” 관념 λ•Œλ¬Έμž…λ‹ˆλ‹€. 인곡 지λŠ₯이 λ•Œλ•Œλ‘œ λ˜λŠ” λŒ€λΆ€λΆ„μ˜ κ²½μš°μ— μ‚¬λžŒλ³΄λ‹€ λ›°μ–΄λ‚  수 μžˆμ§€λ§Œ κ·Έλ ‡λ‹€κ³  인곡 지λŠ₯이 μ–Έμ œλ‚˜ λ§žλŠ” 것은 λ‹Ήμ—°νžˆ μ•„λ‹™λ‹ˆλ‹€. κ²½ν—˜μ— κΈ°λ°˜ν•˜λŠ” 인곡 지λŠ₯은 νƒœμƒμ μœΌλ‘œ 100% μ‹ λ’°ν•  수 μžˆμ§€ μ•ŠμŠ΅λ‹ˆλ‹€.

μΈκ°„μ˜ κ°œμž…μ΄ λΆˆνŽΈν•˜μ§€ μ•Šλ„λ‘ μ‘°ν™”λ‘­κ²Œ

μ‚¬λžŒμ΄ κ°œμž…ν•  ν•„μš”κ°€ 없도둝 ν•  μˆ˜λŠ” μ—†μœΌλ―€λ‘œ, μ‚¬λžŒμ΄ νŽΈλ¦¬ν•˜κ³  효율적으둜 κ°œμž…ν•  수 μžˆλ„λ‘ ν•˜λŠ” 게 λͺ©ν‘œκ°€ λ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€.

ν΄λŸΌμ—˜μ˜ 인곡 지λŠ₯ λ³΄μ•ˆ μ†”λ£¨μ…˜ ν΄λŸΌμž‡μ€ μ‚¬μš©μžκ°€ μƒˆλ‘œμš΄ μœ„ν˜‘ 후보듀을 효과적으둜 μ‚΄νŽ΄λ³΄κ³  νŒλ‹¨ν•  수 μžˆλ„λ‘ λ‹€μ–‘ν•˜κ³  νŽΈλ¦¬ν•œ κΈ°λŠ₯을 μ œκ³΅ν•©λ‹ˆλ‹€.

인곡 지λŠ₯κ³Ό 인간 μ§€μ„±μ˜ μ‘°ν™”κ°€ λ°”λ‘œ ν΄λŸΌμ—˜μ΄ μΆ”κ΅¬ν•˜λŠ” κ°€μΉ˜μž…λ‹ˆλ‹€.