알파고와 보안 Etc



알파고와 이세돌 9단의 대국이 4:1 로 끝나서 사람들의 AI 포비아가 조금은 가라 앉을 것 같아 다행이다.
5:0 이었으면 한계를 알수 없는 거대한 벽이라고 느껴서 AI포비아가 극심했을 텐데
1번이라도 이기니, 어느정도 수준인지 감도 오고, 한계점도 느껴지니 말이다. 

그래도 알파고 쇼크로 인해 각 분야에서 인공지능에 대한 논의가 활발해 질 것 같은데..
원래 몸담았던 보안 (정보보호) 분야에서의 인공지능의 의미를 생각해 본다.
인공지능과 보안과의 관계는 크게 Security from AI, Security of AISecurity by AI 로 나눌 수 있겠다.
Security from AI는 사람들이 가장 크게 걱정하는 AI에 의한 부작용을 방지하는 것이다.
알파고와 보안 이란 주제에 대해서도 사람들이 우선 생각하는게 이 주제일 것이다. 
인공지능자체가 사람에게 피해를 주지 못하게 컨트롤하는 것이 누구나 우선 생각할 수 있는 분야인 것 같은데, 
사실 이건 좀 먼 얘기지 싶다. 인공지능의 윤리 문제는 바로 당장의 문제이긴하다. 
지능 주행 자동차가 보행자를 보호할 것인가 운전자를 보호할 것인가 선택해야 한다면
어떻게 프로그램해야 할 것인가.. <= 대표적 윤리 문제가 아닐까 싶다. 
한편 위에서 말한 인공지능의 부작용 방지라는 측면은 강인공지능과 약인공지능에 대해 구분해서 생각해 볼 수 있겠다.

Security of AI는 인공지능 시스템을 공격으로부터 보호하는 것으로 인공지능시스템이 바이러스에 감염되어 피해를 주거나, 해커에 의해 조종되거나 인공지능 시스템에 대한 DOS공격 등  지금  발생하는 모든 정보보안 문제가 인공지능 시스템에도 그대로 해당될 수 있다.

Security by AI는 AI기술을 보안에 활용하는 것으로 지금도 많이 활용되고 있다. 
바이오인증에 머신러닝기술을 쓰는 건 물론이고, 악성코드탐지, 침입탐지, DDOS탐지, 이상거래 탐지 등 anomaly detection 분야에서 머신러닝은 많이 쓰이고 있다. 지금 단계에서는 가장 주목해야 할 부분이다.

Security를 조금 벗어나 핀테크 분야로 가면, 빅데이터기반 비대면 본인확인(이건 보안이지만), 로보어드바이저, 신용평가=대출위험예측 (이것도 실은 보안?) 등 다양한 분야에 대해 Fintech by AI가 생각될 수 있을 것이다.

이런 분류를 기준으로 우선 이슈만 나열을 해본다.

Security from AI (그래도 당장은 아닌듯)
=> 시나리오 : 수많은 영화

- 악의적인 인공지능의 출현 방지 및 제어 : 최소 강인공지능 수준에서 생각해볼 문제, 악의적이라는 것은 사람의 기준,
   그냥 지구를 평화롭게 하려고 인류를 말살할 수도.
- 부여된 미션을 달성하기 위해 최선을 다하는 약인공지능 : 학습과 진화를 하는 인공지능과 나노기술이 결합되었을 때,
   지구 상의 모든 자원을 자신의 컴퓨팅파워향상에 투하할수도
  예) 알파고가 바둑을 잘두기 위해 컴퓨팅 파워를 자체적으로 확대하게 프로그램되어 있다면.

Security of AI  (지금도 이슈)

=> 시나리오: 공항의 얼굴인식시스템이 나를 테러리스트로 인식, 자율주행차가 쳐박음, 의료 AI의 오진/수술실패
 <= 사실 이런 부분은 AI자체의 정확도에 따른 문제와 악의적인 공격자에 의해 이런일이 발생하는 것을 구분해서 말해야한다. 

- Malious code 에 감염: AI SW 자체의 위변조 => 어떤 상상도 가능
- 해커가 제어권 획득 : 코드 보안성 취약 등으로 해킹되어 오동작을 일으킬 경우나 입력데이터에 이상한 값을 주는 경우,
  딥러닝 등의 AI 구성 요소는 답이 나오는 이유 자체를 알 수 없기 때문에, 어디가 문제가 생겼는지 알기 어려움
- DDos 공격 : AI시스템을 대상으로한 DDOS공격, 엉뚱한 데이터를 입력으로 주면, 시스템이 폭주할 수도.
- 일반 버그와는 다름 : 로직 오류가 아니고 특정한 학습데이터가 오류를 유발함. 이건 버그라고 부를 수도 없는 문제

Security by AI (가장 주목해야할 분야?!)

- 바이오 인증 : 이미 기존 머신러닝 기술은 많이 사용하고 있는데, 타 분야에 비하면 딥러닝 기술의 사용은 아직 적음
  (나는 뇌파인증, 화자인증, 동적서명인증 등에 딥러닝 기술을 활용 중인데, 기존 SVM등에 비해 괄목할 성능 향상을 경험하고 있다. 그 와중에 히든싱어 프로젝트 [기사] 도 하게 되었고.. => 알파귀의 탄생 ?)
  * 사용기술:  Classification, reinforcement learning, adaptive learning 
- Anomaly detection : 악성코드탐지, 침입탐지, DDOS탐지, 이상거래 탐지, 피싱파밍 탐지, 보이스피싱 탐  
  <= 이미 머신러닝기술을 많이 사용하고 있지만, 이쪽도 딥러닝 기술의 사용은 거의 없다시피함. 
     이유는 one class classification을 할 수 있는 딥러닝 구조가 없었기 때문.. 그런데 내가 하나 찾아냄 ^^ 

Fintech by AI (구체적으로 생각나는 응용)

- 빅데이터기반 비대면 본인확인 :  데이터에 기반 본인여부 & 명의 도용  여부를 판단, 이상거래 탐지와 밀접
- 로보  어드바이저 (트레이더) : 보안과 거리가 가장 멈, sequential data 예측.. <= 가장 돈이 되는 분야 ?
- 신용평가=대출위험예측 : 현 단계에선 가장 높은 성능을 보일 수 있는 분야.. 답이 명확하고, 학습데이터가 많고. 클래스간 데이터 균형도 양호


한편, AI (특히 머신러닝)가 적합한 문제의 성격을 알아보면.. 

1. 답이 명확하다.  
   바둑같은 보드 게임은 명확하다. 
   보안에서 정상, 비정상 ? => 말은 쉬워도 이게 구분이 쉽지 않다.  
   본인이다 아니다 -> 이건 명확,  
   대출 사고 확률 -> 명확

2. 데이터가 충분하다. 
   여기서 데이터는 주로 답이 붙어있는 데이터를 말한다. 비지도학습은 쉽지 않고 성능도 그닥.. 
   비정상 데이터를 구하기는 어렵다. 그리고 비정상 데이터는 기존 데이터가 쓸모없는 경우가 많다.(새로운 침입/공격/사기 패턴)
   데이터를 만들어야 하는 경우, 사람이 정확하게 답을 붙일 수 있어야 한다. 
   빅데이터 얘길 많이 하는데, 빅데이터 중 이런 조건을 충족하는 데이터는 또 많지 않다.

위의 2가지 조건만 충족되는 문제라면.. 보안분야의 어떤 문제든 인공지능(머신러닝) 기법을 시도해 볼 수 있다. 


  



덧글

  • 미스타강 2016/04/16 13:03 # 삭제 답글

    '보안에서 정상, 비정상 ? => 말은 쉬워도 이게 구분이 쉽지 않다.' 저도 같은 생각입니다만.. 너무 입맛 당기는 떡밥이라
댓글 입력 영역