[김정민 변호사의 IT와 법] AI 혁신과 미래의 사업기회①
상태바
[김정민 변호사의 IT와 법] AI 혁신과 미래의 사업기회①
  • 김정민 변호사
  • 승인 2020.09.19 10:37
  • 댓글 0
이 기사를 공유합니다

경영자가 꼭 알아야 할 AI에 대한 기본 지식들
현대의 경영자는 AI 알고리즘을 이해해야 한다
김정민 변호사
김정민 변호사

[김정민 변호사] 지난해 손정의 소프트뱅크 회장이 문재인 대통령 앞에서 AI(인공지능)를 강조하기 이전부터 'AI 혁신'은 모든 기업의 화두였다. 당시에는 조금 먼 미래라고 생각하는 것이 일반적이었으나, 그로부터 1년이 지난 지금, 업종을 불문하고 AI를 먼저 도입하기 위한 경쟁이 치열하다.

렇다면 모든 기업이 하고 싶어 하는 AI 혁신은 어떤 구조와 절차를 통해 이루어지고, 각 단계에서 기업은 어떤 역량과 전략을 갖추어야 하는지 궁금해진다. 이를 화두로 3회에 걸쳐 얘기해볼까 한다.
 
AI가 해결할 수 있는 문제

산업시대의 사업가와 과학자들은 과거에는 문제가 발생하면 그 해결방법을 고민하고, 해결방법이 찾아지면 그것을 구현할 기술을 찾아 적용했다. 과거의 혁신은 대부분 이런 순서로 이루어졌다. 그러나 디지털 혁신에 와서는 ‘디지털 혁신을 해야 한다’는 당위가 앞서고, 기술의 발달에 맞춰서 해결할 문제를 찾아 기업을 혁신하는 모습이 종종 나타났다.

'AI 혁신' 시대에서는 디지털 혁신에서 한걸음 더 나아가 반대 방향의 접근 방식이 보편화되어 있다. 추상적으로 바라보면 AI가 할 수 있는 일이 무궁무진해 보인다. 그러나 구체적으로 어떤 일을 잘 하는지, AI가 해결할 수 있는 문제인지를 판단하기 위해서는 AI에 관한 기술적인 이해가 필수적이다. 따라서 AI 혁신은 AI 기술에 관한 이해를 기초로 'AI가 해결 할 수 있는 문제'를 찾아 적합한 데이터 정제와 AI 알고리즘을 적용하는 방향으로 진행된다.

과거 혁신에서는 사업가의 상상력과 기획력이 중요했고, 그 상상력을 기술이 뒤따라갔다. 그러나 AI 혁신에서는 기술적 이해가 중요하고, 이것이 없이는 한 발짝 나아가기 힘들다. 해결하고자 하는 문제에부터 접근하기 보다는 AI의 기능을 먼저 이해하는 것이 AI 혁신의 시작이다.
 
해결해야 할 문제가 생겼다고 해서, 이를 해결하는 AI 알고리즘을 쉽게 개발할 수는 없다. 이미 정립되고 효과가 검증된 AI 알고리즘, AI의 보편적 기능을 이해한 후 기업의 구조와 데이터를 바라보면, 해결할 수 있는 수 많은 문제가 보이기 시작할 것이다. 여기서부터 AI 혁신이 시작된다.

AI의 기능( Function )

AI의 기본 기능은 인식, 예측, 자동화, 소통, 생성이다. 인간의 '감각과 뇌' 기능과 거의 비슷한데, 인간처럼 이미지(눈), 소리(귀), 냄새(코), 맛(혀), 촉감(피부) 등 오감을 ‘인식’하고, 인식한 데이터를 기초로 학습하고 사고하여 미래를 ‘예측’한다. AI가 가장 잘하는 것은 인간이 해온 모든 것을 로봇이나 프로그램으로 ‘자동화’하는 것이다. 인간이 하는 고비용 저효율 업무부터 점차 자동화해오고 있다.
 
미래 AI의 핵심 기능은 '소통'과 '생성'이 될 것이다. AI라고 하면 딱딱한 로봇과 컴퓨터 프로그램을 먼저 떠올리게 되는데, 이런 기계가 이제는 인간과 대화하며 ‘소통’하고, ‘창조적인 생산’을 할 수 있게 되었다. AI가 하는 대화, AI가 생성한 결과물을 인간의 것과 구별하는 것이 쉽지 않은 일이 되었고, 미래에는 AI가 인간을 대체할 수도 있지 않을까 생각되기도 한다.

AI 알고리즘(Algorithm)의 이해와 활용

AI의 기능이 이해하기 쉽고 보편적이라면, AI 알고리즘은 이해하기 복잡하고 개별적이다. AI 알고리즘은 종류가 다양할 뿐만 아니라 기능과 장단점이 각기 다른데, 지금까지 개발된 알고리즘은 특정 문제를 해결하기 위해서 만들어진 것들이 대부분이다. 때문에 성격이 다른 문제 해결에 이를 적용하는 것은 쉽지 않을 뿐만 아니라 좋은 해결책이 되지 못하는 경우도 있다.
 
문제를 해결하는 최적의 알고리즘을 선택하고 적용하는 것은 컴퓨터 전문가의 영역이므로 경영자나 기획자가 이해하고 선택하기도 쉽지 않다. 주위에 믿고 맡길 훌륭한 컴퓨터 전문가가 있다면 그만이지만, 그렇지 않다면 경영자는 AI 알고리즘의 트렌드와 각 알고리즘의 개괄적인 내용 정도는 파악하고 있어야 한다. 적어도 '일반화'되어 있는 핵심 AI 알고리즘은 기술적 내용까지 이해하고 숙지할 필요가 있다.

최적의 알고리즘을 선택하기 위해서는 해결하려는 문제의 데이터의 양, 학습방법 그리고 정확도와 속도 중 무엇이 중요한지 등을 먼저 파악하는 게 필요하다. 이 기본 내용을 기준으로 알고리즘을 선택하고, 샘플을 돌려보고, 그 결과값을 다시 분석하여 알고리즘을 교체하거나 수정·보완해야 한다. 주요 알고리즘의 특성과 장단점을 이해하고 있다면 이 과정을 상당히 단축할 수 있다.

AI 혁신을 하는 가장 빠른 방법은 AWS(Amazon Web Service: 아마존이 제공하는 클라우드 서비스) 등 클라우드에서 제공하는 AI API(Application Program Interface)를 이용하는 것이다. AWS는 Personalize(소비자 맞춤형 추천 서비스), Polly(텍스트 음성 변환 서비스), Rekognition(이미지, 비디오 분석 서비스), Lex(음성, 텍스트를 이용한 챗봇 서비스) 등 기본적인 AI 서비스를 모두 제공하고 있다.

그러나 클라우드에서 지원하는 AI 서비스는 일반적 기능으로 개발된 것이어서 구체적인 맞춤형 서비스를 제공하기 어렵다. 이를 보완, 최적화해서 사용할 수 있어야 하는데 이러한 응용개발은 힘들고 비용이 많이 드는 작업이다. 또한 클라우드에서 제공하는 AI 서비스는 저렴하긴 하지만 유료 서비스인 경우가 많고, 사용자나 데이터가 늘어나면 지불해야할 비용이 부담스러울 수 있다. 

대표적인 AI 알고리즘( Algorithm )

AI 알고리즘 중 가장 유명한 것은 머신러닝(Machine Learning, 기계학습), 딥러닝(Deep Learning)이다. 머신러닝은 기계(Machine)가 방대한 데이터를 학습(Learning)하여 패턴, 상관관계를 찾아내고, 이상을 감지하고, 미래를 예측하거나 최적의 값을 추론하는 것을 말한다. 학습을 통해 찾은 패턴, 상관관계를 기반으로 새로운 입력값에 대한 결과(패턴, 이상감지, 예측)를 도출한다. 예측(추론) 기능이 있는 대부분의 AI 서비스는 머신러닝을 기반으로 한다. 

스마트폰 기반의 휴대용 현미경 카메라인 ‘엔트러피 솔루션’.
스마트폰 기반의 휴대용 현미경 카메라인 ‘엔트러피 솔루션’.

‘엔트러피(Entrupy)’는 명품의 진위를 실시간으로 판별해주는 앱인데, 머신러닝을 적용한 좋은 예이다. 진품과 모조품 300만개의 이미지를 학습하여 패턴 및 상관관계를 정립하였고, AI 스캐너로 새로운 데이터를 입력하면 15초 내에 98% 정확도로 진품여부를 추론한다. 가죽 표면을 고해상도 사진으로 찍고 260배 확대하여 육안으로 확인 불가능한 비정상적인 패턴, 잔주름, 페인트 칠 등을 수치화하여 진품의 패턴과 같을 확률을 계산하고 이 확률이 특정값 이상이면 진품이라고 판단하는 알고리즘을 갖추고 있다.

머신러닝은 세부적으로 지도(Supervised)학습, 비지도학습, 강화(Reinforcement)학습으로 분류할 수 있다. 

지도학습은 훈련 데이터를 학습하여 학습결과를 기반으로 예측을 수행하는 알고리즘이다. 기계가 학습할 데이터는 인간이 먼저 분류하고 설명을 태깅 또는 라벨링(Tagging or Labeling, 옷에 설명하는 Label, Tag가 붙어 있는 것과 같다)하여야 한다. 각 고양이, 강아지로 태깅된 사진(훈련 데이터)을 학습을 한 후, 새로운 사진이 입력되면 고양이인지 강아지인지 예측하는 것이다.

지도학습의 흔한 목표는 분류(Classification), 회귀(Regression), 예측(Forecasting)인데, 사진을 강아지와 고양이로 ‘분류’하는 것, 진품과 가품을 ‘분류’하는 것, 과거의 연속된 값을 함수로 ‘회귀’하여 다음 값을 예측하는 것, 과거와 올해 매출을 기반으로 내년도 매출을 ‘예측’하는 것 등이 그 예이다.

이와 반대로 인간의 지도가 없이 기계가 알아서 주어진 데이터 사이의 패턴과 유사성, 특성을 학습하여 분류하고 결론까지 도출하는 것이 비지도학습이다. 지도학습은 인간이 지도한 내용대로의 결론을 도출하는 반면, 비지도학습은 어떤 결론을 도출할지도 예측이 어렵다.

비지도학습의 방법으로 클러스터링(Clustering)과 차원 축소(Dimension Reduction)라는 분류 알고리즘이 있는데, 특정기준에 따라 유사한 데이터를 일단 세트로 클러스터(그룹)화하고 고유한 패턴을 찾기 위해 개별 클러스터(그룹)내에서 분석을 수행한다. 차원 축소(Dimension Reduction)는 고려 중인 변수의 개수를 줄이는 작업이다. 원시 데이터는 다차원의 특징(결과에 영향을 미치는 요소가 다양함)을 갖는데, 일부 특징들은 중복되거나 결과값에 영향이 거의 없어, 이런 차원을 줄이면서 핵심 요소와의 관계를 발견하게 된다.

또 강화학습은 알고리즘이 다양한 시도를 스스로 하면서 최적의 결과값을 찾아가는 것이다. 지도학습, 비지도학습이 이전 데이터로 미리 예습을 하고 실전에 들어가는 것이라면, 강화학습은 바로 실전에 투입되어 실시간 데이터로 학습과 추론, 가설 수정을 한다. 좋은 결론이 나오면 보상을, 나쁜 결론이 나오면 벌을 주는 형태(보상 시스템)로 실전경험을 쌓다보면, 좋은 결론을 스스로 찾아가게 된다. 강아지는 인간의 ‘앉아’, ‘일어서’라는 명령의 뜻을 알지 못하지만, ‘앉아’라는 명령을 듣고 머뭇머뭇하다가 앉는 동작을 하면 주인이 먹이라는 보상을 주며 학습시킬 수 있다. 강화학습이 유사한 원리로 동작한다.

지도학습과 강화학습의 차이를 이해할 수 있는 좋은 예가 ‘알파고’와 ‘알파고 제로’이다. 이세돌과 세기의 바둑 대결을 한 ‘알파고’는 16만 건의 기보를 지도학습하고 이후 가상대국을 통해 강화학습을 한 케이스이다. 이후 나온 ‘알파고 제로’는 지도학습 없이 강화학습만 하였는데, 두 달도 되지 않아 ‘알파고’를 이겼다. ‘알파고 제로’는 인간의 지도가 없이 여러 가능성을 스스로 판단하므로 인간이 생각하지 못한 창의적인 포석도 할 수 있는 장점이 있다.

인공신경망에 대해

AI에 있어서 가장 어려운 개념 중 하나가 딥러닝이다. 딥러닝은 인간의 뇌세포를 모방한 인공신경망(ANN, Artificial Neural Network)을 활용하는 머신러닝이다. 기본적으로 강화학습에 가깝다. 인간의 신경망은 뉴런 여러 층(layer)이 연결되어 있는 형태인데 각 뉴런 사이의 연결고리(시넵스)에서 입력값을 받아 가공(가중치, 편향 연산)하여 출력값을 생성하고 다음 뉴런의 입력값으로 넣는다(입력값을 여러 개 받을 수도 있고, 출력값을 여러 개로 분기할 수 있음). 인공신경망은 입력노드(첫 뉴런), 은닉노드(중간 시넵스), 출력노드(마지막 뉴런)로 구성되는데, 은닉노드가 많을수록 노드 사이에 분기가 많을수록 복잡한 신경망이 된다.

인공신경망의 기본 원리
인공신경망의 기본 원리

바둑을 예로 들면, 프로 기사들은 20수에서 50수 정도를 예측하고 바둑을 둔다고 알려져 있는데, 내가 여기 돌을 놓으면, 상대방은 저기에 돌을 놓을 것이고 …. 이런 과정이 20번 반복되는 것을 예측한다는 것이다. 10수를 내다본다고 가정했을 때, 각 수마다 3가지의 선택지가 있다면, 3의 10제곱 즉 5만9049가지 경우의 수를 판단해야 한다. 내가 두는 3가지 수에 관해서 상대방이 각각에 3가지 수를 선택할 수 있으면 3X3 총 9가지 경우의 수를, 이렇게 한 번 더 반복하면 3X3X3X3 총 81가지 경우 중 가장 승리 확률이 높은 선택을 해야 한다. 프로 기사가 모든 경우의 수를 모두 같은 가중치를 두어 생각하지는 않겠지만, 10수를 내다보는 행위는 산술적으로 6만 가지 경우를 고려해야 한다는 것이다.
 
이런 부류가 딥러닝이 잘 해결할 수 있는 문제인데, 입력노드에서 가장 좋은 수 3가지를 찾아 분기하고 다시 이길 확률을 연산하여 각각 3가지 가장 좋은 수로 분기하는, 그렇게 하여 히든노드 10개를 거치면 10수를 내다보는 인공신경망을 만들 수 있다. 이 강화학습을 10번 반복하는 것으로 설명하기도 하는데, 가중치와 편향연산을 제외한다면 대체로 맞는 설명이다.

최고의 바둑기사 이세돌을 고민에 빠뜨리게 한 알파고. 사진= 연합뉴스
딥러닝 인공지능(AI) 알파고와 대국하는 이세돌 9단이 고민에 빠져있다. 사진= 연합뉴스

딥러닝은 인간이 판단 기준을 미리 정하지 않아도 컴퓨터가 스스로 인지, 추론, 판단할 수 있어 음성, 이미지 인식에 활용되었다. 나아가 넷플릭스와 아마존은 고객이 다음에 무엇을 볼지, 무엇을 구매할 지를 예측하여 추천하는 알고리즘을 상용화하였다. 현재는 화가의 화풍을 모방하여 새로운 그림을 그리는 것에까지 영역을 넓히고 있다. 실제 딥러닝의 이미지 인식의 정확성은 인간과 비슷한 수준이고 앞으로 인간을 넘어설 것이다.
 
딥러닝에 사용되는 인공신경망은 심층 신경망(DNN, Deep Neural Network), 합성곱 신경망(CNN, Convoultional Neural Network), 순환 신경망(RNN, Recurrent Neural Network), 제한 볼츠만 머신(RBM, Restricted Boltzmann Machine), 심층 신뢰 신경망(DBN, Deep Belief Network) 등 다양하다. 경영자나 기획자들도 딥러닝의 기초를 이해한 후 기계가 기계학습을 하듯 차근차근 학습해볼 필요가 있다.

현재 최고의 관심사는 자율주행에 이용되는 인공신경망이다. 자율주행이 완성되기 위해서는 자동차 스스로 인지, 판단, 제어를 할 수 있어야 한다. ‘인지’는 자율주행 자동차에 부착된 카메라, 레이더(전자파를 방사하여 물체의 표면으로부터 반사되는 반사파를 감지하는 장치), 라이다(레이저를 방사하여 물체 표면으로부터 반사되는 레이저를 감지하는 장치)가 주는 정보(이미지)를 차선, 차량, 보행자, 신호등 신호, 도로표지판 등으로 인식하는 것인데, 사실상 인간의 정확도를 뛰어넘고 있다.

‘판단’과 ‘제어’는 조금 다른 영역인데, 일상적인 상황에서 판단과 제어는 대다수 자율주행 기술이 거의 완벽하게 동작하므로 극단적인 상황에 대한 대처(판단과 제어)를 잘하는 것이 매우 중요하다.

테슬라는 2012년부터 자동차를 판매하여 누적 100만대를 넘었고, 8년 동안 실주행 데이터를 통해 판단, 제어 알고리즘을 개선해왔다. 테슬라는 실주행 데이터에서 주어진 특수한 상황(rare case)에 대해 최적의 대처방법을 학습해왔고, 심지어 인간의 여러 대처 방법을 분석하여 좋은 방법을 차용하는 경우도 있다. 자율주행 기술에서 10수 이상을 내다보는 판단과 제어가 쉬운 일은 아니나 인공신경망과 빠른 데이터처리 능력을 동원하여 성능이 점점 향상되고 있다. ②에서 계속

● 김정민 변호사는 서울대에서 컴퓨터공학, 법학(부전공)을 공부했다. 4회 변호사시험에 합격했으며 IT기업 준법팀장을 거쳐 법무법인 로베이스 파트너변호사로 있다. 대한변호사협회 IT블록체인특위 대외협력기획 부위원장, 서울지방변호사회 기획위원회 위원, 한국블록체인법학회 정회원이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.