본문 바로가기
미래기술/Artificial Intelligence

결국은 AI Agent

by DeungZan 2024. 12. 11.

1986년, 국민학교 6학년 때 생애 처음으로 컴퓨터라는 것을 봤다.

 

이승호 라는 당시 절친의 집에 놀러갔다가 TV나 신문에서나 보던 컴퓨터를 처음으로 보게 된 것이었는데,

그 당시만 해도 참 먹고 살기 힘든 시절이기도 했거니와 자동차라는 것도 이제 막 보급되기 시작했던터라 사무용이 아닌 가정용, 개인용 PC를 집에서, 그것도 어린이가 갖기란 정말 쉽지 않았다.

친구 집에서의 모습은 대충 이런 모습이었던 듯 싶다...^^

 

지금 생각하면 너무 웃긴 이야기인데,,

컴퓨터를 보면서 승호에게 내가 부탁했던 건 "오정윤(당시 우리 반에서 인기가 많았던... 그리고 나와 지금 말로 썸을 타던)이 지금 누구를 좋아하는지 컴퓨터에게 물어봐죠." 였다.

지금 생각하면 너무도 순진무구한 질문이었는데, 이 질문에서 되짚어보면 컴퓨터라는 개념에 대해서 나는,

   1) 컴퓨터 = 무엇이든 알고 있을 것

                   (빅데이터

   2) 컴퓨터 = 말로 하던, 텍스트로 하던 상호 대화가 가능한 인터페이스가 있을 것

                   (AI 인터페이스) 

   3) 컴퓨터 = 나에 대해 알고 있고, 내가 원하는 것을 수행해 줄 수 있을 것

                   (AI  에이전트)

   4) 컴퓨터 = 전지 전능한 신처럼 나 뿐 아니라 모든 이의 얘기를 듣고 기록하고 있을 것

                   (클라우드, 네트워킹)

 

이렇게 이해하고 있었던 듯 싶다.

디지털 혹은 컴퓨터에 대한 리터러시(Digital Literacy: 디지털 환경 그 자체를 이해하고 있거나, 디지털 환경이 제공하는 다양한 기술, 기기에 대한 활용 역량 등)가 거의 없었던 시절이기에 가능했던 발상이기도 했지만, 어찌보면 컴퓨터라는 전자기기를 떠올리면 인간으로서 상상할 수 있거나 요구(Demand or Need)할 수 있는 최대치가 아니었나 생각해 본다.


2005년, Semantic Web이란 단어를 처음 접하게 된다.

 

Blog, UCC로 대변되는 사용자 참여형, 집단지성 기반의 Web 2.0 패러다임이 Well-Being이란 키워드와 더불어 사회, 문화의 주류로 형성되어 갈 즈음 Semantic Web은 Web 2.0 이후 새로운 패러다임을 이끌어 갈 키워드가 될 것이라는 전망이 인터넷 산업의 리더들에게서부터 들 불처럼 번져갔다. 

- Semantic Web은 2001년 WWW(World Wide Web)의 아버지라 불리우는 팀 버너스리(Tim Berners-Lee)와 그의 동료들이 공동 저술한 논문에서 처음 등장한 개념으로 'Semantic Web은 Web을 단순히 정보의 저장소로 사용하는 것을 넘어 의미를 이해하고 데이터를 지능적으로 처리할 수 있는 웹으로 발전시키는 것을 목표로 한다'고 정의한다. 

- 이 단락에서 언급한 Web 3.0은 블록체인 기술을 활용하고 데이터의 자기주권화(Self-Sovereign) 중심의 Web 3와는 개념적으로 다르며, W3C에서는 공식적으로 Web 3를 인정하고 있지는 않은 상황이다. (때문에 블록체인 기업들이 말하는 Web 3라는 개념은 인터넷(Web)의 다음 세대를 지칭하는 키워드로 공식화 되어 있지는 않다.)

 

Semantic Web은 쉽게 설명하면 자연어 검색(Natural Language)의 진화 모델로 온톨로지(Ontology) 기반으로 검색자의 의도(Intention)을 분석하여 검색 결과를 제공하는 극단적인 개인화 검색 서비스의 기반 기술이라 할 수 있다.

 

Web이란 매체가 생기고 다양한 비즈니스 모델이 탄생하면서 그 극단의 서비스 모델에는 향상, '초개인화(Hyper-Personalization)'가 있었고 검색을 업으로하는 기업들은 당연히 Semantic Web을 기술과 서비스 관점에서 궁극적으로 추구해야 하는 이상향으로 삼았을터이다. 그런데, 지금 생각해보면 2005년 그 당시에는 인공지능은 고사하고 빅데이터란 개념조차 없었기에 '언어학적인 관점'에서의 연구가 더 많았지 않나 싶다. 그래서 국어국문과를 졸업한 국어 전공자들을 검색 기획이나 웹 에디터로 많이 채용됐던 것으로 기억한다.

어쨋든 Semantic Web은 '데이터를 지능적으로 처리할 수 있는 웹'이란 관점에서 정리해 보면 

   1) Web = 정보의 저장소 (빅데이터)

   2) Web = 검색이란 행위를 위해 텍스트, 음성 등 다양한 인터페이스 필요

                   (HCI: Human Computer Interface)

   3) Web = 개인화된 정보를 '수집 > 가공 > 저장 > 분류/분석'

                   (Digital Identity/Identifier, Data & Privacy) 

   4) Web = 개인화된 정보 제공 (Search Agent = AI Agent) 

 

이런 것들이 필요하다고 전제하고 있었을지 모르겠지만,

IT 기술과 산업의 최전선에서 비즈니스를 하고 있던 검색 전문회사에서 조차도 이런 때이른 혁신을 이해하기 어려웠기에 기술 중심의 연구개발 보다는 자연어 기반에 검색 의도를 좀 더 잘... 파악할 수 있도록 형태소의 가중치(Weight 또는 Cost)만을 튜닝하여 검색 서비스를 운영하지 않았나 싶고, 결과적으로는 기술적인 진보보다는 컨텐츠의 유형(Category)과 절대적인 량(Data)을 늘리는 형태로 상당 시간 경쟁하지 않았나 싶다.

(※ 이런 이유로 나는 한동안 한국의 검색 기업들이 앞다투어 자신들을 기술 기업이라고 떠들 때 코웃음을 치기도 했다.) 


2014년, Amazon이 'echo'라는 홈 스피커를 출시하고, 인공지능 비서 Alexa를 공개하게 된다.

 

2015년부터 글로벌 빅테크들은 앞다투어 인공지능 기반의 스마트 스피커를 출시하였고 완성차 업계나 글로벌 IT 기업들은 차량 내에서 인공지능 비서를 활용하여 '① 자동차를 제어하거나, ② 다른 앱 또는 웹에 접근하여 제품 구매, 식당 예약 등을 하고, ③ 스마트 홈에 연결하여 에어컨을 조정하는 등' 다양한 In Vehicle Life를 선보이기도 했다. 

2014년부터 2018년은 스마트 스피커의 시대라고 불리워도 무방할 정도로 인공지능 기술이 주목을 받았던 것으로 기억한다. 이런 와중에 2016년 3월에 딥마인드의 알파고가 이세돌 9단을 4:1로 이기면서 '딥러닝'이라는 새로운 인공지능 모델이 대중에 관심을 받게 되었는데 인공지능은 더 이상 영화적 상상에만 존재하는 것이라 아니라 인간 생활에 깊숙히 곧 자리잡게 될 것이라는 기대감을 받게 되었다.

 

그러나, 이러한 기대와는 달리 스마트 스피커는 어느새 서랍 안에 쳐 박혀 둔 장난감 신세로 전락되었는데,

자동차 업계 관점에서는 커넥티드 카(Connected Car), 다시 말해서 항시 인터넷에 연결되어 있는 차량의 시대가 생각보다 더디게 온 점도 있지만 가장 중요한 건 인공지능 비서가 할 수 있는 일이 너무나 제한적(날씨/시간/주식 정보를 알려주거나, 음악을 틀어주는 수준)이기도 했거니와 비서라면 내가 명령하기 이전에 '학습된 데이터를 기반으로 나에 대한 추론을 하여 다양한 서비스를 Recommendation 하거나, 의사결정의 지원할 수 있는 능력'이 있어야 하는데 이런 부분에서 더 이상의 발전이 없다보니 장난감의 한 가지로 취급이 되어 버린 게 아닌가 싶다.

 

이런 기대와 실망감은 이전에 설명했던 것과 유사한 패턴이 있는데,

   1) 스마트 스피커 = 다양한 정보를 갖고 있거나 접근할 수 있는 (빅데이터)

   2) 스마트 스피커 = 음성인식이 정확하고 음성을 통해 상황을 이해할 수 있는

                                  (Multi-Modal Interface)

   3) 스마트 스피커 = 차량, 집 어느 공간에서도 끊김이 없고 계속 같은 상황을 이해할 수 있는

                                  (맥락을 이해하는)

   4) 스마트 스피커 = 개인화된 나만의 비서 (AI Agent) 

 

2010년대 후반기에 자동차 업계의 핵심 화두는 단연 '자율주행 자동차'였다.

완성형 자동차 업계 뿐 아니라, 자율주행 자동차 산업에 뛰어든 대다수의 빅테크가 예상한 자율주행 자동차 상용화의 시기는 바로 내년 '2025년'이다. 그런데, 어떤가? 2025년이면 도로에서 자율주행 자동차를 만나볼 수 있겠는가?

아마도... 그럴 일은 없을 거 같다.

자동차를 자율적으로 움직이기 위한 기술은 대부분 보편화 되었다고 봐도 무방하다.

자율주행 자동차 기술의 핵심은 '인지 - 판단 - 제어', 이 3가지 부분으로 나뉘어 있는데 

1) '인지부'는 딥러닝(컴퓨터 비전 기술) 기반의 '라이다, 카메라, 레이더 기술'이 이미 상용 수준에 이르렀고, 3) '제어부'는 원래 완성차가 가장 잘하는 'Go/Stop, Faster/Slower, Right Turn/Left Turn'의 집합 기술이다. 가장 문제가 되는 부분은 2) '판단부'가 된다. 

 

사실 굉장히 복잡하고 까다로운 부분이긴 하다. 

이 판단부에 필요한 것이 바로 '추론과 의사결정' 과정이기 때문인데, 운전 과정에는 인명 사고나 추돌 사고 등 매우 민감하고도 위험한 상황이 벌어질 수도 있는데 이런 인과에 대한 법적, 제도적 규정과 가이드가 어렵기 때문에 자동차 업계와 보험 업계가 쉽사리 자율주행 자동차를 도로에 올리질 못하고 있다.

 

아마도 AI Agent가 가장 많이 필요한 영역도 이 판단부일텐데... 과연 ...


인공지능 기술의 종착지는 결국, AI Agent일 것이다.

 

AI Agent는 휴머노이드 형태의 Physical AI일 수도 있고, 완전한 Robot 일 수도 있겠지만, 내가 처음으로 컴퓨터라는 것을 인식하고 기대했던 것과 같이 인공지능은 사람의 지능을 인공적으로 학습시켜 사람과 비슷한 (혹은 더 뛰어난) 지능을 가진 주체(Identity)가 될 것이다. 강화학습, 전이학습을 통해 인간보다 더 월등한 지적 능력을 갖출 수 있을 뿐 아니라, 이를 사용하는 개개인의 특징과 특질이 학습된(혹은 Fine-Tunning) 주체로서 나만의 AI Agent가 존재할 수 있을 것이다.

 

이 AI Agent는 시, 공간 등의 물리적 제약없이 메타버스와 같은 온라인 세상에서 나를 대리하여 활동할 수도 있고, 실제 생활에서 내가 못하는.. 학습하지 않는 어떤 역량을 발휘하여 나에게 새로운 기회를 제공할 수도 있을지 모른다.

 

내가 이 AI Agent에게 기대하는 관점은 어쩌면 대리인보다는 도구(Tool)에 가까울 것 같다.

내가 할 수 없었던... 혹은 너무나 많은 시간과 비용이 소요됐던 어떤 일을 이 AI Agent라는 도구를 사용하면 할 수 있게 되거나, 이전과는 비교할 수 없는 생산/효율성을 갖게 되거나..

 

이를 위해서 인공지능과 더 친해지고, 이들을 잘 이해할 수 있도록 더 적극적으로 배우고, 경험해 봐야하지 않을까 생각한다. 결국, 도구는 쓰이는 용도와 쓰는 사람의 스킬에 따라 천차만별로 활용될 수 있을테니..

 

생성형 인공지능을 배우길 바란다.

어쩌면 이 생성형 인공지능은 남녀노소를 가릴 것 없이 모두에게 공평하게 제공하는 기회일 수도 있다.

 

AI Agent가 곧 온다.

AI Agent를 통해 누구나 Creator가 되기를 바란다.

 

 

- DeungZan ('24년 12월 11일) -