저자: 루시밍
마누스 등장, 과학기술과 자본시장의 이중 충격, 인공지능 시대 자극 에이전트 관련 컨셉주 집단 급등, 알리, 구글, 마이크로소프트 등 기술 대기업, 지능체 연구 개발 계획 집중 발표 ......
이러한 붐의 배경에는 '수동적 대응'에서 '능동적 실행'으로의 AI 기술 패러다임 전환이 있습니다.
시장의 평가는 엇갈리지만, 복잡한 시나리오에서 범용 AI 에이전트가 상업적으로 실행 가능한 것으로 입증된 것은 마누스가 처음이라는 점에서 획기적이라는 점은 부인할 수 없습니다.
기존의 빅 언어 모델은 텍스트를 생성할 수는 있지만 루프를 닫고 작업을 실행하기 어려운 반면, 마누스는 '계획-검증-실행'의 아키텍처를 통해 AI 빅 모델의 인지능력을 생산성 도구로 전환합니다.
맥킨지 및 기타 권위 있는 보고서에 따르면, 다양한 수요에 힘입어 AI 에이전트 시장은 폭발적인 성장을 거듭하고 있으며, 2024년 글로벌 AI 에이전트 시장 규모는 51억 달러에 달하고 2030년에는 44.8%의 CAGR로 471억 달러로 급증할 것으로 예상됩니다.
그러나 이 '지능형 바디 웨이브'가 곧은 길을 걷는 것은 아닙니다. 기술적 병목 현상과 상업적 야망이 충돌하면서 AI 에이전트 경쟁은 상상력과 위험을 동시에 요구하고 있습니다.
벽을 뚫다
본질적으로 AI 에이전트는 인간의 사고방식 패러다임을 가진 디지털 인력입니다.
챗봇이 아직 '대화' 단계에 머물러 있다면 에이전트는 이미 '행동'을 시작한 것입니다. 간단히 말해, 질문에 답할 뿐만 아니라 작업을 수행하고 거래를 완료할 수 있는 더 똑똑하고 자율적인 AI 애플리케이션으로 이해할 수 있습니다.
고객 서비스, 재무 분석, 소프트웨어 개발 등 다양한 시나리오에서 활용되어 생산성과 효율성을 크게 향상시킬 수 있습니다.
대규모 언어 모델을 '두뇌'로 사용하는 AI 에이전트는 명령의 표면적인 의미뿐만 아니라 암묵적인 요구 사항도 파악합니다. 예를 들어 사용자가 "가성비 좋은 호텔을 찾고 있어요"라고 말하면 마누스는 계절, 지역 이벤트 등의 맥락에서 '예산에 민감한' 또는 '경험 우선'의 니즈를 추론합니다.
예상할 수 있는 것은 멀티모달 기능의 지속적인 혁신, 특히 멀티모달 융합 기술의 반복적인 업그레이드를 통해 AI 에이전트가 사용자의 요구를 보다 정확하게 분석하고 피드백하며 점차 사람과 유사한 시청각 인식 및 상호작용 기능을 실현할 수 있게 될 것이라는 점입니다.
이를 통해 AI 에이전트는 의료 진단, 자율주행, 지능형 보안 등 더 다양한 분야에 적용될 수 있을 것입니다.

모놀리식 인텔리전스는 계속 최적화되는 동안
이 다중 지능 시스템(MAS)은 역할 포지셔닝 메커니즘을 통해 각 지능이 전문화된 휴먼 팀처럼 작동하도록 할 수 있습니다.
예를 들어 소프트웨어 개발 시나리오에서 각 AI 에이전트에는 고유한 전문성이 있으며, 일부는 프로그래밍에 능숙하고 일부는 설계에 능숙하며 일부는 품질 검사에 특화되어 있어 서로 잘 협력하면 고품질 소프트웨어 프로젝트를 완성할 수 있습니다.
또한 MAS 시스템은 인간의 의사 결정 과정을 시뮬레이션할 수 있으며, 사람이 문제가 발생했을 때 누군가와 상의하는 것처럼 다중 지능은 집단 의사 결정 행동을 시뮬레이션하여 특히 일부 복잡한 상황에서 사용자에게 더 나은 정보 지원을 제공할 수 있습니다.
예를 들어, 응급 상황 발생 시 이러한 AI는 사용자에게 가능한 모든 시나리오를 시뮬레이션하여 시기적절하고 유용한 정보를 제공함으로써 사용자가 더 빠르고 더 나은 결정을 내릴 수 있도록 지원합니다.
이러한 '인간과 같은' 인텔리전스 패러다임이 생활과 업무의 비용을 재구성하고 있다고 해도 과언이 아닙니다. 그리고 마누스를 시작으로 AI 에이전트는 개념 증명 단계에서 규모의 전환점으로 이동한 것으로 보입니다.
거대한 경쟁
AI 에이전트 붐은 우연이 아니라 기술 진화의 필연적인 산물입니다.
2024년 초 세쿼이아 AI 서밋에서 우 엔다 교수는 "AI 에이전트가 AI 발전의 다음 핵심 단계"라고 예측한 바 있습니다.
Google은 2024년 12월 대형 모델인 Gemini 2.0 시리즈의 최신 버전을 출시하고 프로젝트 아스트라와 같은 여러 지능형 신체 애플리케이션을 소개했습니다. 10월과 11월에는 각각 영업, 운영 및 기타 시나리오를 위한 여러 AI 지능형 바디를 출시하고 사용자가 자율 지능형 바디를 구축할 수 있도록 지원하는 CopilotStudio 플랫폼을 도입했습니다.
2025년으로 향하는 마누스는 시장의 분위기를 주도하며 불붙고 있습니다.
해외에서는 OpenAI가 최근 발표한 상용화 계획이 AI 에이전트의 B사이드 잠재력을 보여주는 또 다른 증거입니다. '박사급' 에이전트는 과학 연구 및 소프트웨어 개발 시나리오를 위해 설계되었으며, 월 서비스 요금은 최대 2만 달러로 기본 분석부터 복잡한 작업까지 모든 요구 사항을 충족합니다.
국내적으로도 알리첸QwQ-32B 모델은 지능체 에이전트와 관련된 기능을 통합하여 비판적으로 사고하고 환경 피드백에 따라 추론 과정을 조정하면서 도구를 사용할 수 있도록 지원합니다.
한편, 오픈소스 커뮤니티에서는 OpenManus, OWL 등과 같은 새로운 제품이 등장하고 있으며, Manus를 기반으로 한 복제 및 혁신이 에이전트 제품의 꽃을 피울 것으로 기대됩니다.
자본시장의 열풍은 이러한 추세를 뒷받침합니다.
마누스가 이날 발표한 인공지능 지능형 신체 컨셉주 150여 개가 상승했고, 큐빅홀딩스, 쿠테 인텔리전스 등이 20% 이상 올랐다.

출처: Oriental Wealth
또한, 마누스, 중개 PPT, 분석가 로드쇼 화재가 출시 된 후, 불완전한 통계에 따르면 CICC, 화타이, 중국 상인, 중국-대만 및 수십 개의 중개 회사 연구소 로드쇼의 라인에 분석가가 하나 이상의 로드쇼, 기술의 원리에서 로드쇼의 내용, AI의 적용, 착륙 시나리오 방향의 수혜자, 업계계 기술 원리, 수혜자 방향에서 착륙 장면, 산업계, 풍부한 콘텐츠에 이르기까지 로드쇼 내용.
물론 이러한 붐 뒤에는 다른 목소리도 있습니다. 많은 업계 관계자들은 마누스가 AI 에이전트의 주요 애플리케이션에 속하며 시장이 과민하게 반응했다고 생각합니다.
AI가 정보 격차를 더욱 해소하고 대량의 정보 수집 및 정보 취합을 AI에 넘길 수 있다는 것도 사실이지만, 투자 결정의 생성에서 실제 거리는 의심 할 여지없이 갈 길이 멀다.
가장 큰 도전 과제 중 하나는 AI 환상의 유령이 항상 따라다닌다는 사실에 있습니다.
기술 병목현상
AI 에이전트 경쟁에서는 입구가 가장 중요합니다.
사용자 트래픽 공급업체가 많아지면 '트래픽-데이터-경험'의 선순환을 이룰 수 있고, 오픈소스 모델을 통해 대기업과 중소업체의 기술력 차이를 보완할 수 있는 업그레이드 능력, AI 제품의 엔지니어링 능력 또는 제품 개방이 가능해질 것으로 예상됩니다. AI 제품 엔지니어링 능력, 또는 제품 경험 격차를 해소합니다.
큰 잠재력을 보여 주었음에도 불구하고 AI 에이전트의 출현은 여전히 여러 장애물에 직면해 있습니다. 비즈니스 모델부터 기술적 병목 현상, 규제 부족, 사용자 인식에 이르기까지 모든 측면에서 업계의 인내심을 시험하고 있습니다.
이유는 기존 기술이 AI 착각 문제를 효과적으로 해결하지 못했다는 사실에 가장 큰 원인이 있습니다.
인기 있는 마누스를 예로 들면, GAIA 벤치마크에서는 우수한 결과를 얻었지만 실제 적용에서는 여전히 불안정한 부분이 있습니다.

GAIA 벤치마크 순위의 출처: ManusAIX 플랫폼
실제 사용자들로부터 복잡한 작업을 처리할 때 Manus가 가끔 작업을 실행하지 못하거나 부정확한 결과를 낸다는 피드백이 있습니다. 주식 데이터를 분석할 때 데이터 인터페이스의 일시적인 오류나 데이터 형식의 사소한 변경으로 인해 분석 결과에 편차가 발생할 수 있습니다.
오픈AI의 GPT4.5를 다시 살펴보면, 이것이 가장 강력한 대규모 언어 모델이라는 것은 의심의 여지가 없습니다. 그러나 SimpleQA 벤치마크에서 GPT-4.5의 정확도는 62.5%, 착각률은 7.1%로 여전히 상당히 높지만, 이는 GPT-4o, OpenAIo1, o3-mini와 같은 모델보다 훨씬 나은 수준입니다.
금융 및 의료와 같은 고위험 분야에서는 사소한 오류도 시스템 리스크를 유발할 수 있습니다.
희귀질환 사례를 오판할 확률이 3%인 의료 진단 에이전트가 천만 명의 사용자 기반에 적용될 경우 30만 명까지 오진할 가능성이 있다고 가정해 보겠습니다.
환상과 더불어 데이터 사일로와 보편적 기능 사이의 모순이 뒤따릅니다.
예를 들어 금융 리스크 관리에는 실시간 거래 데이터가 필요한 반면, 의료 진단에는 환자 이력 라이브러리가 필요하고 데이터 파편화로 인해 범용 에이전트를 도메인 간에 마이그레이션하기 어려울 수 있는 등 AI 에이전트의 효과는 시나리오 데이터에 따라 크게 달라질 수 있습니다.
마지막으로, 윤리적 및 규제적 지연이 있습니다. AI 에이전트의 자율적 의사 결정에는 개인정보 유출, 사용자 건강 데이터 호출, 자율주행 사고 등 책임 귀속과 같은 윤리적 문제가 수반되는데, 글로벌 규제 프레임워크는 아직 성숙하지 못했습니다.
이를 통해 기술, 생태, 규제라는 세 가지 측면에서 AI 에이전트의 진로를 모색해야 한다는 것을 알 수 있습니다. 앞으로 누가 앞장서서 기술적 병목 현상을 돌파하고 규정을 준수하는 생태계를 구축하느냐에 따라 지능형 기관 시대의 노르망디 상륙작전이 결정될 것입니다.