작성: 랑데부
마누스는 하루 동안 화면을 스와이프하며 하룻밤 사이에 명성을 얻은 시작부터 찾기 힘든 획일적인 홍보의 중간, 그리고 그 획일적인 홍보에 대한 의문까지, FOMO 감정과 직관적인 경계심이 얽혀 있는 모든 것이 매우 흥미로운 커뮤니케이션 샘플입니다.
사실, 지난 몇 년 동안 AI 산업은 정보의 "폭격 중심"모드였으며, 모든 것에 대한 이해는 이미 신비화되었고, 이해하지 못하지만 여전히 덜 이상할 것이며, 하지만 매일 폭격, 객관적으로 정말 폭격이 섞여있을 것이라고 말하는 것이 있습니다.
그리고 마누스에 대한 제 평가는 정말 AI 에이전트 업계의 딥시크 모멘트라고 불리는 정말 폭발하는 테이블에 속하지만 패치가 있고, 마지막에 다시 접겠습니다.
마누스의 데모 중 하나부터 시작하겠습니다.
텍스트 기반의 대화형 게임을 개발하여 구글의 CEO가 되어 회사 역사에서 중요한 결정을 체험함으로써 게임도 재미있게 즐기고 그 과정에서 회사의 문화에 대해 배울 수 있습니다.

마누스는 한 시간이 끝나자 구글 CEO 시뮬레이터 웹게임을 실행했습니다. 높은 완성도로 개발된 구글 CEO 시뮬레이터 웹 게임은 게임을 클릭하여 시작하면 난이도를 직접 선택할 수 있으며, 선택에 따라 회사의 자원이 변화하고 최종 게임 결말에 영향을 미치는 구글 역사의 모든 변곡점을 마주하게 됩니다.
한 시간 안에 한 문장으로 게임을 만드는 것, 이것이 AI 에이전트가 할 수 있는 일입니다.
더 이상 정보 수준의 답변만 제공하는 것이 아니라 프로그램 작성, 웹 페이지 제작, 보고서 작성, 이력서 검색 등 보다 구체적인 작업을 완료하도록 컴퓨터를 조작할 수 있고, 그 과정에서 발생하는 어려움을 완전히 자율적으로 해결하고 작업을 수행할 수 있다는 점에서 기존의 대화형 AI와 다릅니다. 물론 예외도 있지만 이에 대해서는 나중에 다시 설명하겠습니다.
대중적인 AI 에이전트 서비스는 많지 않으며, 일반적으로 프로 멤버십을 이용하려면 월 200달러의 ChatGPT Operator와 월 500달러의 프로그래밍 시장에 초점을 맞춘 AI 엔지니어 제품인 Devin과 같이 매우 비쌉니다.
중국 대형 모델팀 모니카가 개발한 마누스는 현재 무료 베타 버전으로 한 작업당 비용을 OpenAI의 1/10인 2달러로 압축했으며, 벤치마크 차트에서 이미 OpenAI를 제치고 세계 최강자로 등극한 바 있습니다.
초대 코드를 받은 후 몇 시간 만에 마누스의 하루 컴퓨팅 리소스를 모두 소진했고, 그 결과에 대해 정말 기대가 큽니다.
몇 가지 테스트 사례를 보여드리겠습니다.
먼저 링크트리 스타일의 개인 홈페이지를 만드는 데 도움을 요청했고 Manus는 작업을 8단계로 나누어 먼저 웹 전체에서 제 프로필 정보를 수집했습니다. 먼저 다양한 플랫폼에 있는 제 링크와 대표작 등 인터넷 곳곳에서 제 프로필 정보를 수집한 후 링크트리 디자인 스타일에 맞춰 웹 코드를 작성하기 시작했고, 30분 만에 완성된 작품을 제게 전달해 주었습니다.

단순하지만 완벽하게 맞고, 상호 작용이 모두 괜찮으며, 샤프슈터 수준의 복사 효과가 있으며, 미적으로 더 멋지게 만들고 싶다면 프롬프트를 작성하여 수정할 수 있습니다.
두 번째 테스트는 실제 문제를 해결하기 위해 엔지니어 그룹의 친구를 돕기 위해 Manus를 사용하는 것입니다. 그는 공장에서 Atlas 로봇 팔의 유지 관리를 담당하고 있으며 작은 문제가 발생하여 해결 방법을 찾기 위해 자신의 방법을 찾기보다는 수천 달러를 지출 할 애프터 서비스 비용을 찾고 너무 게으르고 문서를보고 직접 만들 수있는 단락을 제공했습니다. 어떻게 처리해야 하는지 알아보세요.

아, 이 요구는 이론적으로 평범한 대화입니다. 인공지능이 이론적으로는 이 요구사항을 대신할 수 있지만, 더 많은 상호작용 과정이 필요하고, 예를 들어 문서를 주고 단계별로 답을 구해야 하는데, 마누스는 이런 것들이 필요 없고, 스스로 아틀라스 웹사이트로 가서 문서를 다운로드하고 읽고 문제 해결에 필요한 핵심 내용을 찾아서 꼼꼼히 분석하고 프로그램을 만든 다음 최종 코드를 제 친구에게 보내주는데, 조금 결함이 있지만 수동 수정 후 완전히 사용 가능하기 때문에 A/S 전화 횟수를 바로 없앨 수 있다는 장점이 있습니다. 친구에게 보낸 최종 코드는 약간 결함이 있었지만 수동 수정 후 완벽하게 사용할 수 있어 애프터 콜을 직접적으로 없앨 수 있었습니다.
세 번째 테스트는 트위터 독자 중 한 명이 마누스에게 한 나라의 미니멀리즘 연대기 작업을 제안했고, 저는 카툰 표와 웹 디자인 요구 사항을 추가했는데, 최종 결과물은 눈에 약간 거슬리는, AI에는 미학이 없는, 다소 딱딱한 결과물이었습니다. 이 점은 계속해서 강조해야 하지만, 이 시점에서 Manus의 서버가 다운되어 지금은 변경할 수 없으므로 반제품만 보여드리겠습니다.

보시다시피 Manus는 영국의 역사를 10가지 시대로 나눠서 설명합니다. 보시다시피 마누스는 영국의 역사를 10개의 시대로 나누고 각 시대를 기준으로 SVG 이미지를 그려서 웹 페이지에 HTML로 제공하는데, 이는 인간과 컴퓨터의 협업 모델이라고 할 수 있으며 과외 수업 계획이나 진행 중인 작업의 미리보기로 사용하기에 매우 편리합니다.
마누스에게 '제거' 게임을 만들어 달라고 부탁했는데, 아이콘은 원작 신의 캐릭터를 사용해야 해서 먼저 게임 메커니즘과 제거 구현에 대한 연구를 시작한 후 원작 신의 그림 자료를 수집하려고 했어요. 그 이유는 매우 실망스러웠습니다. 네트워크 디스크에 의해 로직이 차단되어 계정을 등록 할 수 없어서 리소스를 다운로드 할 수 없었고 제가 대신 해달라고했습니다.
제 아무리 강력한 인공지능도 네트워크 드라이브에 의해 차단될 수 있는 것 같습니다.
AI 에이전트가 최대한 독립적으로 작동하도록 하는 대신 요구 사항을 약간 변경하고 게임 아이콘에 기술 회사의 로고를 사용하도록 요청했는데, 웹에는 오픈 카피 라이센스가 있는 SVG 자료가 많기 때문에 마누스가 실행하는 데 큰 문제가 되지 않았기 때문이죠. 이제 마누스는 아무런 문제 없이 게임을 실행할 수 있었고 곧 포인트로 게임을 완료하여 매우 원활하게 플레이할 수 있었습니다.

하지만 보시다시피 마누스는 이런 종류의 비교적 복잡한 문제를 해결하는 데 있어 디테일에 많은 어려움을 겪고 있습니다. 이런 종류의 비교적 복잡한 문제를 해결할 때 마누스가 부족한 세부 사항이 여전히 있는데, 이는 화면 조정과 같이 사람(저)이 너무 적게 관여하는 것과 관련이 있으며, 더 명확하게 설명해야 하며, 마누스가 수정에 느리지 않지만 서버가 다운되는 것과 같은 문제로 인해 한동안 작업을 더 개선하지 못했습니다.
이 몇 가지 실제 테스트 사례를 통해 현 단계에서 AI 에이전트의 기능과 단점이 명확하게 드러난 것 같습니다. Manus는 더 이상 샌드박스 환경을 갖춘 브라우저에서만 작동하고 작업을 완료하기 전에 자체 테스트를 수행한 후 승인 테스트를 통과하면 전달할 수 있는 제품이 아닙니다. 인터넷의 데이터 경계에 국한되어 네트워크에 리소스가 충분하지 않으면 자급자족할 수 있는 리소스를 생산할 수 없습니다.
AI 에이전트의 특성을 비교할 수 있는 도구 카테고리에서도 몇 가지 테스트를 해봤습니다.
예를 들어 마누스에게 B 스테이션에서 미야 호시(게임 캐릭터)의 가장 인기 있는 동영상 10개를 달라고 요청했습니다. 액션 팁을 알려달라고 요청했습니다.

마누스는 말 그대로 그 10개의 동영상을 모두 시청했습니다. 동영상 - 한 시간이 넘게 걸렸습니다 - 그리고 나서 다양한 UP 소유자의 미니 에세이를 제가 찾고 있던 자료로 다듬었고, 그것은 꽤 정확합니다. 동일한 작업을 네트워크로 연결된 큰 모델에 맡겼다면 가능했을 것이지만 환각의 확률이 높고, 인공지능만큼은 아닙니다. "정직한" 수준은 인공지능 에이전트만큼 신뢰할 수 없습니다.
그런 다음 다시 마누스에게 폴리마켓의 차익거래 가능성을 검토해 달라는 요청을 받았고, 저는 투자에 대한 확실한 가이드를 기대했지만 - 웃지 마세요 - 마누스는 헌신적이었습니다. -마누스는 열심히 숙제를 하고 4가지 차익거래 기회를 나열해 주었고, 저는 PolyMarket에서 적격 종목이 나타날 때마다 아무 생각 없이 규칙에 따라 베팅할 수 있었습니다.

다시 보기를 보면 마누스가 매번 가장 많이 시작한 것처럼 보입니다. 그는 먼저 폴리마켓이 무엇인지 이해하고, 시장이 어떻게 전개될지 분석하고 예측한 다음, 플랫폼의 규칙에 따라 리스크 전략을 수립하는 등 기본부터 시작하며, 근면하고 실용적이며 내구성 있는 전형적인 연수생 스타일로 진행합니다.
그건 그렇고,이 디자인의 재생, 내 생각에, 그것은 또한 마누스의 하이라이트 중 하나입니다, 그것은 선택의 생각의 사슬을 노출하는 추론 모델과 매우 자주, 더 고무적인 더 많은 답변을 공급하는 것 이상의 AI의 사고 과정, 마누스 모든 작업에는 재생 기능이 있으며, 공유 할 수있는, 그것은 문제를 해결하는 길에있다. 문제를 해결하는 과정에서 보여주는 도구는 또 다른 형태의 지적 자산으로서 인간 교사의 역할을 할 수 있습니다.
그렇다면 저는 마누스를 AI 에이전트 업계에서 딥시크의 순간으로 평가하고 싶고, 여기에 적용해야 할 패치는 바로 딥시크-V2 순간입니다. 버전의 모델, 이것은 가격이 매우 저렴하기 때문에 처음으로 링에서 벗어난 것이지만 모델 자체가 일반적으로 능력이 있기 때문에 그 당시 많은 사람들이 DeepSeek가 가격 전쟁에 맞서기 위해오고 있다고 생각하고 놀라지 만주의를 기울이지 않았고 열기는 오래 지속되지 않았습니다.
DeepSeek-V3와 R1이 연속적으로 출시될 때까지 모든 사람들은 상황이 완전히 다르다는 것을 깨달았고 전체 대형 모델 시장의 비용 논리가 하룻밤 사이에 뒤집혔다는 것을 깨달았습니다.
처음에는 화재, 가뭄, 한 종의 멸종, 한 도시의 소멸에 불과했던 이 재앙이 모든 사람과 밀접한 관련이 있을 때까지 아무도 관심을 갖지 않았습니다. -- "방황하는 지구"
내 말은 AI 기술의 발전은 연속적이며, 이 위아래 곡선에서 매번 신호의 강도가 그 뒤에 오는 획기적인 발전의 깊이를 결정한다는 것입니다. 전문가용에서 범용으로 AI 에이전트 서비스를 가져온 역사의 전환점에서 모든 것을 시작한 창립 브랜드인 마누스에 대한 저의 생각은 변함이 없습니다.
사용 사례를 보면 AI 에이전트로서의 기능은 매우 강력하고 작업을 분해하는 숙련도가 매우 높으며, 여러 시나리오에서 최적의 솔루션을 평가하고 찾는 AI를 '볼' 수 있는 CoA(Chain of Agents)를 관찰하는 것은 CoT(Chain of Thoughts)를 보는 것과 매우 흡사한 느낌을 줍니다.
이론적으로는 방대한 양의 CoA가 내장되어 있어야 하는데, 공식 홈페이지의 사용 사례에서 볼 수 있듯이 DeepSeek는 대중 시장에 출시되기 전에 미리 충분한 CoT를 소화하고 주류의 요구 사항을 최대한 많이 커버하는 추론 모델입니다.