예술 작품이란 완성되는 것이 아니라 버려지는 것뿐이다. "">모두가 AI 에이전트에 대해 이야기하고 있지만, 같은 이야기를 하고 있지 않기 때문에 대중의 관점과 AI 실무자의 관점에서는 AI 에이전트에 대해 다른 시각을 갖게 됩니다.
오래 전에 제가 쓴 <, 그때부터 지금까지 Crypto와 AI의 결합은 일방적인 연애였고, AI 실무자들은 웹3/블록체인 용어를 거의 언급하지 않는 반면, Crypto 실무자들은 AI를 사랑하고, AI Agent 프레임워크가 토큰화될 수 있는 것을 보고 정말 현실이 될 수 있을까 싶었습니다. AI 에이전트 프레임워크가 토큰화될 수 있다는 경이로움을 본 후, 정말 AI 실무자들을 우리 세계로 끌어들일 수 있을지 궁금합니다.
AI는 크립토의 에이전트이며, 현재 AI 열풍을 크립토 관점에서 바라보는 가장 좋은 방법이며, 크립토의 AI 열기는 다른 산업과는 달리 금융 자산의 발행과 운영을 그 안에 중첩시키는 데 특히 관심이 있습니다.
테크노 마케팅의 뿌리, 에이전트 진화
문제의 근원에 도달하기 위해 최소한 세 가지 흐름이 있는데, OpenAI의 AGI(일반화된 인공지능)는 기술 수준을 뛰어넘는 용어를 유행어로 만들면서 큰 진전을 이루었습니다. 하지만 기본적으로 에이전트는 새로운 개념이 아니며, AI 기능이 추가되었다고 해도 혁신적인 기술 트렌드라고 보기는 어렵습니다.
오픈AI가 생각하는 AI 에이전트는 자율주행 분류에서 L3와 유사하며, 어느 정도 고차원적인 보조 운전 능력을 갖춘 것으로 볼 수 있지만 인간을 완전히 대체할 수 있는 수준은 아닙니다.
< 가운데>이미지 캡션: OpenAI 계획의 AGI 단계이미지 제공: https://www.bloomberg.com/
두 번째, AI 에이전트는 이름에서 알 수 있듯이 컴퓨터 분야에서는 에이전트 메커니즘, 모드가 일반적이지만 OpenAI의 기획에서 에이전트는 L3 단계 이후 대화 형태(ChatGPT), 추론 형태(모든 종류의 Bot)가 될 것이며 그 특징은 '업무 수행의 자율성'입니다. 이는 "자율적 행동"이 특징이며, LangChain의 창립자 해리슨 체이스가 정의한 대로 "AI 에이전트는 LLM을 사용하여 프로그램에 대한 제어 흐름 결정을 내리는 시스템입니다."라고 설명할 수 있습니다. 프로그램에 대한 제어 흐름 의사 결정. "
이것의 장점입니다. LLM 이전에는 에이전트가 주로 사람이 설정하는 자동화된 프로세스를 수행했습니다. 예를 들어 크롤러 프로그램을 설계할 때 프로그래머가 설정했습니다. 크롤러를 설계할 때 프로그래머는 실제 사용자가 사용하는 브라우저 버전, 운영 체제 및 기타 세부 사항을 모방하도록 사용자 에이전트를 설정했습니다. 물론 인간의 행동을 더 자세히 모방하는 데 AI 에이전트가 사용된다면, 크롤러를 "더 인간처럼" 만드는 AI 에이전트 크롤러 프레임워크가 등장하게 될 것입니다.
이러한 변화에서 AI 에이전트의 추가는 기존 시나리오와 결합되어야 하며, 완전한 독창성의 영역은 Curosr, Github 코파일럿 및 기타 코드 완성 및 생성 기능뿐만 아니라 LSP(언어 서버 프로토콜) 및 기타 사고의 추가 개발에 따라 거의 존재하지 않는다고 해도 과언이 아닙니다. 서버 프로토콜) 및 기타 사고에서 비롯되었으며, 다음과 같은 많은 예시를 인용할 수 있습니다.
Apple: AppleScript(스크립트 편집기) - 알프레드 -- Siri -- 바로 가기 -- Apple 인텔리전스
인간-컴퓨터 상호작용: 웹 1.0 CLI TCP/IP 넷스케이프 브라우저 --Web 2.0 GUI/RestAPI/검색 엔진/Google/슈퍼 앱 --Web 3.0 AI 에이전트 + 디앱 ?
조금 설명하자면, 인간과 컴퓨터의 상호작용 과정에서 웹 1.0 GUI와 브라우저의 결합으로 일반인들이 문턱 없이 컴퓨터를 사용할 수 있게 되었고, 이는 윈도우 + IE의 결합으로 대표되며, API는 인터넷의 데이터 추상화 및 전송 표준이며, 웹 2.0 시대에는 웹 2.0 시대는 크롬의 시대였으며, 모바일로의 전환은 사람들의 인터넷 사용 습관을 변화시켰고, 위챗, 메타 및 기타 슈퍼 플랫폼 앱은 사람들의 삶의 모든 측면을 포괄합니다.
셋째, 암호화폐의 인텐트 개념은 AI 에이전트 서클의 폭발적 증가의 선구자이지만, 이는 기능적으로 불구가 된 비트코인 스크립트부터 에이전트 개념의 일반화인 이더리움 스마트 계약에 이르기까지 암호화폐 내에서만 유효하며 크로스 체인 브리지를 탄생시켰습니다. --크로스체인 브리지, 체인 추상화, EOA-AA 지갑은 모두 이러한 아이디어의 자연스러운 확장이므로, AI 에이전트의 암호화폐 '침공'이 디파이 시나리오로 이어졌다는 것은 놀라운 일이 아닙니다. 그러나 OpenAI의 정의에 따르면 이러한 위험한 시나리오가 실제로 실현되려면 L4/L5가 필요하며, 대중이 가지고 노는 것은 자동 코드 생성 또는 AI 원클릭 요약, 대중 대신 작성 등의 기능이며 양측 간의 커뮤니케이션은 차원이 아닙니다.
우리가 정말로 원하는 것을 이해하고, 다음으로 AI 에이전트의 조직 논리에 대해 이야기하는 데 초점을 맞추고, 기술적 세부 사항은 숨겨져 있으며, 결국 AI 에이전트의 에이전트 개념은 개인용 PC 산업의 브라우저와 같은 기술의 대중화 앞에있는 장애물에서 기술을 금광으로 제거하는 것이므로 우리의 초점은 여기에있을 것입니다. 인간과 컴퓨터의 상호작용이라는 렌즈를 통해 바라본 AI 에이전트와 AI 에이전트와 LLM의 차이점과 연관성, 이 두 가지에 초점을 맞출 것이며, 3부에서는 암호화폐와 AI 에이전트의 결합이 남긴 것들에 대해 다룰 것입니다.
let AI_Agent = LLM+API;
인간-컴퓨터 상호작용의 ChatGPT 모델 이전에는 인간-컴퓨터 상호작용은 GUI와 CLI가 주류를 이루었습니다.
구글 아이디어는 브라우저, 앱 및 기타 특정 형태로 계속 이어졌고, CLI와 Shell의 조합은 거의 변하지 않았습니다.
< span leaf="">
< span leaf="">하지만 이것은 인간과 컴퓨터 간의 상호작용의 '프론트 엔드'에 불과하며, 인터넷의 발달로 데이터의 양과 종류가 증가함에 따라 앱과 앱 사이의 '백 엔드' 상호작용도 증가하여 서로 상호 의존하는 데이터와 데이터도 증가하고 있습니다. 간단한 웹 브라우징 동작에도 양쪽의 협업과 협력이 필요합니다.
사람과 브라우저 및 앱 간의 상호작용이 사용자 포털이라면, API 간의 링크와 점프는 인터넷을 작동시키는 요소이며, 일반 사용자가 명령줄과 API의 용어를 이해하지 않고도 목적을 실현할 수 있게 해주는 에이전트의 일부입니다.
LLM도 마찬가지이며, 이제 사용자는 한 걸음 더 나아가 검색할 필요도 없이 전체 프로세스를 다음과 같이 설명할 수 있습니다.
사용자가 채팅 창을 엽니다.
사용자가 자연어, 즉 텍스트나 음성을 사용하여 자신의 요구 사항을 설명합니다.
LLM이 이를 일련의 작업 단계로 파싱합니다.
LLM은 결과를 사용자에게 반환합니다.
이 과정에서 가장 큰 도전은 사용자가 검색 엔진을 열 필요가없고 모든 종류의 GPT와 같은 대화 창이 있기 때문에 트래픽 입구가 조용히 변화하고 있으며 이러한 이유로 일부 사람들은 현재 LLM 혁명이 검색 엔진의 생명이라고 믿고 있습니다.
그렇다면 AI 에이전트는 어떤 역할을 할까요?
요약하자면,AI 에이전트는 LLM의 전문화입니다.
현재 LLM은 AGI가 아니며, 즉 OpenAI의 이상적인 L5 구성자가 아니며, 기능이 훨씬 더 제한적이며, 예를 들어 사용자 입력을 너무 많이 먹으면 환각을 일으키기 쉽고, 그 주요 원인 중 하나는 학습 메커니즘입니다. 예를 들어 1+1=3이라고 반복적으로 GPT에 알려주면 1+1=3이 됩니다. 라고 반복해서 말하면 다음 상호작용에서 1+1+1=? 라고 말하면 다음 상호작용에서 1+1+1=? 라고 물었을 때 4라고 대답할 확률이 일정하게 정해져 있습니다.
이 시점에서 GPT의 피드백은 전적으로 개별 사용자로부터 나오기 때문에 모델이 네트워크에 연결되지 않으면 사용자의 정보에 따라 작동 메커니즘이 변경되어 나중에 1+1=3만 아는 지체된 GPT가 될 가능성이 있습니다. 그러나 모델에 네트워크를 허용하면 GPT의 피드백 메커니즘은 훨씬 더 다양해집니다. 그러나 모델의 네트워크화를 허용하면 네트워크에 있는 대다수의 사람들이 1+1=2라고 생각하기 때문에 GPT의 피드백 메커니즘은 훨씬 더 다양해집니다.
그렇다면 로컬에서 LLM을 사용해야 한다면 이러한 문제를 어떻게 피할 수 있을까요?
간단하고 잔인한 방법은 두 개의 LLM을 동시에 사용하면서 동시에 질문에 답할 때마다 두 LLM이 서로 검증하도록 지정하여 오류 확률을 줄이거나, 실패하면 두 명의 사용자가 한 번에 하나의 프로세스를 처리하도록 하고, 하나는 질문을 담당하고 하나는 질문을 미세 조정하고 언어를 더 표준화하도록 하는 등의 방법이 있습니다, 더 합리적으로 말이죠.
물론 때로는 네트워킹이 LLM이 지연된 바에 대한 답을 검색하는 것과 같은 문제를 완전히 피하지 못하고 더 나빠질 수 있지만이 정보를 피하면 사용 가능한 데이터의 양이 줄어들고 기존 데이터를 분할 및 재구성하거나 이전 데이터를 기반으로 일부 새 데이터를 생성하여 더 신뢰할 수있는 답변을 생성 할 수 있습니다. 이것이 바로 자연어 이해를 위한 RAG(검색-증강 생성)입니다.
인간과 기계는 서로를 이해해야 하며, 여러 LLM이 서로를 이해하고 협업하게 되면 인간 에이전트가 빅 모델과 다른 에이전트를 포함한 다른 리소스를 호출하는 AI 에이전트의 작동 방식에 이미 손을 대고 있는 셈입니다.
그 결과 LLM과 AI 에이전트 간의 연관성을 파악했습니다. LLM은 인간이 대화 창을 통해 소통할 수 있는 지식 집합의 집합이지만 실제로는 특정 작업 스트림을 특정 애플릿, 봇, 명령 모음으로 그룹화할 수 있다는 사실을 발견하고 이를 에이전트로 정의했습니다.
span leaf="">AI 에이전트는 여전히 LLM의 일부이며, 이 둘을 동일시할 수 없으며, 외부 프로그램, LLM 및 다른 에이전트와의 협업에 특히 중점을 두고 LLM 위에서 호출되는 방식이 다르므로 'AI 에이전트 = LLM+API'라는 인식이 존재합니다.
그런 다음 AI 에이전트의 사양을 LLM 워크플로에 추가할 수 있는데, X의 API 데이터를 호출하는 예를 들어 보겠습니다.
사용자가 채팅 창을 엽니다.
사용자가 자연어, 즉 텍스트나 음성으로 자신의 요구 사항을 설명합니다.
LLM이 이를 AI 에이전트 태스크 클래스에 대한 API 호출로 파싱합니다.
AI 에이전트가 사용자 X에게 계정 및 API 비밀번호를 요청하고 사용자 설명에 따라 X와 통신합니다.
AI 에이전트가 최종 결과를 사용자에게 반환합니다.
인간과 컴퓨터의 상호작용의 진화를 기억하시나요? 웹 1.0과 웹 2.0에 존재했던 브라우저, API 등은 여전히 존재하지만 사용자는 이를 완전히 무시하고 AI 에이전트와 상호작용만 할 수 있으며 API 호출 등의 프로세스를 대화 방식으로 사용할 수 있습니다.
상대방이 인터페이스를 열고 사용자가 액세스 권한만 있으면 로컬 데이터, 네트워크 정보, 외부 앱 데이터 등 모든 유형의 API 서비스를 사용할 수 있습니다.
<>< span leaf="">위 다이어그램에는 전체 AI 에이전트 사용 프로세스가 표시되어 있는데, LLM은 AI 에이전트와 별개의 부분으로 볼 수도 있고 프로세스의 두 하위 섹션으로 볼 수도 있지만 어떻게 나누든 사용자의 요구 사항을 충족하는 것이 핵심입니다.
인간과 컴퓨터의 상호작용 과정 또는 사용자 자신의 대화라는 관점에서 보면, 사용자는 자신의 생각을 표현하기만 하면 AI/LLM/AI 에이전트가 사용자의 요구를 반복해서 추측하고, 피드백 메커니즘을 포함할 뿐만 아니라 LLM에 대한 요구 사항을 메모리의 현재 시나리오(컨텍스트)에 포함함으로써 AI 에이전트가 현재 상황을 갑자기 잊지 않도록 보장할 수 있습니다. AI 에이전트가 갑자기 자신이 하고 있는 일을 잊어버리지 않도록 보장할 수 있습니다.
요컨대, AI 에이전트는 사용자의 실제 요구를 고려하는 개인 집사와 같이 기존 스크립트 및 자동화 도구와의 본질적인 차이점 인보다 개인적인 제품이지만이 성격은 여전히 확률 적 추측이며 L3 수준의 AI 에이전트는 인간의 이해와 표현이 없다는 점에 유의해야합니다. L3 수준의 AI 에이전트에는 인간의 이해력과 표현 능력이 없기 때문에 외부 API와 인터페이스하는 것은 위험합니다.
AI 프레임워크의 수익화 이후
AI 프레임워크가 수익화될 수 있다는 사실은 제가 여전히 암호화폐에 관심을 갖는 이유 중 큰 부분입니다. 프레임워크는 적어도 데이터와 연산만큼 중요하지 않고, AI 제품을 유동화하는 방식이 어렵다는 점에서 전통적인 AI 기술 스택에서 그다지 중요하지 않기 때문이죠. 결국, 대부분의 AI 알고리즘과 모델링 프레임워크는 오픈 소스 제품이며, 실제 비공개 소스는 데이터와 기타 민감한 정보입니다.
본질적으로 AI 프레임 워크 또는 모델은 용기 및 조합에 대한 일련의 알고리즘으로, 조림 거위의 철 냄비와 동일하지만 거위의 다양성과 불의 숙달은 판매되는 제품의 맛을 구별하는 열쇠는 거위 여야하지만 이제 Web3 고객이 와서 거위를 버리기 위해 냄비를 사기 위해 관을 사고 싶어합니다.
그 이유는 복잡하지 않으며, Web3의 AI 제품은 기본적으로 지혜의 조각을 집어 들고 있으며, 기존 AI 프레임 워크, 알고리즘 및 제품에 자체 맞춤형 제품을 개선하고 있으며 기술적으로 구별 할 수 없기 때문에 기술 원칙 뒤에있는 다른 Crypto AI 프레임 워크도 크게 다르지 않으며 이름의 필요성, 장면의 적용이 필요하기 때문에 기술적으로 차별화 할 수 없습니다. 기술적으로 구분할 수 없기 때문에 이름, 적용 시나리오 등에 대해 무언가를 할 필요가 있기 때문에 AI 프레임 워크 자체에 대한 약간의 조정이 다른 토큰을 지원하게되어 Crypto AI Agent에 대한 프레임 워크 버블을 생성했습니다.
학습 데이터와 알고리즘에 많은 투자를 할 필요가 없기 때문에 이름 차별화 방법이 특히 중요한데, 딥시크 V3는 저렴하더라도 의사의 머리와 많은 GPU와 전력 소모가 필요합니다.
어떤 의미에서는 이것이 최근 웹3의 일관된 스타일, 즉 토큰 발행 플랫폼이 토큰보다 더 가치가 있는, Pump.Fun/Hyperliquid 모두 마찬가지입니다. 하이퍼리퀴드는 애플리케이션이자 자산인 에이전트가 가장 인기 있는 상품이 되었습니다.
사실 이것도 일종의 가치 고정 아이디어인데, 모든 종류의 에이전트가 차별화되지 않으면 에이전트 프레임워크가 더 안정적이고 자산 발행의 사이펀 효과의 가치를 낼 수 있기 때문에 현재 Crypto와 AI Agent의 조합의 1.0 버전인 셈이죠.
2.0 버전이 등장하고 있는데, 일반적으로 DeFi와 AI 에이전트의 조합인 DeFAI의 개념은 물론 열성적인 시장 행동이지만 다음과 같은 점을 고려하면 다릅니다.
모포는 에이브와 같은 오래된 대출 상품에 도전하고 있습니다;
하이퍼리퀴드는 dYdX의 온체인 파생상품을 대체하고 심지어 코인셰어즈의 CEX에 도전하고 있습니다. 온체인 효과;
스테이블코인은 오프체인 시나리오의 결제 도구가 되고 있습니다.
AI가 디파이의 기본 로직을 개선하고 있는 것도 디파이의 변화 맥락입니다. 기존 디파이의 가장 큰 로직이 스마트 컨트랙트의 실현 가능성을 검증하는 것이었다면, AI 에이전트가 디파이를 만드는 로직을 바꾸고 있기 때문에 디파이 상품을 만들기 위해 디파이를 이해할 필요가 없어지고 있는 것이죠. 체인 추상화를 넘어서는 근본적인 권한 부여를 위해 DeFi를 이해하지 않아도 DeFi 상품을 만들 수 있습니다.
모두가 프로그래머가 되는 시대가 오고 있습니다. 복잡한 계산은 AI 에이전트 뒤에 있는 LLM과 API에 맡기고 개인은 자연어를 프로그래밍 로직으로 효율적으로 변환하여 자신의 아이디어에만 집중하면 됩니다.
결론
이 글에서는 쿠키펀이 AI 에이전트 정보 수집과 토큰 검색을 위한 플랫폼으로서의 역할을 충분히 잘 수행해왔기 때문에 암호화 AI 에이전트 토큰이나 프레임워크에 대해서는 언급하지 않았습니다. Fun은 이미 AI 에이전트 정보 집계 및 토큰 검색 플랫폼, AI 에이전트 프레임워크, 그리고 마지막으로 오고가는 에이전트 토큰으로 충분히 잘하고 있으므로 이 글에서 계속 정보를 나열하는 것은 의미가 없습니다.
그러나 이 관찰 기간 동안 시장은 여전히 Crypto AI Agent 포인터가 무엇인지에 대한 실제 탐구가 부족하며, 우리는 항상 포인터에 대해 논의 할 수 없으며 메모리 변경이 본질입니다.
또한 모든 종류의 대상을 자산화할 수 있다는 점이 크립토의 장점입니다.
Preview
유익한 보고서를 통해 암호화 산업에 대한 더 넓은 이해를 얻고 비슷한 생각을 가진 다른 저자 및 독자와 심도 있는 토론에 참여하십시오. 성장하는 Coinlive 커뮤니티에 참여하실 수 있습니다.https://t.me/CoinliveSG