Một tác phẩm của nghệ thuật không bao giờ được hoàn thiện, chỉ bị bỏ rơi.
Mọi người đều đang nói về Tác nhân AI, nhưng họ không nói về cùng một thứ, điều này dẫn đến những gì chúng ta là AI Người đại diện quan tâm đến nó khác với quan điểm của công chúng, cũng như từ quan điểm của những người thực hành AI.
Cách đây rất lâu, tôi đã viết Crypto là ảo ảnh của AI, từ đó đến nay, Crypto và AI Sự kết hợp luôn là một tình yêu đơn phương. Những người thực hành AI hiếm khi đề cập đến thuật ngữ Web3/blockchain, nhưng những người thực hành tiền điện tử lại rất đam mê AI. Sau khi nhìn thấy sự kỳ diệu của khung AI Agent được token hóa. Cuối cùng, tôi không biết liệu chúng ta có thực sự có thể giới thiệu AI hay không. những người thực hành vào thế giới của chúng ta.
AI là đại lý của Crypto. Đây là lời giải thích tốt nhất để xem xét cơn sốt AI này từ góc độ mã hóa. Sự nhiệt tình của Crypto đối với AI khác với các ngành khác. , chúng tôi đặc biệt hy vọng có thể tích hợp việc phát hành và vận hành tài sản tài chính với nó.
Sự phát triển của tác nhân, nguồn gốc của tiếp thị kỹ thuật
Nhìn vào gốc rễ của nó, AI Tác nhân Có ít nhất ba nguồn và AGI (Trí tuệ tổng hợp nhân tạo) của OpenAI liệt kê nó là một bước quan trọng, khiến thuật ngữ này trở thành một từ thông dụng vượt quá trình độ kỹ thuật. Tuy nhiên, về bản chất, Tác nhân không phải là một khái niệm mới. nó rất khó có thể là một xu hướng công nghệ mang tính cách mạng.
Một trong số đó là Tác nhân AI trong mắt OpenAI. Tương tự như L3 trong phân loại lái xe tự động, có thể coi Tác nhân AI. như có một số khả năng lái xe được hỗ trợ ở mức độ cao nhất định. Nhưng nó không thể thay thế hoàn toàn con người.
span>
Mô tả hình ảnh: Giai đoạn AGI của quy hoạch OpenAI Nguồn ảnh: https://www.bloomberg.com/
Thứ hai, đúng như tên gọi, AI Agent là một Agent được ban phước Các cơ chế và kiểu mẫu không phải là hiếm trong lĩnh vực máy tính, nhưng theo quy hoạch của OpenAI, Agent sẽ trở thành giai đoạn L3 sau dạng đối thoại (ChatGPT) và dạng suy luận (các loại Bot), có đặc điểm là “thực hiện một số hành vi nhất định”. tự động" hoặc sử dụng Định nghĩa của người sáng lập LangChain, Harrison Chase: "AI Agent là một hệ thống sử dụng LLM để đưa ra các quyết định về luồng kiểm soát chương trình."
Đây là điều bí ẩn. Trước khi LLM xuất hiện, Tác nhân chủ yếu thực hiện các quy trình tự động được thiết lập giả tạo. Chỉ đưa ra một ví dụ, khi lập trình viên thiết kế chương trình trình thu thập thông tin , họ sẽ thiết lập User-Agent (User Agent) được sử dụng để bắt chước phiên bản trình duyệt, hệ điều hành và các chi tiết khác được người dùng thực sử dụng. Tất nhiên, nếu AI Agent được sử dụng để bắt chước hành vi của con người một cách chi tiết hơn thì khung trình thu thập AI Agent sẽ. xuất hiện, và hoạt động này sẽ làm cho loài bò sát "giống con người hơn".
Trong những thay đổi như vậy, việc bổ sung AI Agent phải kết hợp với các kịch bản hiện có gần như không tồn tại, ngay cả trong Curosr, Github copilot Code. và khả năng tạo cũng là những cải tiến chức năng hơn nữa theo suy nghĩ của LSP (Giao thức máy chủ ngôn ngữ). Có rất nhiều ví dụ như vậy:
Thiết bị đầu cuối: Terminal (macOS)/Power shell (Windows)--iTerm 2--Warp(AI Bản địa)
Tương tác giữa người và máy tính: Web 1.0 CLI TCP/IP Trình duyệt Netscape--GUI Web 2.0/RestAPI/Công cụ tìm kiếm /Google/Super App --Web 3.0 AI Agent + dapp ?
Giải thích một chút, trong quá trình con người- tương tác máy tính, GUI Web 1.0 Sự kết hợp với trình duyệt thực sự cho phép công chúng sử dụng máy tính mà không gặp bất kỳ rào cản nào, thể hiện bằng sự kết hợp giữa Windows + IE và API là tiêu chuẩn truyền tải và trừu tượng hóa dữ liệu đằng sau Internet. Các trình duyệt trong thời đại Web 2.0 đã là thời đại của Internet. Chrome và đang hướng tới thiết bị đầu cuối di động. Sự thay đổi đã thay đổi thói quen sử dụng Internet của mọi người. Ứng dụng từ các nền tảng siêu lớn như WeChat và Meta bao trùm mọi khía cạnh của cuộc sống mọi người.
Thứ ba, khái niệm về ý định (Intent) trong lĩnh vực Crypto là tiền thân cho sự bùng nổ của giới Agent AI. Tuy nhiên, cần lưu ý rằng điều này. chỉ hợp lệ trong Crypto. Từ tập lệnh Bitcoin chưa hoàn chỉnh đến hợp đồng thông minh Ethereum, nó là một ứng dụng chung của khái niệm Tác nhân và sau đó là cầu nối chuỗi chéo - trừu tượng hóa chuỗi, ví EOA - AA đều là các phần mở rộng tự nhiên của loại này. suy nghĩ, vậy trong AI Agent Sau khi “xâm chiếm” Crypto, không có gì đáng ngạc nhiên khi nó dẫn đến bối cảnh DeFi.
Đây là sự nhầm lẫn về khái niệm Tác nhân AI Trong bối cảnh tiền điện tử, điều chúng tôi thực sự muốn đạt được là "quản lý tài chính tự động và tự động tạo ra meme mới" "Đặc vụ, nhưng theo định nghĩa của OpenAI, một kịch bản nguy hiểm như vậy thậm chí còn yêu cầu L4/L5 phải thực sự được hiện thực hóa. Sau đó, công chúng sẽ sử dụng các chức năng như tạo mã tự động hoặc tóm tắt bằng một cú nhấp chuột AI, viết ma, v.v. Sự giao tiếp giữa hai bên không có cùng chiều hướng.
Hiểu được điều chúng ta thực sự muốn, hãy tập trung vào logic tổ chức của Tác nhân AI. Sau cùng, các chi tiết kỹ thuật sẽ ẩn chứa đằng sau nó. của tác nhân là loại bỏ công nghệ khỏi những trở ngại của việc phổ biến quy mô lớn, giống như trình duyệt đã biến vàng thành ngành công nghiệp PC cá nhân, vì vậy trọng tâm của chúng ta sẽ là hai điểm: xem xét Tác nhân AI từ góc độ tương tác giữa con người và máy tính, và Đại lý AI và LLM Sự khác biệt và kết nối dẫn đến phần thứ ba: những gì cuối cùng sẽ còn lại do sự kết hợp giữa Crypto và AI Agent.
let AI_Agent = LLM+API;
Loại trò chuyện này trong ChatGPT Before Trong mô hình tương tác giữa người và máy tính, sự tương tác giữa con người và máy tính chủ yếu ở dạng GUI (giao diện đồ họa) và CLI (Giao diện dòng lệnh GUI) tiếp tục rút ra nhiều dạng cụ thể khác nhau như trình duyệt và ứng dụng CLI. Sự kết hợp hiếm khi thay đổi.
span>
Nhưng đây chỉ là sự tương tác giữa con người và máy tính trên bề mặt "front-end". Với sự phát triển của Internet, số lượng và loại dữ liệu ngày càng tăng. đã dẫn đến mối quan hệ giữa dữ liệu và dữ liệu, App và App Sự tương tác "back-end" giữa họ cũng ngày càng tăng lên. Cả hai đều dựa vào nhau. Ngay cả việc duyệt web đơn giản cũng thực sự cần có sự cộng tác và hợp tác của cả hai.
Nếu chúng ta nói về sự tương tác giữa con người với trình duyệt và Ứng dụng, thì các liên kết và bước nhảy giữa các API sẽ hỗ trợ hoạt động thực tế của Internet. cũng là một phần của Đại lý. Người dùng thông thường có thể đạt được mục tiêu của riêng mình mà không cần biết các thuật ngữ như dòng lệnh và API.
Điều tương tự cũng đúng với LLM. Giờ đây, người dùng có thể tiến thêm một bước nữa và thậm chí không cần phải tìm kiếm. Toàn bộ quá trình có thể được mô tả như các bước sau. :< /p>
Người dùng mở cửa sổ trò chuyện;
Người dùng sử dụng ngôn ngữ tự nhiên, tức là văn bản hoặc lời nói, để mô tả nhu cầu của họ;
LLM phân tích chúng vào các tiến trình
LLM trả về kết quả cho người dùng.
Có thể thấy trong quá trình này, thách thức lớn nhất chính là Google, vì người dùng không cần mở tìm kiếm engine. Thay vào đó, các cổng giao thông của nhiều cửa sổ đối thoại giống GPT đang âm thầm thay đổi. Chính vì lý do này mà một số người cho rằng vòng LLM này đang cách mạng hóa cuộc sống của các công cụ tìm kiếm.
Vậy Tác nhân AI đóng vai trò gì trong việc này?
Tóm lại, AI Agent là một chuyên ngành của LLM.
LLM hiện tại không phải là AGI, tức là nó không phải là công cụ tổ chức L5 lý tưởng của OpenAI. Khả năng của nó bị hạn chế rất nhiều, chẳng hạn như. Ăn quá nhiều người dùng Rất dễ tạo ra ảo giác khi nhập thông tin. Một trong những nguyên nhân quan trọng là cơ chế đào tạo. Ví dụ: nếu bạn liên tục nói GPT 1+1=3 thì có khả năng nhất định là bạn sẽ hỏi 1. +1+1= trong lần tương tác tiếp theo? cho xác suất câu trả lời là 4.
Vì phản hồi của GPT lúc này hoàn toàn đến từ người dùng cá nhân. Nếu mô hình không kết nối Internet thì hoàn toàn có khả năng thông tin của bạn sẽ bị lộ. Trong tương lai sẽ thay đổi cơ chế hoạt động. Sẽ là một GPT chậm chạp, chỉ biết 1+1=3, nhưng nếu mô hình được phép kết nối Internet thì cơ chế phản hồi của GPT sẽ đa dạng hơn. đại đa số mọi người trên Internet tin rằng 1+1=2.
Tiếp tục tăng độ khó, nếu phải sử dụng LLM cục bộ thì làm sao tránh được những vấn đề như vậy?
Một cách đơn giản và thô thiển là sử dụng hai LLM cùng lúc và quy định rằng mỗi khi bạn trả lời một câu hỏi, hai LLM phải xác minh lẫn nhau , do đó làm giảm khả năng xảy ra lỗi, nếu cách đó không hiệu quả, có một số cách, chẳng hạn như cho phép hai người dùng xử lý một quy trình tại một thời điểm, một người chịu trách nhiệm đặt câu hỏi và người còn lại chịu trách nhiệm tinh chỉnh các câu hỏi, và cố gắng làm cho ngôn ngữ được chuẩn hóa và hợp lý hơn.
Tất nhiên, đôi khi Internet không thể tránh khỏi hoàn toàn các vấn đề. Chẳng hạn, nếu LLM lấy lại câu trả lời từ thanh chậm phát triển trí tuệ thì có thể tệ hơn, nhưng tránh được. những thông tin này sẽ Nếu lượng dữ liệu có sẵn giảm đi, bạn có thể chia nhỏ và sắp xếp lại dữ liệu hiện có hoặc thậm chí tạo ra một số dữ liệu mới dựa trên dữ liệu cũ để câu trả lời trở nên đáng tin cậy hơn. Tăng cường truy xuất Tạo, truy xuất tăng cường tạo) hiểu ngôn ngữ tự nhiên.
Con người và máy móc cần hiểu nhau. Nếu chúng ta cho phép nhiều LLM hiểu và cộng tác với nhau thì về cơ bản chúng ta đang chạm vào chế độ vận hành của AI. Tác nhân, tức là con người. Tác nhân gọi các tài nguyên khác, thậm chí có thể bao gồm các mô hình lớn và các Tác nhân khác.
Như vậy, chúng ta đã nắm được mối liên hệ giữa LLM và AI Agent: LLM là tập hợp của một chuỗi kiến thức mà con người có thể giao tiếp thông qua cửa sổ đối thoại, nhưng trong thực tế, chúng tôi nhận thấy rằng một số luồng nhiệm vụ cụ thể có thể được tóm tắt dưới dạng các chương trình nhỏ, Bot và tập lệnh cụ thể và chúng tôi đã xác định chúng là Tác nhân.
AI Agent vẫn là một phần của LLM và cả hai không thể được coi là giống nhau. Phương thức gọi của AI Agent dựa trên LLM, có điểm đặc biệt. nhấn mạnh vào các chương trình bên ngoài, LLM và các tác nhân khác hợp tác, do đó có cảm giác AI Agent = LLM+API.
Sau đó, trong quy trình làm việc LLM, bạn có thể thêm hướng dẫn cho Tác nhân AI. Hãy lấy dữ liệu API của lệnh gọi X làm ví dụ: p>
Người dùng mở cửa sổ trò chuyện;
Người dùng sử dụng ngôn ngữ tự nhiên, tức là văn bản hoặc giọng nói để mô tả nhu cầu của họ;
LLM phân tích nó thành một API Gọi tác vụ giống như Tác nhân AI và chuyển quyền đối thoại cho Tác nhân;
Tác nhân AI hỏi người dùng Tài khoản X và mật khẩu API và dựa trên mô tả của người dùng với X Giao tiếp nối mạng;
Tác nhân AI trả về kết quả cuối cùng cho người dùng.
Bạn có còn nhớ lịch sử tiến hóa của sự tương tác giữa con người và máy tính không? Các trình duyệt, API, v.v. tồn tại trên Web 1.0 và Web 2.0 vẫn sẽ tồn tại, nhưng người dùng hoàn toàn có thể bỏ qua sự tồn tại của nó và chỉ cần tương tác với các lệnh gọi API AI và các quy trình khác có thể được sử dụng theo cách trò chuyện và các dịch vụ API này có thể thuộc bất kỳ loại nào. , bao gồm dữ liệu cục bộ, thông tin mạng và Ứng dụng bên ngoài dữ liệu, miễn là bên kia mở giao diện và người dùng có quyền sử dụng nó.
span>
Một quy trình sử dụng Tác nhân AI hoàn chỉnh như được trình bày ở trên, trong đó LLM có thể được coi giống như Tác nhân AI Các phần riêng biệt cũng có thể coi là hai mắt xích con của một quy trình nhưng dù chia ra như thế nào thì chúng đều phục vụ nhu cầu của người dùng.
Từ góc độ quá trình tương tác giữa con người và máy tính, ngay cả chính người dùng cũng đang nói chuyện với chính mình, bạn chỉ cần thể hiện những gì bạn đang nghĩ, AI/ Tác nhân LLM/AI sẽ đoán đi đoán lại nhu cầu của bạn Việc bổ sung cơ chế phản hồi và yêu cầu LLM ghi nhớ bối cảnh tình huống hiện tại (Context) có thể đảm bảo rằng Tác nhân AI sẽ không đột nhiên quên những gì nó đang làm.
Tóm lại, AI Agent là một sản phẩm được cá nhân hóa hơn. Đây là điểm khác biệt cơ bản giữa nó với các tập lệnh truyền thống và các công cụ tự động hóa. Nó giống như một quản gia cá nhân. Xem xét nhu cầu thực sự của người dùng, nhưng phải chỉ ra rằng loại tính cách này vẫn là kết quả của sự suy đoán xác suất. Tác nhân AI cấp độ L3 không có khả năng hiểu và biểu đạt của con người nên việc kết nối nó với các API bên ngoài tiềm ẩn nhiều nguy hiểm. .
Sau khi khung AI được kiếm tiền
Tôi rất ngạc nhiên rằng AI framework có thể kiếm tiền Một lý do quan trọng để duy trì sự quan tâm đến Crypto là trong kho công nghệ AI truyền thống, các framework không quan trọng lắm, ít nhất là không quan trọng bằng dữ liệu và sức mạnh tính toán. Việc kiếm tiền từ các sản phẩm AI bắt đầu cũng khó khăn. Rốt cuộc, hầu hết AI đều Các thuật toán và khung mô hình đều là sản phẩm nguồn mở và nguồn đóng thực sự là thông tin nhạy cảm như dữ liệu.
Về cơ bản, khung hoặc mô hình AI là vật chứa và sự kết hợp của một chuỗi thuật toán, tương đương với một chiếc nồi sắt để hầm một con ngỗng, nhưng nó Là loại ngỗng và việc kiểm soát nhiệt độ nấu là mấu chốt để phân biệt mùi vị. Sản phẩm bán ra lẽ ra phải là những con ngỗng lớn nhưng hiện tại khách hàng của Web3 đến, họ muốn mua quan tài để lấy ngọc và bỏ ngỗng để lấy. nồi.
Lý do không phức tạp. Các sản phẩm AI của Web3 về cơ bản dựa trên trí tuệ của người khác và chúng đều được tùy chỉnh dựa trên các khung, thuật toán và sản phẩm AI hiện có. các sản phẩm và thậm chí cả các nguyên tắc kỹ thuật đằng sau các khung AI tiền điện tử khác nhau cũng không khác nhau nhiều. Vì chúng không thể phân biệt được về mặt kỹ thuật nên chúng cần phải gây ồn ào về tên, kịch bản ứng dụng, v.v. Do đó, bản thân khung AI có một số điều chỉnh nhỏ. trở thành các thế hệ hỗ trợ tiền tệ khác nhau, do đó dẫn đến Bong bóng khung cho Đại lý AI tiền điện tử.
Vì bạn không cần đầu tư nhiều vào dữ liệu và thuật toán đào tạo nên phương pháp phân biệt tên là đặc biệt quan trọng cho dù DeepSeek V3 có rẻ đến đâu. vẫn cần tóc, GPU và điện năng của một tiến sĩ.
Ở một khía cạnh nào đó, Đây cũng là phong cách nhất quán của Web3 thời gian gần đây, tức là token Nền tảng phát hành có giá trị hơn mã thông báo và điều này đúng với Pump.Fun/Hyperliquid Ban đầu, Đại lý phải là một ứng dụng và một tài sản, nhưng khung phát hành Đại lý đã trở thành sản phẩm phổ biến nhất.
Trên thực tế, đây cũng là một ý tưởng neo giá trị. Vì không có sự phân biệt giữa các loại Đại lý khác nhau nên khung Đại lý ổn định hơn và có thể tạo ra tài sản. phát hành Hiệu ứng siphon giá trị, đây là phiên bản 1.0 hiện tại của sự kết hợp giữa Crypto và AI Agent.
Phiên bản 2.0 đang nổi lên, điển hình là sự kết hợp giữa DeFi và AI Agent. Khái niệm DeFAI tất nhiên là một hành vi thị trường bị kích thích bởi sức nóng, nhưng nếu chúng tôi nhận thấy Sẽ có sự khác biệt khi bạn xem xét các tình huống sau:
Morpho đang thách thức Aave Chờ đợi các sản phẩm cho vay cũ;
Hyperliquid đang thay thế các công cụ phái sinh trên chuỗi của dYdX và thậm chí còn thách thức hiệu ứng niêm yết tiền tệ CEX của Binance ;< /span>
Stablecoin đang trở thành một công cụ thanh toán trong các tình huống ngoài chuỗi.
Chính trong bối cảnh phát triển của DeFi, AI đang cải thiện logic cơ bản của DeFi. của DeFi trước đây là để xác minh tính khả thi của các hợp đồng thông minh và Tác nhân AI thay đổi logic sản xuất của DeFi. Bạn không cần phải hiểu DeFi để sản xuất các sản phẩm DeFi. Đây là một sự trao quyền cơ bản hơn là sự trừu tượng hóa chuỗi.
Thời đại đang đến khi mọi người đều là lập trình viên. Các phép tính phức tạp có thể được gia công cho LLM và API đằng sau Tác nhân AI và các cá nhân chỉ cần làm vậy. tập trung vào chính họ Ý tưởng rằng ngôn ngữ tự nhiên có thể được chuyển đổi một cách hiệu quả thành logic lập trình.
Kết luận
Bài viết này không đề cập đến bất kỳ mã thông báo và khuôn khổ Đại lý Crypto AI nào, bởi vì Cookie.Fun đã làm rất tốt công việc, nền tảng tổng hợp thông tin AI Agent và khám phá mã thông báo, sau đó là khung AI Agent và cuối cùng là mã thông báo Agent đến và đi, không còn giá trị để tiếp tục liệt kê các thông tin trong bài.
Tuy nhiên, trong khoảng thời gian quan sát này, vẫn còn thiếu các cuộc thảo luận thực sự về những gì Tác nhân AI tiền điện tử chỉ ra trên thị trường. Chúng ta không phải lúc nào cũng thảo luận về các gợi ý. ., bản chất là thay đổi bộ nhớ.
Khả năng liên tục chuyển đổi nhiều tài sản cơ bản khác nhau thành tài sản chính là điểm hấp dẫn của Tiền điện tử.
Preview
Có được sự hiểu biết rộng hơn về ngành công nghiệp tiền điện tử thông qua các báo cáo thông tin và tham gia vào các cuộc thảo luận chuyên sâu với các tác giả và độc giả cùng chí hướng khác. Chúng tôi hoan nghênh bạn tham gia vào cộng đồng Coinlive đang phát triển của chúng tôi:https://t.me/CoinliveSG