Tác giả: Sebastian Melendez Nguồn: Artemis Bản dịch: Shan Ouba, Golden Finance
Giới thiệu
Stablecoin đang là tâm điểm của thị trường hiện nay. Có tin tức quan trọng gần như mỗi ngày. Tuần trước, Stripe đã thông báo rằng họ sẽ mua lại công ty dịch vụ ví Privy và PayPal đã thông báo rằng họ sẽ đúc PYUSD gốc trên Stellar. Tin tức thì vô tận và gần như quá sức chịu đựng. Khi ngày càng nhiều công ty tham gia lĩnh vực này, nhu cầu theo dõi và thu thập dữ liệu về stablecoin ngày càng tăng. Tuy nhiên, từ quá trình giao tiếp với khách hàng, mọi người luôn hỏi đi hỏi lại bốn câu hỏi sau:
Stablecoin được dùng để làm gì?
Ai đang sử dụng stablecoin?
Có những cơ hội nào?
Stablecoin được sử dụng ở những quốc gia hoặc khu vực nào?
Công việc của tôi tại Artemis là thu thập, sắp xếp và tổng hợp dữ liệu về stablecoin hàng ngày để trả lời những câu hỏi này. Hôm nay, chúng ta sẽ vạch trần một số huyền thoại về dữ liệu "có vẻ đơn giản" để xem những câu hỏi này thực sự khó đến mức nào.
Huyền thoại 1: Dữ liệu Stablecoin là mở, minh bạch và dễ dàng tiếp cận với mọi người
Việc truy cập độc lập vào dữ liệu trên chuỗi cực kỳ tốn kém và đầy thách thức về mặt kỹ thuật. Mặc dù khả năng truy cập dữ liệu blockchain thô đã được cải thiện trong năm năm qua, nhưng vẫn còn nhiều rào cản. Các nhà cung cấp dịch vụ dữ liệu chính thống như Dune, Flipside, Allium và Goldsky đều có những lợi thế riêng, nhưng không ai trong số họ có thể bao phủ tất cả các blockchain chính.
Thực tế:
Hiện nay, hầu như mọi công ty đều đang tung ra blockchain riêng, mỗi blockchain có các tính năng độc đáo riêng, khiến việc phân tích dữ liệu trở nên cực kỳ phức tạp.
Nếu bạn muốn hiểu đầy đủ về các mô hình sử dụng stablecoin của mình và khám phá các cơ hội tiềm năng, bạn cần có khả năng thực hiện phân tích toàn cảnh trên tất cả các chuỗi có liên quan, không chỉ nền tảng hiện đang được triển khai. Khi các chiến lược đa chuỗi phát triển và nhu cầu phân tích ngày càng sâu sắc, thì tính phức tạp của cơ sở hạ tầng dữ liệu cũng tăng lên.
Lấy PYUSD làm ví dụ:
Sau khi tích hợp giao thức chuỗi chéo OFT của LayerZero, để thực sự thấy được toàn cảnh, bạn phải nắm vững:
Cơ chế của Ethereum
Mô hình tài khoản của Solana
Logic chuỗi chéo của LayerZero
Và cấu trúc của các chuỗi mới nổi như Berachain và Flow
Tệ hơn nữa, người dùng cũng có thể kết nối các mã thông báo với nhiều nền tảng hơn, khiến vấn đề dữ liệu trở nên phức tạp theo cấp số nhân.
Vấn đề không chỉ nằm ở chuỗi mà bạn đang trực tuyến, mà toàn bộ hệ sinh thái đang không ngừng mở rộng và các chuỗi mới liên tục xuất hiện. Điều này dẫn đến vấn đề thứ hai: phân mảnh kiến trúc.
Kiến trúc dữ liệu và định dạng của mỗi chuỗi là khác nhau
Hãy nhớ lại đầu những năm 2000, khi bạn gửi tệp cho ai đó, điều đó không có nghĩa là bên kia có thể mở tệp đó. PowerPoint không mở được, video không có bộ giải mã, các hệ thống độc lập và không có gì hoạt động liền mạch. Ngay cả học sinh tiểu học cũng bị những vấn đề này hành hạ.
Thế giới blockchain ngày nay hỗn loạn như hồi đó.
Các chuỗi hoạt động tích cực nhất hiện nay - Solana, Tron, Ethereum, TON, Stellar, Aptos - có kiến trúc dữ liệu rất khác biệt.
Hãy đưa ra một vài ví dụ:
Solana: bạn phải hiểu các khái niệm về tài khoản token và tài khoản chủ sở hữu
Ethereum: bạn phải hiểu các hợp đồng thông minh, EOA và các tiêu chuẩn ERC-20
Aptos, Sui: sử dụng mô hình hướng đối tượng, tài sản là các đối tượng có thể lập trình
Stellar, TON: kiến trúc hoàn toàn khác, nhưng việc sử dụng stablecoin thì thật tuyệt vời
Hiểu các hoạt động trên các chuỗi này có nghĩa là bạn phải tháo rời một mạng lưới công nghệ ngày càng phức tạp.
Hãy xem lại PYUSD:
Trước đây, bạn chỉ cần hiểu kiến trúc của Ethereum, Solana và LayerZero. Nhưng giờ đây, khi nó đổ bộ lên Stellar, bạn cũng phải hiểu:
Nói cách khác, bạn thậm chí phải trở thành chuyên gia trong một chuỗi nhất định để truy cập và phân tích dữ liệu, chứ chưa nói đến việc trích xuất thông tin chi tiết từ đó.
Huyền thoại 2: Thông tin chi tiết sẽ tự nhiên xuất hiện miễn là bạn có được dữ liệu blockchain
Nhiều người nghĩ rằng: Miễn là vấn đề truy cập dữ liệu được giải quyết, thông tin chi tiết về người dùng có thể dễ dàng có được tiếp theo. Giả sử rằng bạn đã có được quyền truy cập và nắm bắt được số dư và tập dữ liệu chuyển giao của toàn bộ chuỗi, bạn sẽ nhận được gì?
Câu trả lời là: Một loạt nhiễu.
Địa chỉ trên chuỗi chỉ là một chuỗi các chữ cái và số, và số dư ví thường không chính xác hoặc gây hiểu lầm. Dữ liệu blockchain thô không đồng nghĩa với thông tin chi tiết, nó chỉ là một đống dữ liệu lộn xộn cần phải cực kỳ phức tạp để dọn dẹp và xử lý trước khi có thể trở nên có giá trị.
Thực tế là: để hiểu những gì đang diễn ra trên chuỗi, bạn cần ngữ cảnh và dữ liệu ngoài chuỗi
Ngay cả khi bạn nỗ lực hết sức để thu thập dữ liệu trên chuỗi, bạn vẫn không thể trả lời các câu hỏi chính: Ai đang sử dụng đồng tiền ổn định của bạn? Họ ở đâu?
Tất cả những gì bạn có thể nói là: "Đồng tiền ổn định của tôi đang được sử dụng". Điều này không thể thực hiện được và không giúp bạn hiểu được: hành vi của người dùng, mức độ thâm nhập thị trường, cơ hội tăng trưởng. Để đạt được những hiểu biết này, bạn phải dựa vào ngữ cảnh ngoài chuỗi. Câu hỏi thực sự là: Bạn cần dữ liệu ngoài chuỗi nào và làm thế nào để có được dữ liệu đó?
Thẻ ứng dụng và giao thức:Không có nguồn duy nhất, đáng tin cậy nào để gắn thẻ hoạt động trên chuỗi. Flipside, Dune, Sáng kiến nhãn mở, trình khám phá khối, Arkham—tất cả đều cung cấp một số thông tin, nhưng mỗi nguồn đều có các mẫu riêng và phạm vi phủ sóng hạn chế. Để trả lời các câu hỏi cơ bản như "Địa chỉ này đang sử dụng ứng dụng nào?""Chúng ta đang thấy loại sử dụng nào?", bạn cần thống nhất các nguồn nhãn phân tán này và gắn nhãn thủ công các địa chỉ ví quan trọng. Nếu không làm như vậy, bạn sẽ chỉ giới hạn ở dữ liệu giao dịch thô, không cung cấp bất kỳ thông tin nào về các mẫu sử dụng thực tế.
Vị trí địa lý:Đây là chìa khóa—và có lẽ là câu hỏi tôi được hỏi thường xuyên nhất: Người dùng của tôi ở đâu? Chúng tôi sử dụng phương pháp tìm kiếm theo múi giờ và các kỹ thuật tiên tiến để suy ra phân phối địa lý. Quan trọng hơn, chúng tôi làm việc với các đối tác dữ liệu để có được dữ liệu địa lý độc quyền ngoài chuỗi giúp chúng tôi xác định chính xác quốc gia mà ví có nhiều khả năng đến nhất.
Thực tế là việc giải quyết vấn đề gắn nhãn này đòi hỏi nhiều nguồn lực và mối quan hệ trong ngành. Bạn cần hợp tác với các L1 và giao thức chính để xây dựng các tập dữ liệu được gắn nhãn toàn diện. Hầu hết các nhóm không có băng thông hoặc kết nối để xử lý việc này theo cách thủ công — đó là lý do tại sao nhiều nỗ lực phân tích gặp phải trở ngại khi họ có được dữ liệu blockchain thô. Lớp ngữ cảnh là nơi công việc thực sự bắt đầu.
Huyền thoại 3: Dữ liệu Blockchain trực quan và nhất quán
Blockchain phức tạp hơn nhiều so với vẻ bề ngoài của chúng. Mặc dù ngành công nghiệp đã bắt đầu chuẩn hóa xung quanh các mẫu thiết kế cụ thể cho việc chuyển token trong vài năm qua, nhưng điều này không phải lúc nào cũng đúng. Khi công nghệ bắc cầu lần đầu tiên trở nên phổ biến, không có tiêu chuẩn cộng đồng nào để theo dõi hoạt động xuyên chuỗi. Điều này đã tạo ra sự nhầm lẫn khi cố gắng theo dõi chính xác số dư và chuyển khoản — đặc biệt là đối với các token đã tồn tại đủ lâu để có trước các tiêu chuẩn này. Bạn cần hiểu lịch sử cụ thể và đặc điểm riêng của từng chuỗi để có được dữ liệu chính xác.
Thực tế: "Sơ đồ cơ sở dữ liệu" của Blockchain luôn thay đổi —Bạn phải là một "nhà sử học trên chuỗi" để có được dữ liệu chính xác
Thật dễ quên rằng các hệ sinh thái này liên tục thay đổi. Lấy Solana làm ví dụ, công ty này đã trải qua những nâng cấp lớn đối với cả kiến trúc (cách thức hoạt động của blockchain) và chương trình mã thông báo (cách thức tạo và chuyển mã thông báo).
Nâng cấp kiến trúc:Khi Solana lần đầu ra mắt, chuỗi này không lưu trữ dấu thời gian trong bộ nhớ dài hạn. Điều này gây ra những vấn đề lớn khi cố gắng tính toán số dư lịch sử theo thời gian. Solana đã khắc phục sự cố này vào năm 2020, nhưng thiệt hại đã xảy ra: làm thế nào bạn có thể tái tạo số dư lịch sử chính xác mà không có dấu thời gian?
Nâng cấp Token Plan:Năm ngoái, Solana đã giới thiệu Token Plan 2022 để giải quyết các vấn đề phân mảnh trong thiết kế ban đầu, nhưng điều này có nghĩa là bạn cần hiểu các sắc thái của các kế hoạch token cũ và mới để theo dõi chính xác các token có thể thay thế.
Dựa trên điều này, chúng ta thường nghe mọi người nói rằng blockchain là cơ sở dữ liệu không thể thay đổi, công khai và chỉ có thể thêm vào. Mặc dù điều này nói chung là đúng hiện nay, nhưng không phải lúc nào cũng đúng trong những ngày đầu. Lạc quan là một ví dụ tuyệt vời - họ không chỉ trải qua một sự kiện khởi đầu và ra mắt. Trên thực tế, họ đã khởi chạy lại hoàn toàn trực tuyến sau vài tháng.
Kết quả là gì?Không có tập dữ liệu đầy đủ nào về tất cả các giao dịch chuyển token trên chuỗi Optimism ban đầu.
Tại sao điều này lại quan trọng?Dữ liệu bị thiếu này rất quan trọng để hiểu hoạt động hiện tại và lịch sử của các đồng tiền ổn định lớn trên mạng chính OP, bao gồm USDC, USDT và DAI. Nếu không có dữ liệu này, bạn không thể có được tập dữ liệu đầy đủ cũng như không thể tính toán số dư ví chính xác.
Việc xây dựng một tập dữ liệu chính xác đòi hỏi phải trở thành một nhà sử học blockchain. Việc hiểu được sự phát triển tinh tế của từng chuỗi và giải thích tất cả những khác biệt trong lịch sử này đòi hỏi nhiều năm làm việc chăm chỉ.
Kết luận
Dữ liệu blockchain phải đối mặt với những thách thức độc đáo mà các ngành khác không có. Mặc dù về danh nghĩa là “mở và minh bạch”, việc trích xuất thông tin chi tiết có ý nghĩa đòi hỏi dữ liệu ngoài chuỗi, tích hợp hàng chục nhà cung cấp dịch vụ dữ liệu, đọc thông tin theo ngữ cảnh nằm rải rác trên Twitter tiền điện tử và các tài liệu chính thức, cùng một nhóm kỹ sư gồm hơn 10 người. Nếu không, bạn chỉ đang mù quáng theo đuổi một thị trường ảo thay đổi với tốc độ ánh sáng.