Tác giả: Chris Dixon, nhà sáng lập a16z crypto; Elizabeth Harkavy, đối tác của a16z crypto; Bản dịch: Jinse Finance xiaozou
Các hệ thống AI hiện đại không chỉ dựa vào sức mạnh tính toán và thuật toán mà còn dựa vào phản hồi của con người. Các công ty sử dụng các kỹ thuật tối ưu hóa sau đào tạo như học tăng cường phản hồi của con người (RLHF) và tối ưu hóa sở thích trực tiếp (DPO) để cải thiện các mô hình. Các kỹ thuật này có thể giảm độ lệch và cho phép các mô hình phản hồi lời nhắc với chất lượng cao hơn và phản hồi mạch lạc hơn - điều này rất quan trọng để đẩy nhanh quá trình phát triển AI. Đánh giá mô hình cũng rất quan trọng, nhưng chỉ có thể đạt được tối ưu hóa mô hình bằng cách xác định điều gì là "tốt hơn" trước.
Thách thức phát sinh từ điều này: các công ty không muốn chia sẻ - họ coi dữ liệu và quy trình đào tạo là bí mật. Điều này dẫn đến việc đánh giá mô hình AI dựa vào thông tin hạn chế từ các hệ thống đóng hoặc điểm chuẩn tĩnh tách biệt với các ứng dụng thực tế, điều này hạn chế nghiêm trọng khả năng cải thiện mô hình. Người dùng cũng ở trong điểm mù thông tin, không biết phản hồi của họ ảnh hưởng đến mô hình như thế nào hoặc thậm chí không xác nhận phản hồi có được chấp nhận hay không. Một số bảng xếp hạng mô hình và nền tảng huy động vốn cộng đồng cố gắng cải thiện tính minh bạch, nhưng chúng thường không cho phép người dùng theo dõi đóng góp của họ hoặc cung cấp phần thưởng hữu hình cho sự tham gia. Các nền tảng tuyên bố công bằng và minh bạch thường dựa vào thiện chí hơn là các tiêu chuẩn có thể thực thi.
Chúng tôi tin rằng mật mã có thể mang lại tính minh bạch và quyền sở hữu cho vùng xám này của AI. Blockchain có thể giúp những người đóng góp dễ dàng nhận được phần thưởng, đồng thời cung cấp cho các nhà phát triển AI sự đảm bảo đáng tin cậy về chất lượng và nguồn dữ liệu phản hồi. Người dùng được khuyến khích, các nhà phát triển nhận được dữ liệu đáng tin cậy và mọi người đều có thể đạt được kiểm toán hai chiều trong thị trường mở này. Để đạt được mục đích này, chúng tôi đã dẫn đầu vòng hạt giống trị giá 33 triệu đô la của Yupp, một sản phẩm tiêu dùng cho phép mọi người khám phá và so sánh các mô hình AI mới nhất miễn phí.
Yupp sử dụng mô hình huy động vốn cộng đồng để đánh giá mô hình: người dùng nhập một từ gợi ý, xem nhiều phản hồi do AI tạo ra song song, sau đó chọn câu trả lời tốt nhất. Lựa chọn của họ tạo ra một "gói dữ liệu" được ký kỹ thuật số về dữ liệu sở thích cực kỳ có giá trị cho việc tối ưu hóa và đánh giá sau đào tạo AI. Người dùng không chỉ có thể sử dụng các mô hình mới nhất miễn phí mà còn nhận được phần thưởng dựa trên phản hồi mà họ cung cấp.
Thiết kế của Yupp biến phán đoán của con người thành nguồn tài nguyên kinh tế tái tạo. Khi dữ liệu tương tác mới được tạo ra, dữ liệu cũ sẽ "hết hạn", tạo thành một bánh đà tự nhiên: việc áp dụng nhiều hơn dẫn đến các đánh giá mới hơn; các đánh giá mới hơn dẫn đến các mô hình tốt hơn; các mô hình tốt hơn dẫn đến việc sử dụng nhiều hơn. Tất cả những người tham gia - cả người dùng thông thường và nhà phát triển mô hình AI - đều có thể tham gia và xem các quy tắc minh bạch áp dụng cho tất cả mọi người, đảm bảo thị trường vẫn trung lập đáng tin cậy. Không ai có thể che giấu điểm số và không ai có thể thao túng phần thưởng hoặc kết quả.
Nhóm sáng lập có kinh nghiệm sâu rộng trong cả AI và tiền điện tử. Họ đã cùng nhau làm việc về các sản phẩm máy học hướng đến người tiêu dùng trong những ngày đầu của Twitter. Pankaj Gupta là giám đốc toàn cầu về kỹ thuật tiêu dùng tại Google Pay và Coinbase, còn Gilad Mishne là giám đốc về máy học tại GoogleX. Nhóm khởi nghiệp này quy tụ các kỹ sư cao cấp từ Google, Coinbase và các phòng thí nghiệm hàng đầu.
AI đòi hỏi một hệ thống đánh giá mạnh mẽ và đáng tin cậy dựa trên đầu vào của con người trên quy mô lớn, và tiền điện tử là cỗ máy đáng tin cậy đạt được mục tiêu này. Yupp cam kết trở thành lớp đánh giá cơ bản của AI trong tương lai bằng cách cho phép người dùng trên toàn thế giới đóng góp phản hồi để cải thiện các mô hình. Chúng tôi rất vinh dự được hỗ trợ Yupp và mong muốn hỗ trợ họ xây dựng một vòng phản hồi khép kín trên chuỗi để đảm bảo rằng kết quả của sự đổi mới AI được chia sẻ bởi tất cả những người xây dựng.