Bạn đã bao giờ tự hỏi tại sao công việc trong thời đại Internet vẫn tẻ nhạt như vậy không? Tại sao chúng ta vẫn phải điền vào biểu mẫu, nhấp vào nút và tìm kiếm thông tin theo cách thủ công? Khi AI có thể viết mã, vẽ hình ảnh và thậm chí suy nghĩ về các vấn đề phức tạp, tại sao chúng ta vẫn bị mắc kẹt trong giao diện web, thực hiện các tác vụ lặp đi lặp lại như rô-bốt?
Tôi đã tìm thấy một hiện tượng rất thú vị. Ngày càng có nhiều bạn bè xung quanh tôi thảo luận về cách để AI giúp họ hoàn thành nhiều tác vụ khác nhau trên Internet, chẳng hạn như dịch vụ gia hạn tự động, tải xuống báo cáo thường xuyên, theo dõi giá của đối thủ cạnh tranh, v.v. Mọi người đều có cùng một sự bối rối: AI trông thông minh, nhưng tại sao nó không thể giúp tôi hoàn thành các tác vụ đơn giản này trực tiếp trên trang web? Câu trả lời cho câu hỏi này thực sự rất đơn giản. AI cần một "trình duyệt" để vận hành trang web như con người. Và đây chính xác là vấn đề cốt lõi mà Browserbase muốn giải quyết.
Gần đây, công ty này, mới được thành lập cách đây 16 tháng, vừa hoàn tất vòng gọi vốn Series B trị giá 40 triệu đô la, với mức định giá là 300 triệu đô la. Notable Capital dẫn đầu vòng gọi vốn này, với sự tham gia của các tổ chức đầu tư nổi tiếng như Kleiner Perkins và CRV. Ấn tượng hơn nữa là công ty đã huy động được tổng cộng 67,5 triệu đô la trong 15 tháng, tăng trưởng từ con số không lên hơn 1.000 khách hàng. Tốc độ phát triển này khiến tôi phải suy nghĩ nghiêm túc: họ đang giải quyết loại vấn đề nào và tại sao nhiều công ty sẵn sàng trả tiền cho họ như vậy?
Hiểu lại bản chất của tự động hóa web
Theo tôi, Browserbase đang giải quyết một vấn đề bị đánh giá thấp nghiêm trọng nhưng cực kỳ quan trọng: làm thế nào để AI có thể sử dụng Internet như con người. Chúng ta hiện đang sống trong một kỷ nguyên kỳ lạ. AI có thể viết mã phức tạp, nhưng không thể giúp bạn đặt chuyến bay trên trang web. Gốc rễ của mâu thuẫn này là cơ sở hạ tầng Internet hiện tại được thiết kế cho con người, không phải cho AI. Mỗi trang web đều có giao diện, nút và biểu mẫu riêng. AI cần hiểu ý nghĩa của các yếu tố này và vận hành chúng một cách chính xác, giống như con người sử dụng chuột và bàn phím.
Giải pháp do Browserbase cung cấp được gọi là cơ sở hạ tầng "trình duyệt không đầu". Nói một cách đơn giản, đó là trình duyệt chạy trên đám mây. Chúng không có giao diện người dùng nhưng có thể thực hiện tất cả các chức năng của trình duyệt: truy cập trang web, nhấp vào nút, điền vào biểu mẫu, tải xuống tệp, v.v. Điều quan trọng là các trình duyệt này có thể được lập trình, có thể chạy ở quy mô lớn và được tối ưu hóa cho các tình huống AI và tự động hóa.

Bối cảnh của người sáng lập Paul Klein khiến tôi nghĩ rằng ông là người phù hợp để giải quyết vấn đề này. Anh ấy đã làm việc tại Twilio trong ba năm, từ thực tập sinh đến trưởng nhóm, và trải nghiệm toàn bộ quá trình IPO của công ty. Sau đó, anh ấy đồng sáng lập Stream Club, một công ty phần mềm phát sóng trực tiếp, cuối cùng đã được Mux mua lại. Trong thời gian làm việc tại Mux, Klein đã tiếp xúc rất nhiều với công nghệ trình duyệt không đầu, điều này giúp anh ấy hiểu sâu sắc về những điểm khó khăn và cơ hội trong lĩnh vực này. Khi ChatGPT trở nên phổ biến, ngày càng nhiều người hỏi anh ấy cách sử dụng trình duyệt không đầu để hỗ trợ các ứng dụng AI, điều này khiến anh ấy nhận ra rằng thị trường đang thiếu một nền tảng cơ sở hạ tầng chuyên nghiệp.
Quan trọng hơn, Klein có một sự hiểu biết độc đáo về vấn đề này. Anh ấy tin rằng chúng ta không nên mong đợi Internet được thiết kế lại cho AI, cũng như chúng ta không thể mong đợi tất cả các con đường đều được trải nhựa cho xe tự lái. Thay vào đó, chúng ta cần để AI học cách sử dụng cơ sở hạ tầng Internet hiện có. Quan điểm này khiến tôi vô cùng xúc động, vì thực sự có quá nhiều trang web cũ nhưng quan trọng sẽ không bao giờ cung cấp giao diện API, chẳng hạn như trang web của sở ban ngành chính phủ, hệ thống nội bộ doanh nghiệp truyền thống, nhiều cơ sở dữ liệu chuyên nghiệp, v.v.
Về mặt kỹ thuật, thiết kế kiến trúc của Browserbase rất thú vị. Nền tảng của họ có thể khởi chạy hàng nghìn phiên bản trình duyệt trong một phần giây, mỗi phiên bản được trang bị bốn CPU ảo để đảm bảo phản hồi nhanh. Quan trọng hơn, họ đã triển khai các trung tâm dữ liệu trên toàn thế giới và các nhà phát triển có thể gửi yêu cầu từ trung tâm dữ liệu gần nhất, giúp giảm đáng kể độ trễ. Việc triển khai toàn cầu này rất quan trọng đối với các ứng dụng cần truy cập vào các trang web ở các khu vực khác nhau, chẳng hạn như theo dõi giá thị trường nước ngoài, thu thập thông tin tin tức quốc tế, v.v.
Chuyển đổi từ cơ sở hạ tầng sang hệ sinh thái
Điều khiến tôi ấn tượng là Browserbase không chỉ cung cấp cơ sở hạ tầng mà còn xây dựng một hệ sinh thái hoàn chỉnh. Họ đã phát triển khuôn khổ Stagehand, một công cụ nguồn mở được thiết kế riêng cho tự động hóa trình duyệt. So với Puppeteer và Selenium truyền thống, tính năng lớn nhất của Stagehand là nó có thể kết hợp các tập lệnh truyền thống và các tác nhân AI trong cùng một quy trình làm việc. Thiết kế này rất thông minh vì nó giải quyết được một mâu thuẫn chính: các tập lệnh truyền thống đáng tin cậy nhưng không đủ linh hoạt và các tác nhân AI linh hoạt nhưng có thể có ảo giác. Bằng cách cho phép các nhà phát triển sử dụng AI khi cần khả năng thích ứng và các tập lệnh khi cần độ tin cậy cao, Stagehand đạt được sự cân bằng giữa hai yếu tố này.
Điều khiến tôi phấn khích hơn nữa là sản phẩm Director mới ra mắt của họ. Sản phẩm này cho tôi thấy tham vọng của Browserbase: họ không chỉ muốn phục vụ các nhà phát triển mà còn muốn người dùng thông thường sử dụng tính năng tự động hóa Web. Director cho phép người dùng mô tả các tác vụ họ muốn hoàn thành bằng ngôn ngữ tự nhiên, sau đó tự động tạo các quy trình làm việc có thể thực thi trên trình duyệt. Ví dụ: bạn có thể nói với Director: "Hãy truy cập Cơ sở dữ liệu giấy phép điều dưỡng California, tra cứu số giấy phép 94156 của Julia và cho tôi biết liệu trình độ của cô ấy có hợp lệ không". Director sẽ tự động tạo mã tương ứng và thực hiện tác vụ này.

Klein đã đề cập đến một khái niệm thú vị: "vibe coder". Đây là những người có một số kiến thức chuyên môn nhất định nhưng không phải là nhà phát triển chuyên nghiệp, chẳng hạn như nha sĩ, luật sư, chủ doanh nghiệp nhỏ, v.v. Họ biết Cursor là gì, hiểu các công cụ AI và muốn tự động hóa một số quy trình công việc, nhưng không muốn học lập trình từ đầu. Director được thiết kế dành cho những người này. Klein cho biết anh thường nhận được cuộc gọi từ các nha sĩ hỏi về cách tự động hóa hoạt động của các cổng thông tin bảo hiểm. Điều này khiến tôi nhận ra rằng nhu cầu về tự động hóa web thực sự rộng hơn nhiều so với tôi nghĩ.
Khái niệm thiết kế này khiến tôi nhớ đến v0 của Vercel hoặc con đường phát triển của các nền tảng không cần mã khác. Về cơ bản, Browserbase đang hạ thấp ngưỡng tự động hóa web, cho phép nhiều người hơn tận hưởng được hiệu quả tăng lên do tự động hóa mang lại. Hơn nữa, mã do Director tạo ra có thể dễ dàng được chuyển giao cho các kỹ sư để phát triển thêm, cung cấp một công cụ chứng minh khái niệm tốt cho các doanh nghiệp.

Tôi đặc biệt đánh giá cao cam kết của Browserbase đối với mã nguồn mở. Họ có một kỹ sư toàn thời gian chịu trách nhiệm cho các dự án mã nguồn mở và tài trợ cho các dự án như ScrapegraphAI. Theo Klein, các công cụ được Browserbase hỗ trợ được tải xuống 1,3 triệu lần mỗi tháng trên GitHub. Chiến lược mã nguồn mở này không chỉ giúp họ xây dựng cộng đồng nhà phát triển mà còn cho phép công nghệ của họ được xác minh và cải thiện rộng rãi hơn.

Điều khiến tôi ấn tượng là khoản đầu tư của Browserbase vào dịch vụ khách hàng. Klein cho biết nhóm kỹ thuật khách hàng của họ đều là những kỹ sư có trình độ cao, bao gồm những người tốt nghiệp Đại học Columbia và Đại học Harvard. Những người này không phải là nhân viên dịch vụ khách hàng theo nghĩa truyền thống, mà là những chuyên gia thực sự có thể giúp các nhà phát triển giải quyết các vấn đề kỹ thuật. Chỉ số cốt lõi của họ là giúp khách hàng đưa sản phẩm vào sản xuất càng sớm càng tốt, thay vì chỉ đơn giản là thời gian phản hồi.
Theo quan điểm về mô hình kinh doanh, Browserbase áp dụng giá dựa trên mức sử dụng, nghĩa là họ chỉ có thể kiếm tiền khi khách hàng thành công. Mô hình kinh doanh phù hợp này cho phép Klein dành nhiều thời gian để giúp khách hàng thành công, bao gồm cung cấp các đề xuất phát hành sản phẩm, phản hồi về cách sử dụng, v.v. Sự tham gia sâu sắc này vào thành công của khách hàng khiến tôi cảm thấy rằng họ giống như các đối tác kỹ thuật của khách hàng hơn là chỉ là nhà cung cấp dịch vụ.

Suy nghĩ sâu sắc của nhà sáng lập: Triết lý kinh doanh từ thất vọng đến giác ngộ
Hành trình kinh doanh của Paul Klein đã cho tôi thấy chiều sâu suy nghĩ của một doanh nhân trưởng thành. Ông xuất thân từ một gia đình có truyền thống kinh doanh lâu đời. Ông nội của ông bắt đầu học trường đêm và cuối cùng trở thành giám đốc điều hành tại National Cash Register, sau đó làm việc trong bộ phận chuyển đổi doanh nghiệp. Hoàn cảnh gia đình này đã mang đến cho Klein sự hiểu biết độc đáo về kinh doanh. Điều thú vị nhất là khi ông mời ông nội đến dự tiệc mừng tài trợ vòng B, ông già đã nói: "Tuyệt lắm, tôi rất cảm kích, nhưng tôi chỉ muốn tham dự tiệc IPO thôi. Khi đó hãy gọi cho tôi". Tiêu chuẩn cao này khiến Klein nhận ra rằng thực sự bây giờ, doanh nhân dễ dàng hơn nhiều so với trước đây.
Kinh nghiệm kinh doanh đầu tiên của Klein, Stream Club, đã dạy cho anh một bài học quan trọng. "Tôi đã thành lập công ty đó vì những lý do sai lầm", anh nói một cách thẳng thắn. Anh đã làm việc tại Twilio trong ba năm, từ khi thực tập sinh đến khi IPO, và sau đó ở lại để lãnh đạo nhóm. Một ngày nọ, anh không đồng ý với người đứng đầu kỹ thuật về một quyết định kiến trúc quan trọng và khi về nhà, anh tình cờ nhận được tin nhắn từ người đồng sáng lập tương lai của mình hỏi liệu anh ấy có muốn cùng làm việc trong một dự án vào cuối tuần không. Họ đã xây dựng một sản phẩm tuyệt vời có tên là Stream Club. Nhưng Klein đã suy nghĩ lại, "Tôi thành lập công ty này vì tôi thích xây dựng, tôi thích ý tưởng kinh doanh và tôi muốn xem mình có thể làm gì. Nhưng tôi không có bất kỳ quan điểm khác biệt nào về thị trường phát sóng trực tiếp".

Sự tự phản ánh trung thực này đã gây ấn tượng với tôi. Klein cho biết những người khởi nghiệp vì muốn trải nghiệm tinh thần kinh doanh thường gặp khó khăn vì họ không có mối liên hệ tình cảm sâu sắc với sản phẩm họ xây dựng để vượt qua thời kỳ khó khăn. "Bạn sẽ thấy khởi nghiệp là như thế nào - rất khó khăn. Xây dựng công ty rất đau đớn, bạn sẽ rụng tóc, bạn sẽ không tập thể dục nhiều, cuộc sống của bạn sẽ không bao giờ giống nhau, bạn sẽ không gặp bạn bè thường xuyên nữa", ông nói. Mô tả thẳng thắn này về thực tế của tinh thần kinh doanh có giá trị hơn những câu chuyện thành công hào nhoáng đó.
Việc Stream Club ngừng hoạt động đã cho Klein thời gian để suy ngẫm về lý do tại sao ông khởi nghiệp. Ông nhận ra rằng bạn chỉ nên khởi nghiệp khi không có ai khác xây dựng những gì bạn cần và bạn là người phù hợp để xây dựng nó. Khi làm việc tại Mux, ông đã dành nhiều thời gian cho công nghệ tự động hóa trình duyệt và công nghệ trình duyệt không đầu, và dần dần hình thành quan điểm mạnh mẽ về cơ sở hạ tầng này. Khi AI và các tác nhân AI xuất hiện, ngày càng nhiều người hỏi ông cách sử dụng công nghệ trình duyệt không đầu. Sau cuộc trò chuyện thứ 20 như vậy, anh nhận ra rằng không ai xây dựng cơ sở hạ tầng để giúp những người này tự động hóa mạng lưới và anh cần phải làm điều đó.
Quan điểm của Klein về tinh thần kinh doanh đơn lẻ cũng rất truyền cảm hứng. "Tôi không trở thành người sáng lập đơn lẻ theo sự lựa chọn", anh nói. "Tôi đã cố gắng để ba người trở thành đồng sáng lập của mình và tất cả họ đều nói không". Nhưng cuối cùng, anh thấy rằng cách này tốt hơn. Là một người sáng lập đơn lẻ, bạn loại bỏ bước liên kết giữa những người đồng sáng lập. Khi có nhiều người đồng sáng lập, những người sáng lập phải liên kết với nhau trước, sau đó là với phần còn lại của công ty. Là một người sáng lập đơn lẻ, chính bạn và công ty là những người luôn hòa hợp. Nếu anh ấy cảm thấy định hướng của công ty không phù hợp với mình, anh ấy có thể triệu tập một cuộc họp toàn thể để liên kết lại.
Tôi đặc biệt đánh giá cao sự hiểu biết của Klein về áp lực. Ông nói rằng, "Áp lực là một đặc ân", một khái niệm bắt nguồn từ khẩu hiệu của giải quần vợt US Open. Ông giải thích, "Khi bạn cảm thấy áp lực từ khách hàng, áp lực từ nhà đầu tư hoặc áp lực từ thế giới, điều đó có nghĩa là bạn đang làm đúng, điều đó có nghĩa là bạn có cơ hội để xây dựng một cái gì đó và mọi người đang dựa vào nó". Cách suy nghĩ này, định hình lại áp lực thành cơ hội, là một công cụ tâm lý có giá trị đối với bất kỳ doanh nhân nào.
Triết lý xây dựng nhóm của Klein cũng phản ánh tư duy sâu sắc của ông. Browserbase nhấn mạnh vào việc xây dựng một nhóm tại chỗ ở San Francisco, làm việc tại văn phòng năm ngày một tuần. Mặc dù điều này có vẻ trái ngược với xu hướng trong kỷ nguyên làm việc từ xa, Klein có logic riêng của mình: "Tuyển dụng tại chỗ tạo ra ngưỡng cao hơn. Ứng viên phải sẵn sàng cam kết làm việc ở đây 40-60 giờ một tuần". Ông tin rằng cách tiếp cận này đã tạo ra một nền văn hóa mạnh mẽ và thu hút những tài năng hàng đầu thực sự đầu tư vào tầm nhìn của Browserbase. Quan trọng hơn, họ đã tuyển dụng rất nhiều cựu nhà sáng lập. "Họ hiểu. Họ hiểu áp lực và rủi ro. Khi họ đến, họ đã đồng hành cùng những gì chúng tôi đang xây dựng."

Điều khiến tôi ấn tượng nhất là họ nhấn mạnh vào "sự dễ bị tổn thương về mặt cảm xúc". Klein cho biết: "Chúng tôi là một công ty dễ bị tổn thương về mặt cảm xúc". "Gần đây, chúng tôi đã thực hiện một bài tập trong các cuộc họp toàn thể, trong đó mọi người lần lượt nói về một điều mà họ đã làm hỏng gần đây". Sự cởi mở này tạo dựng lòng tin và khuyến khích việc chấp nhận rủi ro. Một kỹ sư nói: "Này, tôi đã kích hoạt một lỗi làm hỏng sản xuất và điều đó thực sự khiến tôi tự hỏi liệu mình có phải là một kỹ sư giỏi không?" Ngay lập tức, mọi người có thể nói: "Không, anh là một kỹ sư tuyệt vời, anh đang nghĩ gì vậy?" Nhưng chiều sâu văn hóa của khả năng xác định những bất an nhỏ này và xác thực chúng, rồi thúc đẩy mọi người tiếp tục chấp nhận rủi ro, là rất hiếm.
Độ sâu thị trường được tiết lộ qua những câu chuyện thực tế của khách hàng
Khi tìm hiểu những câu chuyện của khách hàng trên Browserbase, tôi phát hiện ra rằng thị trường sâu sắc và đa dạng hơn nhiều so với những gì tôi nghĩ ban đầu. Mỗi câu chuyện đều tiết lộ một nhu cầu tự động hóa bị bỏ qua nhưng cực kỳ quan trọng trong kinh doanh hiện đại.
Câu chuyện về Pursuit đã mở rộng tầm mắt của tôi về thị trường mua sắm của chính phủ rộng lớn và phức tạp. Đồng sáng lập kiêm Giám đốc công nghệ Brandon Max nói với tôi rằng khi họ gặp Klein lần đầu, Pursuit vừa dành nhiều thời gian và công sức để xây dựng cụm máy tính của riêng mình để thu thập dữ liệu từ các trang web của khu vực công, tìm kiếm các chỉ số về hợp đồng sắp tới và các phòng ban có ngân sách. Max nói với Klein rằng "Thật tệ khi phải tự mình thu thập và chạy cái này". Vài tháng sau, Pursuit chuyển sang Browserbase, hiện đang quét hơn 130.000 trang web đại diện cho các thành phố, quận, trường đại học, sở cứu hỏa, v.v. Sau đó, Pursuit kết hợp thông tin này với một số lượng lớn các yêu cầu theo Đạo luật Tự do Thông tin được gửi cho các đơn đặt hàng để tạo điểm tin cậy cho nhân viên bán hàng, cho họ biết nên liên hệ với ai tốt nhất và cách liên hệ với họ. Max nhấn mạnh: "Dữ liệu này theo luật định phải được công khai". "Chúng tôi cho rằng việc cải thiện chính phủ với mức giá rẻ hơn sẽ tốt hơn cho nơi con em chúng ta lớn lên". Trường hợp này khiến tôi nhận ra rằng tự động hóa không chỉ vì hiệu quả mà còn thúc đẩy tính minh bạch của chính phủ và cạnh tranh công bằng.
Câu chuyện về công ty vận tải sữa 55 năm tuổi thậm chí còn đáng ngạc nhiên hơn. Công ty chưa bao giờ thuê một kỹ sư nào trong toàn bộ lịch sử của mình, vừa mới thuê một kỹ sư đầu tiên trong năm nay. Kỹ sư này đã sử dụng Browserbase để tự động hóa công việc thu thập giá xăng dọc theo một tuyến đường. Trước đây, họ có một nhân viên vận hành sẽ nói: "Được rồi, bạn sẽ đi theo tuyến đường này và đây là nơi bạn dừng lại để đổ xăng". Bây giờ họ đã xây dựng một trợ lý AI có thể tìm giá xăng dựa trên tuyến đường của bạn và cho bạn biết nơi bạn nên đổ xăng. Klein cho biết "Tất cả những điều này đều được thực hiện bởi một kỹ sư đang viết mã rung cảm bằng Browserbase". "Trường hợp đó cho tôi thấy rằng AI thực sự đã thoát khỏi bong bóng Thung lũng Silicon và mọi người đang xây dựng các tác nhân ở giữa Hoa Kỳ, trên phạm vi quốc tế".
Trường hợp sử dụng Structify cho thấy Browserbase có khả năng xử lý các dự án dữ liệu quy mô lớn như thế nào. Đồng sáng lập Ronak Gandhi cho biết công ty khởi nghiệp của ông sử dụng Browserbase để giúp kết hợp các đợt chạy nước rút dự án lớn có thể kéo dài tới một thập kỷ giờ duyệt web chỉ trong một ngày. Quy mô thật đáng kinh ngạc, nhưng quan trọng hơn, Gandhi đã ca ngợi khả năng phản hồi của nhóm Browserbase. Ông cho biết khi Structify có một đợt đẩy dữ liệu lớn, họ sẽ liên hệ với người đứng đầu bộ phận công nghệ của Browserbase, Walker Griggs, trên Slack để nhờ ông đích thân hướng dẫn họ vượt qua những khoảnh khắc này. Loại hỗ trợ kỹ thuật được cá nhân hóa này rất hiếm trong các công ty cơ sở hạ tầng.

Điều khiến tôi quan tâm nhất là trường hợp nha sĩ mà Klein đề cập. Ông cho biết, "Chúng tôi liên tục nghe về các chuyên gia cố gắng tự động hóa một nhiệm vụ chuyên biệt nhưng lặp đi lặp lại. Nha sĩ này đã đặt lịch gọi điện cho chúng tôi và nói rằng họ muốn sử dụng AI để tự động hóa cổng thông tin bảo hiểm của họ. Đó là lúc tôi nhận ra rằng chúng tôi cần phải làm cho sản phẩm của mình dễ tiếp cận hơn". Nhận thức này đã dẫn đến việc ra mắt Director. Hãy tưởng tượng một nha sĩ rất bực bội khi phải giải quyết các giấy phép bảo hiểm đến mức họ sẵn sàng học cách sử dụng công nghệ trình duyệt không đầu để tự động hóa quy trình. Điều này cho thấy mức độ nghiêm trọng của các điểm khó khăn trong các quy trình kinh doanh hiện tại và nhu cầu tự động hóa rộng rãi như thế nào.
Klein cũng chia sẻ một trường hợp sử dụng cụ thể về Kalshi, nền tảng thị trường dự đoán đầu tiên do liên bang quản lý tại Hoa Kỳ. "Bạn có thể bảo người đại diện của mình đến Kalshi, tìm thị trường lãi suất và đặt cược 50 đô la", ông giải thích. "Tương tác này đòi hỏi phải đọc, nhấp và điền vào biểu mẫu trên trang web, đó chính xác là mục đích mà Browserbase được xây dựng". Ví dụ này rất thú vị vì nó cho thấy cách các tác nhân AI có thể tương tác với các nền tảng tài chính phức tạp, điều này có thể rất khó hoặc không thể đạt được bằng tích hợp API truyền thống.
Từ những trường hợp này, tôi thấy một số xu hướng quan trọng. Đầu tiên là sự phổ biến của vấn đề "dặm cuối". Rất nhiều dữ liệu và chức năng có giá trị bị khóa trong các trang web truyền thống mà không có API hiện đại. Thứ hai là tầm quan trọng của "nhu cầu đuôi dài". Mỗi ngành đều có nhu cầu tự động hóa cụ thể, có vẻ như là ngách nhưng thực sự quan trọng. Thứ ba là xu hướng "dân chủ hóa kỹ năng". Khi các công cụ trở nên dễ sử dụng hơn, các chuyên gia không chuyên về kỹ thuật cũng bắt đầu xây dựng các giải pháp tự động hóa của riêng họ.
Sâu hơn nữa, những trường hợp này cho thấy vấn đề "ma sát tiềm ẩn" trong nền kinh tế hiện đại. Có quá nhiều quy trình kinh doanh vẫn dựa vào con người để thực hiện các tác vụ mạng lặp đi lặp lại, không phải vì các tác vụ này phức tạp mà vì thiếu các công cụ phù hợp để tự động hóa chúng. Browserbase đang lấp đầy khoảng trống này, cho phép các doanh nghiệp tập trung vào các hoạt động có giá trị cao hơn.
Một quan sát của Klein đặc biệt sâu sắc: "Hầu hết khách hàng của chúng tôi thực sự là những người đã tự mình xây dựng điều này. Chúng tôi thực sự đã chạm đến điểm khó khăn. Những người đã tự mình xây dựng và duy trì ngăn xếp công nghệ này sẽ nói: 'Thôi bỏ đi! Tôi không muốn nó.'" Điều này cho thấy sự trưởng thành của thị trường và tính xác thực của nhu cầu. Đây không phải là những khách hàng đã bị thuyết phục bởi tiếp thị, mà là những chuyên gia đã cố gắng tự mình giải quyết vấn đề và thấy khó khăn.
Suy nghĩ về Tương lai của Tương tác trên Web
Theo góc nhìn rộng hơn, tôi nghĩ Browserbase đại diện cho một hướng đi quan trọng trong quá trình phát triển của Tương tác trên Web. Chúng ta đang ở thời điểm chuyển giao khi giao diện người dùng truyền thống dựa trên nhấp chuột đang nhường chỗ cho tương tác dựa trên ý định. Người dùng không còn cần biết "cách" hoàn thành nhiệm vụ nữa, họ chỉ cần thể hiện nhiệm vụ nào họ "muốn" hoàn thành. Sự thay đổi này quan trọng như bước nhảy vọt từ dòng lệnh sang giao diện đồ họa.
Klein đã đề cập đến một điểm rất quan trọng: xác thực là nút thắt chính đối với ứng dụng tác nhân AI quy mô lớn. Nếu bạn muốn AI giúp bạn đặt chuyến bay, nó cần phải đăng nhập vào tài khoản hãng hàng không của bạn. Nhưng chia sẻ mật khẩu với AI rõ ràng không phải là cách tốt nhất và hầu hết các trang web đều không có hệ thống xác thực chuyên dụng được thiết kế cho tác nhân AI. Vấn đề này cần được giải quyết bởi các nhà cung cấp dịch vụ xác thực như Okta và Clerk, những người cần cung cấp một số loại chức năng "xác thực proxy" để AI có thể thực hiện các hoạt động một cách an toàn thay mặt cho người dùng.
Tôi cũng đang suy nghĩ về các vấn đề đạo đức của việc thu thập dữ liệu web. Mặc dù Klein nhấn mạnh rằng Browserbase chủ yếu tập trung vào tự động hóa hơn là thu thập dữ liệu, nhưng thực tế là nhiều khách hàng thực sự đang sử dụng dịch vụ của họ để thu thập dữ liệu mạng. Đây là một vấn đề phức tạp vì một mặt, nhiều dữ liệu phải được công khai theo yêu cầu pháp lý; mặt khác, việc thu thập tự động trên quy mô lớn có thể là gánh nặng cho các trang web. Thực hành của Browserbase là xem xét các trường hợp sử dụng của tất cả các khách hàng quy mô lớn và thẩm định "biết khách hàng của bạn" (KYC) này có thể vượt quá nghĩa vụ pháp lý của họ.

Theo quan điểm phát triển công nghệ, tôi nghĩ rằng chúng ta đang bước vào kỷ nguyên mà "người dùng Internet không phải con người" xuất hiện với số lượng lớn. Mã xác minh truyền thống (CAPTCHA) được thiết kế để ngăn chặn các rô-bốt độc hại, nhưng giờ đây chúng ta cần phân biệt giữa "rô-bốt tốt" và "rô-bốt xấu". Điều này có thể yêu cầu các cơ chế xác thực và xác minh ý định phức tạp hơn.
Tôi cũng tò mò về cách các giao thức chuẩn hóa như Giao thức bối cảnh mô hình (MCP) ảnh hưởng đến hệ sinh thái này. MCP là một cách chuẩn hóa để các nhà phát triển đưa các công cụ như điều khiển trình duyệt vào các tác nhân AI dưới dạng các hàm có thể gọi được. Việc chuẩn hóa này có thể khiến tự động hóa web trở nên phổ biến và dễ sử dụng hơn.
Cạnh tranh thị trường và triển vọng phát triển
Theo quan điểm đầu tư, tốc độ tăng trưởng nhanh chóng và định giá cao của Browserbase phản ánh sự tự tin của thị trường vào hướng đi này. Glenn Solomon của Notable Capital đã so sánh Browserbase với Vercel, lập luận rằng nếu bạn có thể xây dựng một dịch vụ tuyệt vời có thể dự đoán và đáp ứng nhu cầu của các nhà phát triển, thì đây sẽ là một đề xuất giá trị rất hấp dẫn. Tăng trưởng từ con số 0 lên hơn 1.000 khách hàng chỉ trong 16 tháng là tốc độ hiếm thấy ở các công ty cơ sở hạ tầng.
Về mặt cạnh tranh, tôi nhận thấy Perplexity đã mua lại công ty khởi nghiệp trình duyệt web Comet trong năm nay, cho thấy các công ty AI lớn cũng đang chú ý đến lĩnh vực này. Nhưng Klein tin rằng sự cạnh tranh từ các nhà cung cấp mô hình không phải là mối đe dọa lớn ở thời điểm hiện tại vì Browserbase tập trung vào cơ sở hạ tầng và các công cụ dành cho nhà phát triển thay vì các ứng dụng trực tiếp cho người tiêu dùng.
Tôi nghĩ rằng hào nước của Browserbase đến từ một số khía cạnh: thứ nhất là chiều sâu của công nghệ, đặc biệt là chuyên môn về vận hành và tối ưu hóa trình duyệt quy mô lớn; thứ hai là hệ sinh thái nhà phát triển, hiệu ứng mạng được hình thành thông qua các dự án nguồn mở và xây dựng cộng đồng; và cuối cùng là chất lượng dịch vụ khách hàng, lòng trung thành được thiết lập thông qua sự tham gia sâu sắc vào thành công của khách hàng.
Xét về quy mô thị trường, tôi nghĩ rằng thị trường này còn lâu mới bão hòa. Khái niệm "vibe coder" mà Klein đề cập đặc biệt thú vị vì nó đại diện cho một thị trường tiềm năng khổng lồ: những người có hiểu biết nhất định về kỹ thuật nhưng không phải là nhà phát triển chuyên nghiệp. Khi các công cụ AI trở nên phổ biến hơn, quy mô của nhóm này sẽ ngày càng lớn hơn và nhu cầu của họ đối với các công cụ tự động hóa sẽ ngày càng mạnh mẽ hơn.
Tôi cũng lạc quan về tiềm năng phát triển của Browserbase trong các ngành dọc. Từ nha sĩ đến các công ty vận chuyển sữa, từ mua sắm của chính phủ đến thu thập dữ liệu, nhiều ngành khác nhau có số lượng lớn các hoạt động web lặp đi lặp lại cần được tự động hóa. Những nhu cầu này thường rất cụ thể và chuyên nghiệp, đòi hỏi các giải pháp chuyên biệt. Là một nền tảng cơ sở hạ tầng, Browserbase có thể hỗ trợ phát triển nhiều ứng dụng dọc khác nhau.
Khai sáng cho toàn bộ ngành
Cuối cùng, tôi muốn chia sẻ một số suy nghĩ về toàn bộ ngành. Thành công của Browserbase đã khiến tôi thấy được giá trị của "công nghệ nhàm chán". Tự động hóa trình duyệt nghe có vẻ không thú vị bằng AGI hay lái xe tự động, nhưng nó giải quyết được những vấn đề thực tế và cấp bách. Nhiều lần, các công ty công nghệ thành công nhất là những công ty tập trung vào việc giải quyết các vấn đề cụ thể, thay vì theo đuổi công nghệ tiên tiến nhất.
Một phép so sánh mà Klein thường đề cập rất thú vị: Browserbase giống như Twilio đối với các cuộc gọi điện thoại và Stripe đối với thanh toán, đó là cơ sở hạ tầng cho tự động hóa web. Mô hình kinh doanh "ống và xẻng" này thường là mô hình ổn định và có giá trị nhất trong một cuộc cách mạng công nghệ. Khi mọi người đang đào vàng, người bán xẻng thường kiếm được nhiều tiền nhất.
Tôi cũng thấy được tầm quan trọng của chiến lược nguồn mở từ sự phát triển của Browserbase. Họ không chỉ mở nguồn các công cụ của riêng mình mà còn tích cực tham gia và tài trợ cho cộng đồng nguồn mở. Chiến lược này không chỉ giúp họ xây dựng danh tiếng về mặt kỹ thuật mà còn cho phép họ nhận được phản hồi và đóng góp từ cộng đồng. Trong không gian công cụ dành cho nhà phát triển, nguồn mở gần như là điều bắt buộc để xây dựng lòng tin và cộng đồng.
Về mặt tài chính, tôi nghĩ Browserbase đã thể hiện nhịp độ tài chính tốt. Họ đã hoàn thành bốn vòng tài chính trong 15 tháng, mỗi vòng đều có các mốc quan trọng và kế hoạch sử dụng rõ ràng. Việc tài trợ nhanh chóng và có trật tự này cho phép họ nắm bắt các cơ hội trong thời gian thị trường mở cửa đồng thời tránh pha loãng quá mức.
Cuối cùng, tôi nghĩ câu chuyện về Browserbase cho chúng ta biết rằng trong kỷ nguyên AI, cơ sở hạ tầng và lớp công cụ có thể quan trọng hơn lớp ứng dụng. Mọi công nghệ mang tính cách mạng đều cần cơ sở hạ tầng hỗ trợ để hỗ trợ nó. Giống như điện toán đám mây cần AWS và ứng dụng di động cần App Store, các ứng dụng AI cũng cần cơ sở hạ tầng như Browserbase để kết nối trí tuệ ảo và thế giới thực. Tôi tin rằng khi các tác nhân AI trở nên phổ biến hơn, tự động hóa web sẽ trở thành một thị trường trị giá hàng tỷ đô la và Browserbase có khả năng trở thành một nhân tố quan trọng trong thị trường này.