著者:Michael O'Rourke出典:Cointelegraph翻訳:Good Oba、Golden Finance
オープンデータの可能性をフルに発揮し、低コストの大規模言語モデル(LLM)トレーニング、簡単な研究データ共有、止められないDAppホスティングを享受するためには、中央集権型インフラから分散型インフラへと移行しなければならない。低コストの大規模言語モデル(LLM)トレーニング、簡単な研究データの共有、止められないDAppホスティングを享受するためには、中央集権型のインフラから分散型のアーキテクチャへと移行しなければなりません。
現在、オープンデータは、3500億ドルを超える市場評価額を持つ、台頭するグローバルテクノロジー経済の重要なイネーブラーです。しかし、多くのオープンデータソースは中央集権的なインフラに依存しており、自律性と検閲への抵抗というWeb3の概念に反している。
オープンデータの可能性をフルに引き出すには、分散型インフラへのシフトが必要です。オープンデータのエコシステムが分散化されたオープンなアーキテクチャに移行すれば、ユーザーアプリの複数の脆弱性に対処できるようになります。
分散型インフラには、以下を含む幅広いシナリオがあります:
- 分散型アプリケーションのホスティング(DApp)
- 取引ロボットの実行
- 研究データの共有
- 研究データの共有研究データの共有
- LLMのためのトレーニングと推論
これらのユースケースを掘り下げると、次のことがわかります。
これらのユースケースを掘り下げると、分散化されたアーキテクチャは、集中化されたインフラよりも効率的で実用的なオープンデータの利用が可能であることがわかります。
LLMのトレーニングと推論にかかるコストは少ない
オープンソースのAIDeepSeekのリリースは、次のようなものです。オープンソースのAIDeepSeekのリリースは、一時は米国のハイテク市場を1兆ドル蒸発させたが、オープンソースのプロトコルの力を実証した。これは、オープンデータを核とする新しいグローバル経済を懸念すべきだという警告である。
現在、クローズドで中央集権的なAIモデルは訓練にコストがかかるため、LLMが訓練して精度の高い結果を生成する能力にも影響を与えている。たとえば、DeepSeek R1 の最終的なトレーニング コストはわずか約 550 万ドルでしたが、OpenAI の GPT-4 トレーニングは 1 億ドル以上でした。しかし、新興のAI産業はいまだに中央集権的なインフラプラットフォーム(LLM APIプロバイダーなど)に依存しており、これはオープンソースイノベーションの考え方と矛盾しています。
実際、Llama 2やDeepSeek R1のようなオープンソースのLLMをホストすることは、シンプルで安価です。常に同期を必要とするステートフル・ブロックチェーンとは異なり、LLMはステートレスで、定期的な更新しか必要としません。
LLMの実行は比較的単純であるにもかかわらず、ノードランナーはGPUコンピューティングパワーを必要とするため、オープンソースモデルで推論を実行するための計算コストは依然として高い。しかし、これらのモデルは更新をリアルタイムで同期する必要がないため、長期的には大幅なコスト削減が可能であることは注目に値します。
GPT-4のような汎用ベースモデルの台頭は、文脈的推論に基づく新しい製品開発を可能にしました。しかし、OpenAIのような中央集権的な企業は、推論のためにトレーニングモデルにアクセスすることを許可しません。
その代わりに、分散型ノードランナーは、AIのエンドポイントとして機能し、顧客に決定論的データを提供することで、オープンソースLLMの開発をサポートすることができます。分散型ネットワークは、事業者がネットワーク上でゲートウェイを立ち上げる権限を与えることで、参入障壁を低くします。
これらの分散型インフラプロトコルは、オープンソースのコアゲートウェイとサービスインフラを通じて、パーミッションレスのネットワーク上で何百万ものリクエストを処理する。その結果、どんな起業家や事業者でもゲートウェイを展開し、新興市場に参入することができます。
例えば、あるチームはライセンスフリーのプロトコルであるAkashでLLMを訓練するために分散型の計算資源を活用することができ、集中型のクラウドサービスプロバイダーよりも85%安くカスタマイズされたコンピューティングサービスを提供することができます。中央集権型のクラウド・プロバイダーよりも85%安くコンピューティング・サービスを提供することができます。
AI企業は現在、LLM推論サービスを実行するために、インフラストラクチャのメンテナンスに1日あたり約100万ドルを費やしています。これは、AI インフラストラクチャ市場が年間規模(SAM)で約 3 億 6500 万ドルに達する可能性があることを意味します。
このデータは、市場の状況が分散型インフラの巨大な成長の可能性を指し示しており、分散型AIコンピュートリソースの今後の発展により、業界のイノベーションの余地がさらに広がることを示唆しています。
アクセス可能な研究データ共有
科学研究の分野では、機械学習や大規模言語モデリング(LLM)と組み合わせたデータ共有は、研究プロセスを加速させ、人間の生活を向上させる可能性を秘めています。人間の生活を向上させる可能性を秘めている。しかし、データへのアクセスは、高コストの学術ジャーナルのシステムによって制限されている。これらの学術誌は、委員会によって承認された研究のみを選択的に出版しており、そのほとんどが高額な購読料の陰に隠れているため、広くアクセスすることが困難なのです。
ブロックチェーンをベースとしたゼロ知識(ZK)機械学習モデルの台頭により、機密情報を明らかにすることなく、プライバシーを守りながら信頼のない環境でデータを共有・計算できるようになりました。その結果、研究者や科学者は、潜在的に制限された個人を特定できる情報を非匿名化することなく、研究データを共有し、アクセスすることができます。
オープンな研究データを持続的に共有するためには、研究者は、データアクセスに関してインセンティブを与え、仲介者を排除する分散型インフラを必要としています。インセンティブを与えるオープンデータ・ネットワークは、高価なジャーナルや民間企業を超えて、科学データがアクセス可能であり続けることを保証するかもしれない。
止められないDAppホスティング
Amazonクラウドサービス(AWS)、Googleクラウド、Microsoft Azureは、DAppホスティングを提供しています。Microsoft Azureなどの集中型データホスティングプラットフォームは、アプリ開発者の間で非常に人気があります。これらのプラットフォームへのアクセスは簡単ですが、集中型プラットフォームには単一障害点のリスクがあり、信頼性に影響し、まれではありますが正当なサービスの中断につながる可能性があります。
テクノロジーの歴史を通じて、IaaS(Infrastructure-as-a-Service)プラットフォームが中断のないサービスを提供できないことはよくあることです。例えば、
- 2022年、MetaMaskは、Infuraの米国制裁への準拠のため、特定の地域のユーザーへのアクセスを一時的に拒否しました。MetaMaskは分散型ですが、そのデフォルトの接続とエンドポイントは、イーサへの集中型Infuraアクセスに依存しています。
- 2020年には、Infuraの顧客も障害を経験しました。
- SolanaとPolygonは、トラフィックのピーク時に集中型リモート プロシージャー コール (RPC) サービスに過負荷をかけ、ネットワークの輻輳を引き起こしました。
繁栄するオープン ソース エコシステムでは、さまざまな開発者のニーズに一社で対応することは困難です。今日、市場には何千ものレイヤー1ブロックチェーン、ロールアップ・ソリューション、インデックス作成サービス、ストレージ・プロトコル、およびその他のミドルウェア・プロトコルがあり、多様なユースケースをカバーしています。
RPCプロバイダーのようなほとんどの中央集権型プラットフォームは、同じインフラを構築し続け、摩擦を生むだけでなく、成長速度を鈍らせ、スケーラビリティに影響を与えますが、プロトコルはレイヤー1ブロックチェーンに焦点を当てています。strong>というのは、プロトコルが新機能の開発よりも基盤の再構築に重点を置いているからです。
対照的に、BlueSkyやAT Protocolのような分散型SNSアプリの成功は、分散型プロトコルに対するユーザーの需要が高まっていることを示しています。中央集権的なRPCから離れ、オープンなデータアクセスへと向かうこれらのプロトコルは、分散型インフラストラクチャを構築し、採用することの重要性を思い出させてくれます。
例えば、Decentralised Finance (DeFi)プロトコルは、価格情報やリアルタイムの市場データを中央集権的なAPIに頼ることなく、Chainlinkからオンチェーンの価格データを取得することができます。
現在、ウェブ3のマーケットプレイスには、約1000億のサービス可能なRPCリクエストがあり、100万リクエストあたり$3~$6のコストがかかっています。その結果、Web3 RPCの総アドレス可能市場規模(TAM)は、年間約1億ドルから2億ドルです。新しいデータ可用性レイヤーの着実な成長により、1 日あたりの RPC リクエスト数は 1 兆を超える可能性があります。
分散型インフラへの移行は、オープンデータ配信の成長に対応し、オープンソースデータ市場に参入するために不可欠です。
Open Data Needs Decentralised Infrastructure
長期的には、一般的なブロックチェーンクライアントをオフロードすることになるでしょう。長期的には、一般的なブロックチェーンクライアントが、ストレージとネットワーク機能を、専用のミドルウェアプロトコルにオフロードすることになるでしょう。
たとえば、Solanaは、Arweaveのようなチェーンにデータを保存する最初の企業として、分散型ストレージを推進する先駆者となりました。その結果、SolanaとPhantomは再び、金融と文化の歴史における重要な瞬間である、トランプ大統領選挙キャンペーンのミームトークンの取引トラフィックを処理するための主要なツールとなった。
将来的には、より多くのデータがインフラストラクチャプロトコルを通じて流れるようになり、ミドルウェアプラットフォームがプロトコルレイヤーに重要な依存関係を持つようになるでしょう。プロトコルがよりモジュール化され、拡張可能になるにつれて、オープンソースの分散型ミドルウェアがプロトコル層で統合するためのスペースが生まれるでしょう。
軽いクライアントのヘッダーデータを中央集権的な企業に仲介させることは、将来的には実現不可能になるでしょう。非中央集権的なインフラは、信用を必要とせず、分散され、費用対効果が高く、検閲されていません。"text-align: left;">を推進し、相互に有益な成長モデルを推進します。