ソリューション:SkyServeによるワンクリックモデルのサービタイゼーション
背景: 従来のデプロイメントでは、ロードバランシング、HTTPS証明書、容量の自動拡大・縮小などの複雑なコンポーネントを手動で設定する必要がありました。
- 配備プロセス
- YAMLで定義する
serviceセグメント構成:replica: 2少なくとも2部ports: 8080サービスポートの指定load_balancer: rrポーリング負荷分散の使用
- はこびだす
sky serve up serve.yaml --name my-service - とおす
sky serve statusHTTPSアクセス・エンドポイントを取得する
- YAMLで定義する
- 主要なセーフガード・メカニズム
- 自然回復インスタンス・クラッシュから30秒以内にリビルドする。
- ゼロダウンタイム更新YAMLを修正して実行する
sky serve updateブルーグリーン展開の実現 - モニターアラームプロメテウス・メトリクス・エクスポージャー・インターフェースの統合
- 生産に関する推奨事項
- セットアップ
resources.autostop: false計画外のサービス終了の防止 - 利用する
service.endpoint.timeout妥当なタイムアウトしきい値を設定する - とおす
sky.serve.logsすべてのレプリカログを一元的に収集
- セットアップ
効果:実際のテストによると、このソリューションは99.95%のSLA保証を達成し、導入時間は2時間から5分に短縮された。
この答えは記事から得たものである。SkyPilot: あらゆるクラウドでAIとバッチタスクを効率的に実行するオープンソースフレームワークについて































