問題の背景
Spegelは現在、静的なWebページ(GETリクエスト)のみをサポートしており、JavaScriptレンダリングに依存する動的コンテンツ(SPAアプリケーションなど)は正しく解析できません。
オルタナティブ
- プリレンダリングツールのフィット感使用
puppeteerもしかしたらplaywright動的Webページの完全なHTMLを取得し、それをSpegelで処理する。 - APIダイレクトコール対象のWebサイトがAPIを提供している場合、構造化データを取得するスクリプトを記述し、Spegelのカスタムビューで出力をフォーマットできます。
- スタティックキャッシュの使用
wgetダイナミック・ページをローカルのHTMLファイルとして保存する(例えばwget --no-check-certificate -O page.html <URL>)、Spegelでローカルファイルをロードする。
将来の最適化のための提言
開発者はプロジェクトの GitHub にある Issues ボード (例: #42) をフォローすることができ、そこではコミュニティが Headless ブラウザサポートの統合について議論しています。今のところ、主に静的なコンテンツ(ドキュメントやニュースなど)を持つサイトを優先することが推奨されています。
この答えは記事から得たものである。シュペーゲル:AIを使ってウェブページをエンド・ツー・エンドのブラウジング体験に変えるについて





























