海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする

Unstructured-IOは、画像やPDF、HTML、Word文書などのテキスト文書を処理・前処理するためのさまざまなオープンソースコンポーネントを提供します。主な目的は、データ処理ワークフロー、特に大規模言語モデル(LLM)アプリケーションの簡素化と最適化です。Unstructured-IOのモジュラー機能とコネクターは、データの取り込みと前処理を効率化し、さまざまなプラットフォームに適応できる統合システムを形成します。

Unstructured:开源预处理非结构化文档,无结构数据处理的利器-1

 

 

機能一覧

  • データの取り込みと前処理
  • 複数のドキュメントタイプに対応(PDF、HTML、Wordなど)
  • モジュラー機能とコネクター
  • オープンソースのAPIとクライアントライブラリを提供
  • Dockerコンテナによるデプロイをサポート
  • パフォーマンスを向上させるサーバーレスAPIの提供

 

 

ヘルプの使用

設置プロセス

  1. Dockerコンテナ・ランタイム・ライブラリの使用
    • Dockerがインストールされていることを確認する。
    • 以下のコマンドを実行し、適切なDockerイメージをダウンロードして実行する:
      docker pull downloads.unstructured.io/unstructured-io/unstructured:latest
      docker run -it --rm downloads.unstructured.io/unstructured-io/unstructured:latest
      
  2. PyPIからライブラリをインストールする
    • インストールにはpipを使う:
      pip install unstructured
      
  3. 地域開発インストール
    • GitHubリポジトリをクローンする:
      git clone https://github.com/Unstructured-IO/unstructured.git
      cd unstructured
      pip install -e .
      

 

使用ガイドライン

  1. データの取り込み
    • 利用する unstructured ライブラリーは文書を取り込む:
      from unstructured.partition.pdf import partition_pdf
      document = partition_pdf("example.pdf")
      
  2. データ前処理
    • 書類を整理して塊にする:
      from unstructured.cleaners.core import clean
      cleaned_document = clean(document)
      
  3. データソースとターゲットへの接続
    • コネクタを使用して、データをターゲット・ロケーションに転送する:
      from unstructured.connectors import send_to_destination
      send_to_destination(cleaned_document, destination="s3://bucket-name")
      
  4. サーバーレスAPI
    • 登録し、APIキーを取得します:
      • インタビュー 非構造化API登録ページ
      • APIキーを取得し、使用を開始する:
        import requests
        headers = {"Authorization": "Bearer YOUR_API_KEY"}
        response = requests.post("https://api.unstructured.io/process", headers=headers, json={"document": "example.pdf"})
        
0ブックマークに登録
0表彰される
ダック&ペアAI記事スマートライター
選考 → 執筆 → 出版
全自動!
ワードプレスAIライティング・プラグイン
500人以上のコンテンツクリエイターが利用している
🎯インテリジェント・セレクション: バッチ生成、疲労困憊にさようなら
🧠検索機能強化ネットワーク + 深みのある知識ベース
全自動執筆 → グラフィック → 出版
💎永久無料無料版=有料版、無制限
🔥 今すぐ無料でプラグインをダウンロードしてください!
永久無料 · 100% オープンソース · 🔒 データのローカルストレージ

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力してください。Bing検索へのアクセシビリティAIツールはこのサイトですぐに見つけることができる。

新着情報

最新のAIツール

トップに戻る