Unstract

非構造化ドキュメントから構造化JSONデータを抽出するLLM駆動プラットフォーム

PDFや画像などのドキュメントからLLMを使用して構造化されたJSONデータを抽出します。自然言語プロンプトで抽出内容を定義し、APIまたはETLパイプラインとしてデプロイ可能な包括的なドキュメントAIプラットフォームです。

Author: Zipstack

Stars: 6,653

GitHub

Install: docker pull unstract/backend