opendataloader-project / opendataloader-pdf
OpenDataLoader PDF は、PDF ドキュメントを AI や RAG パイプライン向けの Markdown、JSON、HTML といった構造化フォーマットへ変換するために設計された高性能なオープンソースパーサーです。決定論的なローカル解析と AI による分析を組み合わせたハイブリッド処理モードを備えており、複雑な表や数式、スキャンされたドキュメントに対して業界最高水準の抽出精度を実現します。さらに、国際標準に準拠した Tagged PDF のエンドツーエンド生成を含む、自動化されたアクセシビリティソリューションを提供します。