PDFファイルをExcel (XLSX)形式に変換するには、まず「ファイルのアップロード」コントロールを使用してPDFをアップロードします。変換ワークフローは各ページを処理し、表領域と構造化データの検出を試みます。スキャン画像ではなくデジタルソースから生成されたPDFの場合、表検出は多くの場合確実に機能します。行と列は編集可能なスプレッドシートのセルに再構築され、ほとんどのテキストコンテンツと数値が保持されます。変換が完了したら、生成されたXLSXファイルをダウンロードします。個々のスプレッドシートを取得することも、一括ダウンロードオプションを使用してすべての出力を含むZIPアーカイブを取得することもできます。複数ページのPDFを扱う場合、ツールの設定に応じて、各ページを個別のワークシートにエクスポートするか、結合することができます。 PDF に複雑なレイアウト(結合セル、複数行のヘッダー、不規則な間隔など)が含まれている場合は、変換後に Excel 内で調整が必要になる場合があります。スキャンした PDF の場合は、テキストが埋め込まれた画像は事前にテキスト抽出を行わないとスプレッドシートのネイティブセルに変換できないため、変換前に OCR を実行することを検討してください。一般的な後処理タスクには、数値形式の検証、列幅の調整、ヘッダーがそれぞれのデータ行と揃っていることの確認などがあります。全体的なプロセスは簡単です。アップロード、変換、ダウンロードを行い、XLSX ファイルを Excel、Google スプレッドシート、またはその他のスプレッドシートエディタで開いて、クリーンアップと分析を行います。
ヒント: 最良の結果を得るには、表の境界線が明確で、間隔が一定であるデジタル PDF を使用してください。これにより、自動表再構築の精度が最大限に高まります。