
PDFからテキストをコピーする
PDFに含まれるテキストをコピー(抽出)したいとき、その形式により方法は異なります。多くのPDFは、テキストを簡単にコピーできますが、スキャンされた画像ベースのPDFの場合は、はじめにイメージのテキスト化が必要になります。本記事では、それぞれの形式で、テキストをコピーする方法について紹介します。

対象OS Windows 10、Windows 11
PDFファイルからテキストをコピー(抽出)する
PDFファイルは、アドビ社が開発したデジタル文書フォーマットです。文書のレイアウトそのままでデジタル化し、WindowsやMac、スマホなど、異なるプラットフォームやデバイスでも同じレイアウトのまま表示することができます。その汎用性の高さから、電子書籍やマニュアル、契約書など、様々な目的で利用されています。
PDFファイルには、文書ファイルをPDF化したテキスト形式と、イメージスキャンされた画像形式のタイプが存在します。
多くのPDFファイルは、文書ファイルをベースに作成されているため、簡単に文書内のテキストを選択、コピーすることが可能ですが、画像形式のPDFファイルの場合、そのままではコピーすることができません。
コピーできないときは、OCR(文字認識機能)でテキスト化
このような、画像ベースで作成されたPDFファイルからテキストをコピーしたいときは、OCRを使ったテキスト化(文字起こし)が必要です。
OCRとは「文字認識技術」のことで、画像内に含まれる文字をテキスト情報として認識する技術のことです。この技術を用いることで、画像ベースのPDFから文字を抽出し、テキスト化します。
本記事では、テキスト形式のPDFファイルから文字をコピーする方法と、高機能なPDF編集ソフト「PDFelement(PDFエレメント)プロ版」のOCR機能を使って、PDFファイルをテキスト化する方法を紹介します。
1.PDFからテキストをコピーする(テキスト形式のPDFの場合)
Windows 10・11のデフォルト設定では、PDFファイルを開くためのアプリケーションとして、Microsoft Edgeが関連づけられています。このステップでは、テキスト形式のPDFファイルから、テキストをコピーする方法を紹介します。
-
EdgeなどのアプリでPDFを開き、コピーしたいテキストを選択します。
コピーしたいテキストを選択します。 -
選択したらマウスを右クリックして、[コピー]をクリックします。
[コピー]をクリックします。
ヒント:
コピーしたテキストはクリップボードにコピーされ、任意の場所に貼り付けることができます。ここでは、Edgeを例に説明していますが、Adobe AcrobatやGoogle Chrome、PDFelementなど、他のアプリで開いた場合でも、テキストのコピー方法は同じです。
2.テキストがコピーできないときは(画像形式のPDFの場合)
画像形式のPDFファイルの場合、そのままではテキストを選択してコピーすることができません。PDFファイルが画像形式の場合は、はじめにOCR(文字認識機能)を使った文字起こしが必要です。ここでは、多機能なPDF編集アプリ「PDFelement プロ版」のOCR機能を使って、テキスト化する方法を紹介します。
-
ファイルを右クリックし、[プログラムから開く]>[Wondershare PDFelement]と選択します。
[PDFelement]と選択します。 -
ホーム または ツールにある、[OCR処理]をクリックします。
[OCR処理]をクリックします。 -
OCRのスキャンオプションを選択して、[適用]ボタンをクリックします。
[適用]ボタンをクリックします。 -
OCRの文字起こしが完了すると、テキストがコピー/編集できるようになります。
テキストがコピーできるようになります。
ヒント:
PDFが別のアプリに関連付けられている場合、「Wondershare PDFelementをデフォルトのPDFアプリケーションとして設定します」とメッセージが表示されます。[はい]ボタンをクリックすることで、PDFelementを既定のアプリに変更できます。
ヒント:
画像ベースのPDFファイルをPDFelementで開くと、ツールバーに「スキャンされたPDFファイルです。このPDFを検索・編集するにはOCR機能を実行する必要があります」とメッセージが表示されます。ここで、[OCRを実行する]ボタンをクリックすると、すぐに文字起こしを実行できます。
オプションをスキャン |
-スキャンして編集可能なテキストに変換:PDF画像内のテキストをコピー/編集できるようにします。 -画像をスキャンして検索可能なテキストに変換:PDF画像内のテキストを検索可能にします。 |
---|---|
ページ範囲 | OCR機能でスキャンする範囲を選択します。 |
言語認識 | テキストの言語を指定します。 |
PDF内の表をコピーしたいときは?
文書に表がある場合、テキスト化されたPDFであっても、通常は表としてコピーすることができません。(例えば、Excelにコピーした場合、1つのセルに全てのテキストと数値が貼り付けされてしまいます)
PDFで、表を表のままコピーしたい場合は、「PDFelement」の表の認識機能が役立ちます。表認識させることで、表データとしてExcelやWordに貼り付けすることができます。
3.PDFの表をコピーする
画像としてスキャンされたPDFファイルの場合は、先に[OCR処理]を実行して、テキスト化を完了させてください。
-
ファイルを「PDFelement」で開き、[ツール]メニューをクリックします。
[ツール]をクリックします。 -
ツールに切り替わったら、メニューの中から[表の認識]をクリックします。
[表の認識]をクリックします。 -
表の認識「認識が完了しました」と表示されたら、[表を選択]ボタンをクリックします。
[表を選択]ボタンをクリックします。 -
コピーしたい表をクリックし、右上に表示される[コピー]ボタンをクリックします。
[コピー]ボタンをクリックします。
ヒント:
コピーした表は、ExcelやWordに貼り付けることができます。

PDFの作成・編集・変換・結合・圧縮・署名・OCR機能を搭載
Wondershare PDFelement プロ版
PR
- 【アプリ概要】
- - PDFファイルをワード感覚で自在に編集。AIアシスタント+ChatGPT連携機能を搭載。
- - パスワード設定やデジタル署名にも対応。
- 開発元:Wondershare
「PDFelement」には、無料トライアル版が用意されているので、PDFファイルの編集や管理に役立つ各機能を購入前に試用することができます。また、リーズナブルなPDFelement標準版も用意されています。(OCR機能はプロ版で利用できます)
PDFelementの主な機能
ファイルのパスワード設定や電子署名、OCR機能など、PDFの編集・管理に必要な機能を幅広く搭載しています。

❶ ファイルのパスワード設定や電子署名に対応。また、テキストの墨消し機能を搭載しており、機密性の高い情報を安全に保護します。

❷ 話題のChatGPTに対応。作成した文章の校正や要約を自動化。文章がAIにより作成されたかどうか予測することもできます。

❸ ビジネスや教育など、様々なシーンで利用できるテンプレートを用意。このアプリだけでドキュメントを自在に作成できます。
PDFelement 無料トライアル版 | PDFelement 標準版 | PDFelement プロ版 | |
---|---|---|---|
PDF作成、PDF文書を閲覧 | ✓ | ✓ | ✓ |
PDF変換や印刷のバッチ処理 | ー | ー | ✓ |
OCR光学文字認識、OCRのバッチ処理 | 処理後の結果をプレビュー可(7日間試用可能) | ー | ✓ |
PDF圧縮、圧縮バッチ処理 | 7日間試用可能 | ー | ✓ |
PDF内のオブジェクトを直接編集 | 14日間試用可能 | ✓ | ✓ |
PDFをWord、Excel、Powerpointに変換 | 3ページまで(14日間試用可能) | ✓ | ✓ |
PDFに注釈を追加 | 3回無料 | ✓ | ✓ |
関連サイト(外部)
[公式]PDF編集はこれ1本でOK!| Wondershare PDFelement (PDFエレメント)