Ankiの屋根裏

書籍・アプリ・音源から英文とその日本語訳を効率よく抜き出す方法

※Windows PCとiPhone/iPad中心のまとめとなっていますが、Mac PCやAndroidでも可能なものは読み替えてください。
 (持っていないので単純に検証できていないだけです。検証できた方は報告してほしいです・・・)

ここは書籍・アプリ・音源から英文とその日本語訳を効率よく抜き出す方法をまとめたページです。英文とその日本語訳は、AIで対訳テーブルという形で抜き出したものを表計算ソフトで編集し、Ankiカードで使用する想定です。書籍・アプリ・音源から英文とその日本語訳を抜き出す想定で記載していますが、応用として英文や英単語だけを抜き出したりすることも可能です。

背景

書籍・アプリを丸ごとAnki化する場合、スキャンした画像をAnkiカードに貼る方法がありますが、下記のようなデメリットがあります。

  • 画像ファイルのためテキスト検索ができない
  • Ankiデッキのファイルサイズが大きくなる
  • スプレッドシートやエクセルなどで扱いにくい
  • 音源がない場合にテキストをTTSできない

そのため、できれば画像ではなくテキスト(文字)でAnki化したいなと思って、このまとめページを作りました。

概要

書籍・アプリ・音源から英文とその日本語訳を抜き出すには、OCR(Optical Character Recognition)STT(Speech to Text)を利用します。OCRやSTTのツールは色々ありますが、ここでは高精度かつ無料で利用できるものをまとめています。最終的に、OCRやSTTで取得したテキストをAIの力を借りてテーブル形式で抜き出します。

書籍・アプリ・音源から英文とその日本語訳を抜き出すフローは以下の通りです。

フロー

  1. 【書籍・アプリの画像ファイル準備】ツールを使って、英文とその日本語訳を含んだ画像ファイルを用意します。このステップを飛ばして2.から開始する場合もあります。
    (音源については、書籍に付属するCDやアプリでDLした音声ファイルなどを想定しています。)
  2. 【OCR・STT】カメラやツールなどのOCRやSTTを用いて、英文とその日本語訳を含んだテキストを取得します。
    (この段階のテキストには「英文とその日本語訳」以外の余分なテキストも含まれます。)
  3. 【AI処理】ChatGPTまたはBing AIチャットを用いて、1.で得られたテキストから英文とその日本語訳を抜き出してテーブルを作成します。
  4. 作成したテーブルをスプレッドシートやエクセルなどに貼って整形し、Ankiカードを作成します。
    (ここは各自のやり方にお任せします。)

準備(設定変更・インストール)

設定・アプリ・ソフトウェアの一覧

全て準備する必要はありません。必要なものだけでよいです。

カテゴリ アプリ・ソフトウェア・設定 Windows PC iPhone/iPad
OCR Google スプレッドシート(Google Apps Script) ×
OCR カメラのテキスト認識表示(OCR)の設定 ×
・画像ファイル準備
OCR
AI処理
ショートカットアプリ ×
OCR メモアプリ 〇(iCloud)
OCR Google Keep
OCR Google Lens
STT Microsoft Word(web版含む) ×
AI処理 ChatGPT 〇(Web)
AI処理 Bing AIチャット(Bing) 〇(Web)

※ChatGPTとBing AIチャット:どちらか一方があれば最低限OKですが、両方あるとより効果的です。
※△は、実施可能ですが効率が悪いので非推奨の項目です。

設定方法・インストール先

カテゴリ アプリ・ソフトウェア・設定 設定方法・インストール先
iPhone/iPadの設定 カメラのテキスト認識表示(OCR)の設定

公式サイトの説明はこちらです。
テキスト認識表示」は、「設定」>「カメラ」>「検出されたテキストを表示」をONにすることで使用できます。

iPhone/iPadアプリ ショートカットアプリ

iPhone/iPadアプリ メモアプリ

・iPhone/iPadアプリ
・Windows PC
ChatGPT

iPhone/iPadのChatGPTアプリのインストールは下記からできます。

ChatGPTはGPT-3.5であれば無料で使用できます。

PCで使用する場合は、こちらです。

事前にユーザー登録し、ログインしておいてください。(iPhone/iPad端末、 Windows PC端末両方)

・iPhone/iPadアプリ
・Windows PC
Bing

Bing AIチャットを利用するためにBingアプリをインストールします。iPhone/iPadでのBingアプリのインストールは下記からできます。

Bing AIチャットの利用は無料です。

PCでアクセスする場合は、こちらです。

事前にMicrosoftアカウントでログインしておいてください。(iPhone/iPad端末、Windows PC端末両方)
※ログイン不要でチャット機能は使用できますが、チャット履歴をPCから取得する際にログインが必要です。

【iPhone/iPad】Ankiカードの作成効率化のためのショートカット集

こちらのページからDLしてください。事前にショートカットアプリをインストールしておく必要があります。

各作業の記事一覧

書籍・アプリの画像ファイル準備

記事 OS/デバイス ツール 取得対象の画像ファイル 取得画像数 コメント
【Power Automate】Kindle本のスクリーンショットを自動で取得する方法

Windows

Power Automate

・Kindle for PCの画面スクショ

複数 Windows PCでKindle本のスクリーンショットの自動化について記載した記事です。
ショートカット「連続スクショ」の使い方

iPhone/iPad

ショートカットアプリ

・Kindleの画面スクショ
・英単語アプリの画面スクショ

複数 iPhone/iPadで連続してスクリーンショットを撮る時に使うと便利なショートカットです。
ショートカット「連続スクショ」は、こちらのページからDLしてください。

OCR

記事 OS/デバイス ツール OCRの対象ファイル 処理画像数 コメント
【Google Apps Script】複数画像ファイルの一括テキスト抽出(OCR)

Windows

GAS

・画像(JPG/PNG/GIF)
・PDF(2MB以下)

複数 現在、最もおすすめできる方法です。事前設定が必要となります。
【iPhone/iPad】カメラで読み取ったテキストをメモアプリに直接かつ連続して保存する方法

iPhone/iPad

iPhone/iPadのカメラ

カメラで直接表示したテキスト

複数 メモアプリにカメラで読み取ったテキストを保存する方法です。ピンポイントでOCRできます。
【Google Keep】複数画像ファイルの一括テキスト抽出(OCR)

・Windows
・iPhone/iPad

Google Keep

画像(JPEG/JPG/PNG/GIF/WEBP
※10MB未満かつ25メガピクセル(2500万画素)未満

複数 画像ファイルが少ないか、画像ファイルのサイズが小さい場合の利用をおすすめします。
【Google Lens】画像ファイルのテキスト抽出(OCR)

・Windows
・iPhone/iPad

Google Lens

・画像
 ※条件の詳細は不明

1

1度に1画像しかOCRできませんが、Webブラウザがあれば利用できます。

STT(Speech to Text)

記事 OS/デバイス ツール 音源 コメント
【Word】Speech to Textを使って音声ファイルから英語とその日本語訳の対訳テーブルを作成する方法

Windows

・Word
・AI

・音声ファイル(wav/mp4/m4a/mp3)

Microsoft 365ユーザーは無制限。それ以外は300分/月です。Word for the webで実行できます。
このブログの記事では、AIでの処理まで記載しています。

OCR→AI処理

記事 OS/デバイス ツール OCRの対象ファイル 処理画像数 コメント
【iPhone/iPad】英文とその日本語訳を含むメモから対訳テーブルを作成する方法

iPhone/iPad

・iPhone/iPadのカメラ
・メモアプリ
・ショートカットアプリ
・AI

・画像
・メモアプリのメモ

複数 メモアプリのテキストから英文とその日本語訳の対訳テーブルを作成する方法です。
※対訳テーブル作成を依頼したいテキスト(画像ファイルから直接テキストをコピペしたもの、どこかのWebページをコピぺしたものなど)があればメモに直接書いて、「共有」メニューからショートカット「OCR→AI」を実行してもOKです。

(OCRは不要ですが)OCRはカメラのテキスト認識表示ではなく、ショートカットのテキスト抽出を使用しています。

【iPhone/iPad】英文とその日本語訳を含む画像(写真・スクショ)ファイルから対訳テーブルを作成する方法

iPhone/iPad

・メモアプリ
・ショートカットアプリ
・AI

画像

複数 画像(写真・スクショ)ファイルから英文とその日本語訳の対訳テーブルを作成する方法です。OCRはカメラのテキスト認識表示ではなく、ショートカットのテキスト抽出を使用しています。
【iPhone/iPad】英文とその日本語訳を含むPDFファイルから対訳テーブルを作成する方法

iPhone/iPad

・メモアプリ
・ショートカットアプリ
・AI

PDF

複数 PDFファイルから英文とその日本語訳の対訳テーブルを作成する方法です。OCRはカメラのテキスト認識表示ではなく、ショートカットのテキスト抽出を使用しています。

AI処理

記事 OS/デバイス ツール コメント
PCのChatGPT/Bing AIチャットで英文とその日本語訳の対訳テーブルを取得・作成する

Windows

・メモアプリ
・AI

PC上でAI(ChatGPT/Bing AIチャット)を使用して対訳テーブルを開いたり、作成する方法。

 

スポンサーリンク