英単語リスト作成ツールの公開

英文から単語を抜き出して単語リストを作成するツールを作りました。

活用方法はおまかせします。不具合や要望はTwitterやお問い合わせで教えてください。

英単語リスト作成ツール ←ここにあります

※補足
画像から英文を抜き出す方法

※活用法(Twitterより)
 ・ネット記事
 ・海外ドラマのスクリプト
 ・テキスト形式の書籍

機能

  • 英単語カウンター
    英文の単語数を数えます。ネット記事やスクリプトなどの総語数確認にどうぞ。
  • SVL表示
    抜き出した単語がSVL対象単語の場合は、レンマ(辞書の見出し語)化します。
    SVL対象外の単語を探すのに使えるかも・・・?
  • 出現数表示
    抜き出した単語の出現数を表示します。
    本文での形が違っても同じ単語の場合は同一単語として数えます。
    よく使われる単語がわかるかも・・・?
  • エクスポート機能
    CSVデータとして英単語リストをエクスポートできます。
    ちなみにタブ区切りなので、そのままだとExcelで上手く表示されません。(補足②参照)
    ※タブ区切りの理由は、後ほどこれから作る別のツールで使うためです。

補足① 単語の数え方

単語の数え方は以下のサイトを参考にしました。
英語の単語数はカウントするには?知らないと損するツールの使い方も!

全部の英文パターンは網羅できていないと思います。単語リストがおかしい場合は、英文と合わせて教えてください。

補足② 英単語カウンター

英単語カウンターは他にもサイトがたくさんあります。サイトによって総語数が異なるのは、ツールの作成者によって単語の区切り方やカウント対象が異なるためです。したがって、短い英文でどんな風に数えているのか試してみるとよいです。

以下、英単語カウンターのサイトです。もちろん他にもあると思います。

英単語カウンター
単語数カウントツール
英単語数・文字数カウントツール
ワードカウンター
Counter Words and Characters
英文解析支援アプリ Easa

補足③ (「タブ」区切りのCSVファイルをExcelで正しく表示する)

Excelのバージョンによって多少異なる部分があるかもしれないですが、だいたい以下のやり方でいけると思います。(オススメ順は①→③)

①CSVファイルをテキストエディタ(またはメモ帳)で開き、Ctrl + A ⇒ Ctrl + C(全選択⇒コピー)。
 Excelを開き、貼り付けたい場所で Ctrl + V(ペースト)。

②Excelを起動し、ツールバー[ファイル] > [開く]から、CSVファイルを選択。
 テキストファイルウィザードが表示されるので、以下選択して取り込めばOKです。

  • 元のデータ形式
    「カンマやタブなどの区切り文字によってフィールドごとに区切られたデータ」を選択
  • 区切り文字
    「タブ」にチェック(他はチェック入れない)
  • 列のデータ形式
    「文字列」を選択

 その他の細かいオプションはお好みで変更してください。

③ツールバー[データ] > [テキストまたはCSVから]から、CSVファイルを選択。区切り記号を「タブ」にし、読み込めばOKです。

更新履歴

2020-05-26 "kilometers"のレンマ化。("kilometer"に変換)
2020-05-16 URLの行はプロトコルだけ抜き出すようにしました。(例:https://www.a.co.jp/ -> https)
2020-05-15 SVLソートを追加。出現順ソートロジック修正。
リスト単語なしのロジック修正。総語数カウントの正規表現修正。
2020-05-14 "length"を英単語リストに追加できるように修正。Webフォント設定の修正。
2020-05-12 公開。

 

タイトルとURLをコピーしました