[前頁へ] [次頁へ]

PDICのしかた〜

----------------- contents -----------------

はじめに

PDIC辞書化の方法

PDIC辞書化の例

単語分割・復元ツール

1行テキスト形式の英大文字単語を小文字化する

郵便番号簿のPDIC化

LONGMAN現代英英辞典をPDICで使う(別解)

大辞林(電子ブック版)をPDICで使う

逆引き大辞林をつくる

ハイブリッド新辞林をPDICで使う

ニューセンチュリー英和辞典(辞書十一巻)をPDICで使う

新クラウン和英辞典(辞書十一巻)をPDICで使う

三省堂現代国語辞典(辞書十一巻)をPDICで使う

Excelで作成した単語帳をPDIC化する

Accessで作成した単語帳をPDIC化する

PDIC辞書をExcel化する

----------------------------------------------------

 

PDIC辞書化の例

単語分割・復元ツール

 

* Download: 解説+Perl/JPerlスクリプト(dicdiv12.lzh)

 

PDICは本来訳語が数行程度の辞書用に設計されているようで、大辞典クラスの辞書も扱える割には訳部のサイズが小さいように思います。3000byte(70byte/行で40行程度)では中辞典の基本単語は入りきれない。また表示画面の次を読もうとして矢印キーを押すと、次画面でなく次単語に飛んでしまうのもちょっと使いづらい。それなら見出しをいっぱい作って訳を小分けにしたらどうか、という発想で作ってみました。情報カードで辞書を扱う感じでしょうか。辞書の内容は何でも良いので、上の症状にお悩みの諸兄はお試しを。

 

効能は次の通りです。

 

1.     電子辞書をPDIC化する際、訳部が長すぎてはじかれていた単語も登録できる。

2.     単語の訳が1画面以上続くとき、続きを表示しにくい(次頁でなく次単語に飛んでしまう)症状が改善。

 

具体的には、訳が各々指定サイズに収まるよう単語を分割し、分割した単語には末尾にスペース2個と'.'を1個以上付加します。

 

    have

    have  .

    have  ..

    .....

 

分割した単語を元通りにつなげることもできます。1行テキスト形式とCSV形式をサポート。

 

 

1行テキスト形式の英大文字単語を小文字化する

 

* Download: 解説+Perl/JPerlスクリプト(lower01.lzh)

 

ご存知の通りPDICに登録された単語はその文字コード順にリストされます。その結果、英単語の場合は大雑把に言って大文字で始まる単語群と小文字で始まる単語群に二分されるわけですが、二分しないほうがいいかなと最近思うようになりました。

 

たとえば次のようなものは一ヶ所にまとまっていたほうが良いと思いませんか?

 

    advent

        【名】《the advent》

        1.《形式》(重要人物・事件の)出現,到来

        2.《A-》待降節,降臨節:クリスマス前の4週間

        3.《通例A-》キリストの降臨

    Adventist

        【名】キリスト再臨派の信者

    adventitious

        【形】

        1.《形式》偶然[偶発]の.

        2.〔植・動〕不定の:異常な位置に生じた.

    Advent Sunday

        降臨節[待降節]第一日曜日.

 

今回は、このような市販の辞書や辞書CD-ROMの語順に近いものをPDICで実現するための試みです。具体的には、英大文字で始まる単語の前に小文字化したものを付加します。たとえば上の例は次のようになります。

 

    advent

    advent sunday :Advent Sunday

    adventist :Adventist

    adventitious

 

DokoPop!を使う場合は弊害があるかも知れません。

 

 

郵便番号簿のPDIC化

 

* Download: 解説+jgawk,JPerlスクリプト(yuubin12.lzh)

 

宅急便をはじめ、最近郵便番号を調べる機会が増えたので、PDIC用の郵便番号辞書を作ってみました。使用感は上々で、特にPDICWの単語検索をうまく使うと一瞬で目的の住所が表示され、たいへん便利です(辞書サイズ約2MB)。

 

日本郵政公社のサイトで郵便番号データが公開されています(Excel CSVファイルを圧縮)。これをPDIC辞書化するので、無料で、常に最新のデータが使用できます。また、KDICの1行テキスト形式とも互換性あるのでKDICでも使えるかも。

 

 

 

LONGMAN現代英英辞典をPDICで使う(別解)

 

* Download: 解説+Perlスクリプト(lmpd10.lzh)

 

ロングマン現代英英辞典(CD-ROM版)をPDICで使う方法について、Ritmo Suzukiさんのサイト「ロングマン現代英英辞典(CD-ROM版)をPDICで使う」に詳しい情報があります。

 

ていねいな解説と、用意された専用プログラムで、比較的容易にPDICに移植することができます。私も喜んでしばらく使っていたのですが、同氏の解説をもとに、自分なりにPDIC辞書化に挑戦してみました(辞書サイズ約14MB)。

 

また、このCD-ROM辞書をEPWING化するスクリプトがEBstudioサイトでNOMAD氏より公開されています。これにも対応しました。

 

 

 

大辞林(電子ブック版)をPDICで使う

 

* Download: 解説+JPerlスクリプト(daiji05.lzh)

 

三省堂「大辞林&デイリー英和・和英 音声入り電子ブック版」(YRRS-331)をPDIC化してみました(「大辞林」のみ)。大辞林は質・量ともに広辞苑と遜色なく、むしろ私はこちらの方が好きです。データの吸出しにDDwinを使用しました(辞書サイズ約37MB)。

 

 

 

逆引き大辞林をつくる

 

* Download: 解説+JPerlスクリプト(gyaku01.lzh)

 

三省堂「大辞林&デイリー英和・和英 音声入り電子ブック版」(YRRS-331)をもとに「逆引き大辞林」を作ってみました。ちょっと面白いです。たぶん次の「ハイブリッド新辞林」にも対応しています。

 

 

 

ハイブリッド新辞林をPDICで使う

 

* Download: 解説+JPerlスクリプト(jirin01.lzh)

 

三省堂「ハイブリッド新辞林」をPDIC化しました。これは「大辞林 第2版」の縮約版で、書籍と、同一内容のCD-ROMがセットになっています。内容も充実しており、PDIC化辞書もあまり大きくないので、Windows CEなどで扱いやすいと思います。データの吸い出しにフリー版 EBStudio 1.53 DTONIC Toolkit 1.04 を使用しました(辞書サイズ約18MB)

 

 

 

ニューセンチュリー英和辞典(辞書十一巻)をPDICで使う

 

* Download: 解説+JPerlスクリプト(cent01.lzh)

 

電子ブック購入時に付いてきた三省堂「辞書十一巻」(YRRS-286)から、「"しゃべる"ニューセンチュリー英和辞典」と「ビジネスマン英和辞典」をPDIC化してみました。データの吸出しにDDwinを使用しました(辞書サイズ約7MB、2MB)。

 

各々3〜4万語の辞書ですが、マージすれば約5.5万語になります。ニューセンチュリー英和は発音記号があり、基本語の解説もていねいなので、これと英辞郎をマージしたハイブリッド辞書や、発音記号を別辞書にマージする方法も考えてみました。

 

 

 

新クラウン和英辞典(辞書十一巻)をPDICで使う

 

* Download: 解説+JPerlスクリプト(cwaei01.lzh)

 

電子ブック購入時に付いてきた三省堂「辞書十一巻」(YRRS-286)から、「"しゃべる"新クラウン和英辞典」をPDIC化してみました(辞書サイズ約3MB)。

 

 

 

三省堂現代国語辞典(辞書十一巻)をPDICで使う

 

* Download: 解説+JPerlスクリプト(gkoku01.lzh)

 

電子ブック購入時に付いてきた三省堂「辞書十一巻」(YRRS-286)から、「三省堂現代国語辞典」と「コンサイス外来語辞典」をPDIC化してみました(辞書サイズ約16MB)。

 

 

 

Excelで作成した単語帳をPDIC化する

 

Excelで作成した、英単語と訳の2列からなる次のような単語帳をPDIC化する手順を説明します(Excel2000, Word2000とPDIC v4.67を使用)。例がわざとらしい理由はそのうちわかるでしょう(^_^)。

 

boy        少年

cat        猫《鳴き声》meow,miaow,purr

girl        少女

veni, vidi, vici 《ラ》来た、見た、勝った。

 

1. Excelデータをテキストファイルに落とす

 

Excelで、[ファイル(F)]-[名前を付けて保存(A)]を選択。[ファイルの種類]は「テキスト(タブ区切り)」[*1] 、[ファイル名]はたとえば「test1」[*2]として[保存(S)]をクリック。画面に「選択したファイルの種類は複数のシートを…」が出たら[OK]を、「test1.txtには、…この形式でブックを保存しますか?」が出たら[はい(Y)]をクリックします(ファイル名の拡張子txtは自動的に付加される)。出力が終わり画面がExcel表に戻ったらExcelを終了。終了時の「’test1.txt’への変更を保存しますか?」は[いいえ(N)]で抜けてください。

 

2. テキストファイルの整形

 

続いてtest1.txtを整形してPDIC1行テキスト形式にします。今回は趣向を変えてWordを使いますが、テキストエディタ等でやってもかまいません。

 

Wordを起動し、先ほどのtest1.txtを開くと、次のようになっているはず。単語・訳中に「,」が入っていると「”」で括られる(またここにはないが既存の「”」は「””」となる)のは一種の副作用です。

 

boy   少年

cat   “猫《鳴き声》meow,miaow,purr”

girl   少女

“veni, vidi, vici”  《ラ》来た、見た、勝った。

 

[編集(E)]-[置換(E)]を選ぶと「検索と置換」ウィンドウが開くので、次のように設定してください。

 

[検索する文字列(N)]=「^t」   (TAB)

[置換後の文字列(I)]=「 /// 」 (半角の「///」の前後に半角スペース)

 

TABの入力は、次のようにします。「^t」と直接入力してはいけません。

 

1. [オプション(L)]をクリック → 「検索と置換」ウィンドウが下に広がる

2. 左下の[ワイルドカードを使用する(U)]をチェック → 右下の[特殊文字(E)]が使用可能になる

3. [特殊文字(E)]をクリックし、[タブ文字(T)]を選択 → [検索する文字列(N)]に「^t」と表示される

 

設定後、[すべて置換(A)]をクリックすると、次のようになります。

 

boy /// 少年

cat /// “猫《鳴き声》meow,miaow,purr”

girl /// 少女

“veni, vidi, vici” /// 《ラ》来た、見た、勝った。

 

不要な「”」は手作業で削除し([編集(E)]-[置換(E)]を使うと楽かも)、最終的に次のようなPDIC1行テキスト形式、つまり「英単語 /// 訳」の形にします。

 

boy /// 少年

cat /// 猫《鳴き声》meow,miaow,purr

girl /// 少女

veni, vidi, vici /// 《ラ》来た、見た、勝った。

 

整形できたことを確認したらファイルを保存しWordを終了。

 

3. PDICでPDIC辞書化する

 

PDICを起動し、[Tools]-[辞書の変換(C)]を選択し、次のように設定する。

 

[転送元辞書]:[ファイル形式(S)]=1行テキスト形式、[ファイル名]=test1.txt

[転送先辞書]:[ファイル形式(D)]=PDIC形式、[ファイル名]=test1.dic

 

これを実行すればPDIC辞書test1.dicが生成されます。既存のユーザ辞書にこれを追加(マージ)させることも可能です。この辺は実際に変換させ表示されるメニューを見れば見当がつくでしょう。詳細についてはPDICのHelpを参照ください。

 

[*1] 「CSV(カンマ区切り)」でもほぼ同様の手順でできます。

 

[*2] 元のExcel単語帳とは別のファイル名を推奨。同じファイル名にすると、2で内容を書き換えるため、以後Excelで単語帳を正しく開けなくなります(1列に「英単語 /// 訳」と表示される)。まあ、その時は2の応用で逆に「 /// 」→「TAB」と変換すれば元に戻せますけど。

 

 

Accessで作成した単語帳をPDIC化する

 

Accessのデータは容易にExcelに取り込めます。

 1. Accessの単語帳リスト画面で、メニューバーの[編集(E)]-[すべてのレコードの選択(A)]をクリック。

 2. 同じく[編集(E)]-[コピー(C)]をクリック。

 3. Excelを起動し、メニューバーの[編集(E)]-[貼り付け(P)]をクリック。

これでExcelにデータが入ります。後は上の「Excelで作成した単語帳をPDIC化する」と同様です。

 

 

PDIC辞書をExcel化する

 

上とは逆に、PDIC辞書(test2.dic)をExcel化する方法を解説します。ただし簡易的手法のため、少し誤変換もあります。


1. PDIC辞書をテキスト化する

 

PDICを起動。[Tools]-[辞書の変換(C)]を選び、次のように設定し[OK]をクリックして実行。

 

[転送元辞書]:[ファイル形式(S)]=PDIC形式、ファイル名=test2.dic

[転送先辞書]:[ファイル形式(D)]=1行テキスト形式、ファイル名=test2.txt

 

PDICを終了する。

2.     Excelに取り込む


Excelを起動し、[データ(D)]-[外部データの取り込み(D)]-[テキストファイルのインポート(T)]で、上のtest2.txtを選択し[インポート]をクリック。

テキストファイルウィザードで、元のデータの形式は「カンマやタブなどの区切り文字によってフィールドごとに区切られたデータ(D)」を選択。→ [次へ]

区切り文字は[その他(O)]-「/」とする。→ [次へ]

列のデータ形式を適当に指定。→ [完了]

Excelにデータが表示されるので、不要な列を削除するなど整形する。

この欠点は、”AC/DC”のような"/"の入った見出し語が欠けることですが、1の後、エディタ等でsample.txtの"///"を"\"に置換し、2の区切り文字を"\"とする等で回避できます(後で手作業で修正してもたいした手間ではないけれど)。また、CSV形式に変換するなどの方法もあると思います。

 

[*]辞書を丸ごとExcel化する必要性については疑問ですが、たとえばレベル別単語リストやテキストでの出現順単語リストを作りたい時は、[Search]-[詳細設定検索(D)]や [Search]-[履歴単語検索(H)]などで1行テキスト形式等で出力させれば上の手順でExcelに取り込むことができます。

 

 

 

 

[前頁へ] [先頭へ] [次頁へ]

 

 


[PR]あの人との相性を計算機で診断:職場のあの人、嫌いなあの人との相性も!