
[前頁へ] [次頁へ]
〜PDICのしかた〜
----------------- contents -----------------
■はじめに
----------------------------------------------------
Download: 解説+Perl/JPerlスクリプト(dicdiv12.lzh)
PDICは本来訳語が数行程度の辞書用に設計されているようで、大辞典クラスの辞書も扱える割には訳部のサイズが小さいように思います。3000byte(70byte/行で40行程度)では中辞典の基本単語は入りきれない。また表示画面の次を読もうとして矢印キーを押すと、次画面でなく次単語に飛んでしまうのもちょっと使いづらい。それなら見出しをいっぱい作って訳を小分けにしたらどうか、という発想で作ってみました。情報カードで辞書を扱う感じでしょうか。辞書の内容は何でも良いので、上の症状にお悩みの諸兄はお試しを。
効能は次の通りです。
1.
電子辞書をPDIC化する際、訳部が長すぎてはじかれていた単語も登録できる。
2.
単語の訳が1画面以上続くとき、続きを表示しにくい(次頁でなく次単語に飛んでしまう)症状が改善。
具体的には、訳が各々指定サイズに収まるよう単語を分割し、分割した単語には末尾にスペース2個と'.'を1個以上付加します。
have
have .
have ..
.....
分割した単語を元通りにつなげることもできます。1行テキスト形式とCSV形式をサポート。
Download: 解説+Perl/JPerlスクリプト(lower01.lzh)
ご存知の通りPDICに登録された単語はその文字コード順にリストされます。その結果、英単語の場合は大雑把に言って大文字で始まる単語群と小文字で始まる単語群に二分されるわけですが、二分しないほうがいいかなと最近思うようになりました。
たとえば次のようなものは一ヶ所にまとまっていたほうが良いと思いませんか?
advent
【名】《the
advent》
1.《形式》(重要人物・事件の)出現,到来
2.《A-》待降節,降臨節:クリスマス前の4週間
3.《通例A-》キリストの降臨
Adventist
【名】キリスト再臨派の信者
adventitious
【形】
1.《形式》偶然[偶発]の.
2.〔植・動〕不定の:異常な位置に生じた.
Advent Sunday
降臨節[待降節]第一日曜日.
今回は、このような市販の辞書や辞書CD-ROMの語順に近いものをPDICで実現するための試みです。具体的には、英大文字で始まる単語の前に小文字化したものを付加します。たとえば上の例は次のようになります。
advent
advent sunday :Advent
Sunday
adventist :Adventist
adventitious
※DokoPop!を使う場合は弊害があるかも知れません。
Download:
解説+jgawk,JPerlスクリプト(yuubin12.lzh)
宅急便をはじめ、最近郵便番号を調べる機会が増えたので、PDIC用の郵便番号辞書を作ってみました。使用感は上々で、特にPDICWの単語検索をうまく使うと一瞬で目的の住所が表示され、たいへん便利です(辞書サイズ約2MB)。
日本郵政公社のサイトで郵便番号データが公開されています(Excel
CSVファイルを圧縮)。これをPDIC辞書化するので、無料で、常に最新のデータが使用できます。また、KDICの1行テキスト形式とも互換性あるのでKDICでも使えるかも。

Download:
解説+Perlスクリプト(lmpd10.lzh)
ロングマン現代英英辞典(CD-ROM版)をPDICで使う方法について、Ritmo
Suzukiさんのサイト「ロングマン現代英英辞典(CD-ROM版)をPDICで使う」に詳しい情報があります。
ていねいな解説と、用意された専用プログラムで、比較的容易にPDICに移植することができます。私も喜んでしばらく使っていたのですが、同氏の解説をもとに、自分なりにPDIC辞書化に挑戦してみました(辞書サイズ約14MB)。
また、このCD-ROM辞書をEPWING化するスクリプトがEBstudioサイトでNOMAD氏より公開されています。これにも対応しました。

Download:
解説+JPerlスクリプト(daiji05.lzh)
三省堂「大辞林&デイリー英和・和英 音声入り電子ブック版」(YRRS-331)をPDIC化してみました(「大辞林」のみ)。大辞林は質・量ともに広辞苑と遜色なく、むしろ私はこちらの方が好きです。データの吸出しにDDwinを使用しました(辞書サイズ約37MB)。

Download:
解説+JPerlスクリプト(gyaku01.lzh)
三省堂「大辞林&デイリー英和・和英 音声入り電子ブック版」(YRRS-331)をもとに「逆引き大辞林」を作ってみました。ちょっと面白いです。たぶん次の「ハイブリッド新辞林」にも対応しています。

Download:
解説+JPerlスクリプト(jirin01.lzh)
三省堂「ハイブリッド新辞林」をPDIC化しました。これは「大辞林 第2版」の縮約版で、書籍と、同一内容のCD-ROMがセットになっています。内容も充実しており、PDIC化辞書もあまり大きくないので、Windows
CEなどで扱いやすいと思います。データの吸い出しにフリー版 EBStudio 1.53 と DTONIC Toolkit
1.04 を使用しました(辞書サイズ約18MB)。

Download:
解説+JPerlスクリプト(cent01.lzh)
電子ブック購入時に付いてきた三省堂「辞書十一巻」(YRRS-286)から、「"しゃべる"ニューセンチュリー英和辞典」と「ビジネスマン英和辞典」をPDIC化してみました。データの吸出しにDDwinを使用しました(辞書サイズ約7MB、2MB)。
各々3〜4万語の辞書ですが、マージすれば約5.5万語になります。ニューセンチュリー英和は発音記号があり、基本語の解説もていねいなので、これと英辞郎をマージしたハイブリッド辞書や、発音記号を別辞書にマージする方法も考えてみました。

Download:
解説+JPerlスクリプト(cwaei01.lzh)
電子ブック購入時に付いてきた三省堂「辞書十一巻」(YRRS-286)から、「"しゃべる"新クラウン和英辞典」をPDIC化してみました(辞書サイズ約3MB)。

Download:
解説+JPerlスクリプト(gkoku01.lzh)
電子ブック購入時に付いてきた三省堂「辞書十一巻」(YRRS-286)から、「三省堂現代国語辞典」と「コンサイス外来語辞典」をPDIC化してみました(辞書サイズ約16MB)。

Excelで作成した、英単語と訳の2列からなる次のような単語帳をPDIC化する手順を説明します(Excel2000,
Word2000とPDIC v4.67を使用)。例がわざとらしい理由はそのうちわかるでしょう(^_^)。
boy 少年
cat 猫《鳴き声》meow,miaow,purr
girl 少女
veni, vidi, vici 《ラ》来た、見た、勝った。
1.
Excelデータをテキストファイルに落とす
Excelで、[ファイル(F)]-[名前を付けて保存(A)]を選択。[ファイルの種類]は「テキスト(タブ区切り)」[*1] 、[ファイル名]はたとえば「test1」[*2]として[保存(S)]をクリック。画面に「選択したファイルの種類は複数のシートを…」が出たら[OK]を、「test1.txtには、…この形式でブックを保存しますか?」が出たら[はい(Y)]をクリックします(ファイル名の拡張子txtは自動的に付加される)。出力が終わり画面がExcel表に戻ったらExcelを終了。終了時の「’test1.txt’への変更を保存しますか?」は[いいえ(N)]で抜けてください。
2. テキストファイルの整形
続いてtest1.txtを整形してPDIC1行テキスト形式にします。今回は趣向を変えてWordを使いますが、テキストエディタ等でやってもかまいません。
Wordを起動し、先ほどのtest1.txtを開くと、次のようになっているはず。単語・訳中に「,」が入っていると「”」で括られる(またここにはないが既存の「”」は「””」となる)のは一種の副作用です。
boy 少年
cat “猫《鳴き声》meow,miaow,purr”
girl 少女
“veni, vidi, vici” 《ラ》来た、見た、勝った。
[編集(E)]-[置換(E)]を選ぶと「検索と置換」ウィンドウが開くので、次のように設定してください。
[検索する文字列(N)]=「^t」 (TAB)
[置換後の文字列(I)]=「 /// 」 (半角の「///」の前後に半角スペース)
TABの入力は、次のようにします。「^t」と直接入力してはいけません。
1. [オプション(L)]をクリック → 「検索と置換」ウィンドウが下に広がる
2. 左下の[ワイルドカードを使用する(U)]をチェック → 右下の[特殊文字(E)]が使用可能になる
3. [特殊文字(E)]をクリックし、[タブ文字(T)]を選択 → [検索する文字列(N)]に「^t」と表示される
設定後、[すべて置換(A)]をクリックすると、次のようになります。
boy /// 少年
cat /// “猫《鳴き声》meow,miaow,purr”
girl /// 少女
“veni, vidi, vici” /// 《ラ》来た、見た、勝った。
不要な「”」は手作業で削除し([編集(E)]-[置換(E)]を使うと楽かも)、最終的に次のようなPDIC1行テキスト形式、つまり「英単語
/// 訳」の形にします。
boy /// 少年
cat /// 猫《鳴き声》meow,miaow,purr
girl /// 少女
veni, vidi, vici /// 《ラ》来た、見た、勝った。
整形できたことを確認したらファイルを保存しWordを終了。
3.
PDICでPDIC辞書化する
PDICを起動し、[Tools]-[辞書の変換(C)]を選択し、次のように設定する。
[転送元辞書]:[ファイル形式(S)]=1行テキスト形式、[ファイル名]=test1.txt
[転送先辞書]:[ファイル形式(D)]=PDIC形式、[ファイル名]=test1.dic
これを実行すればPDIC辞書test1.dicが生成されます。既存のユーザ辞書にこれを追加(マージ)させることも可能です。この辺は実際に変換させ表示されるメニューを見れば見当がつくでしょう。詳細についてはPDICのHelpを参照ください。
[*1] 「CSV(カンマ区切り)」でもほぼ同様の手順でできます。
[*2] 元のExcel単語帳とは別のファイル名を推奨。同じファイル名にすると、2で内容を書き換えるため、以後Excelで単語帳を正しく開けなくなります(1列に「英単語
/// 訳」と表示される)。まあ、その時は2の応用で逆に「 /// 」→「TAB」と変換すれば元に戻せますけど。
Accessのデータは容易にExcelに取り込めます。
1. Accessの単語帳リスト画面で、メニューバーの[編集(E)]-[すべてのレコードの選択(A)]をクリック。
2. 同じく[編集(E)]-[コピー(C)]をクリック。
3. Excelを起動し、メニューバーの[編集(E)]-[貼り付け(P)]をクリック。
これでExcelにデータが入ります。後は上の「Excelで作成した単語帳をPDIC化する」と同様です。
上とは逆に、PDIC辞書(test2.dic)をExcel化する方法を解説します。ただし簡易的手法のため、少し誤変換もあります。
1. PDIC辞書をテキスト化する
PDICを起動。[Tools]-[辞書の変換(C)]を選び、次のように設定し[OK]をクリックして実行。
[転送元辞書]:[ファイル形式(S)]=PDIC形式、ファイル名=test2.dic
[転送先辞書]:[ファイル形式(D)]=1行テキスト形式、ファイル名=test2.txt
PDICを終了する。
2.
Excelに取り込む
Excelを起動し、[データ(D)]-[外部データの取り込み(D)]-[テキストファイルのインポート(T)]で、上のtest2.txtを選択し[インポート]をクリック。
テキストファイルウィザードで、元のデータの形式は「カンマやタブなどの区切り文字によってフィールドごとに区切られたデータ(D)」を選択。→ [次へ]
区切り文字は[その他(O)]-「/」とする。→ [次へ]
列のデータ形式を適当に指定。→ [完了]
Excelにデータが表示されるので、不要な列を削除するなど整形する。
この欠点は、”AC/DC”のような"/"の入った見出し語が欠けることですが、1の後、エディタ等でsample.txtの"///"を"\"に置換し、2の区切り文字を"\"とする等で回避できます(後で手作業で修正してもたいした手間ではないけれど)。また、CSV形式に変換するなどの方法もあると思います。
[*]辞書を丸ごとExcel化する必要性については疑問ですが、たとえばレベル別単語リストやテキストでの出現順単語リストを作りたい時は、[Search]-[詳細設定検索(D)]や
[Search]-[履歴単語検索(H)]などで1行テキスト形式等で出力させれば上の手順でExcelに取り込むことができます。