2008年05月04日

stardict-tools

stardict-toolsは、tab形式またはBabylon形式のテキストを StarDictの辞書フォーマットにする変換ソフトだ。詳細はStardictのオフィシャルサイトhttp://stardict.sourceforge.net/HowToCreateDictionary が参考になる。stardict-toolsはlinuxのみ提供されているようだ。Debian の出番だ!Synapticパッケージマネージャでstardict-tools (2.4.8-0.1) を簡単にインストールできる。

辞書にできそうなテキストファイル”Oxford Advanced Learner's Dictionary”を発見。 http://www.ota.ahds.ac.uk/ の検索ボックスにOxford Advanced Learner's Dictionary でサーチすればすぐ見つられる。発音の辞書だ。オックスフォード大学だから、イギリス式の発音だと思う。

ダウンロードしたファイル(ascii_0710-1.txt)をstardict-toolsに対応しているtabfileに変換しよう。
sedでヘッダーの行を削除 (1~134行までは辞書の説明文):
sed -e '1,134d' ascii_0710-1.txt > ascii.txt 
awkで発音記号を好みのタイプに変換して、tabfileのフォーマットに整える。
変換プログラム
プログラムのファイル名はascii2ipa とした。
-----------------------------
{
gsub(/i/,"iː",$2)
gsub(/I/,"ɪ",$2)
gsub(/@/,"ə",$2)
gsub(/&/,"æ",$2)
gsub(/U/,"ʊ",$2)
gsub(/A/,"ɑː",$2)
gsub(/V/,"ʌ",$2)
gsub(/0/,"ɒ",$2)
gsub(/O/,"ɔː",$2)
gsub(/u/,"uː",$2)
gsub(/N/,"ŋ",$2)
gsub(/T/,"θ",$2)
gsub(/D/,"ð",$2)
gsub(/S/,"ʃ",$2)
gsub(/Z/,"ʒ",$2)
gsub(/3/,"ə:",$2)
gsub(/R/,"(r)",$2)
}
{print $1"\t"$2 > "oxford-pronunciation.dic"}
-----------------------------
実行方法
awk -f ascii2ipa ascii.txt
oxford-pronunciation.dicのtabfileが生成された。
stardict-toolsで ”oxford-pronunciation.dic”(tabfile) をstardictフォーマットに変換
$/usr/lib/stardict-tools/tabfile oxford-pronunciation.dic

生成された辞書データ(oxford-pronunciation.dict.dz oxford-pronunciation.idx oxford-pronunciation.ifo)をN810の/media/mmc1/stardict/dicか/media/mmc2/stardict/dicのディレクトリーの下に置く。

動作確認
stardict4.png

参考にしたサイト
http://seas3.elte.hu/szigetva/etcetera/EPD.html
http://seas3.elte.hu/epd.html
【関連する記事】
posted by アリゾニアン at 06:25| Comment(0) | TrackBack(0) | Office | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。