Hatena::Groupatokdirect

ruby-Uの日記

2009-03-31

類義語を表示(日本語WordNetのデータベースを使用)

10:45


フリーで使えるシソーラスデータを見つけたのでプラグインにしてみたものです。

類義語というより関連語ですね。関係性は問わず、何らかの関係にあるものを近いところから順に、数回拾うことを繰り返して返します。


f:id:ruby-U:20090331085119p:image


日本語 WordNet

http://nlpwww.nict.go.jp/wn-ja/

で配布されてる

Wn-Ja 0.9: Japanese Wordnet and Princeton WordNet in an sqlite3 database

http://nlpwww.nict.go.jp/wn-ja/data/wnjpn-0.9.db

を使います。

ダウンロード後、「C:\Program Files\Justsystem\ATOK\ATOKDIRECT\PLUGIN\wnjpn-0.9.db」に置いてください。


もうすこし洗練させるといい感じになるんじゃないかというところですが、とりあえず私の用途にはこれで足りそうです。

語彙は文章力の目安になるので、こういうもので簡単に改善していけたら嬉しいですね。




何かありましたらコメントにでも。

http://d.hatena.ne.jp/ruby-U/20090331/1238457906