Summary
Wikipedia研究所 による、Wikipediaを用いたシソーラス辞書。Wikipediaの 約170万ページを解析し,7800万の関係性ペアを抽出することで,
世界最大規模のシソーラス辞書を構築したとのこと。
関連度の算出方法
pfibf | リンク、被リンクの数と特徴度を考慮。論文 3.1 pfibf 参照。 |
link co-occurrence | リンクの共起性。論文 3.2 リンク共起性解析 参照。 |
TFIDF | いわゆるTF・IDF法。語の出現頻度と特徴度を考慮。 |
Reference
Wikipedia Thesaurus Betahttp://dev.wikipedia-lab.org/WikipediaThesaurusV2/
Wikipedia-Lab - Wikipediaシソーラス
http://wikipedia-lab.org/ja/index.php/Wikipedia%E3%82%B7%E3%82%BD%E3%83%BC%E3%83%A9%E3%82%B9
人工知能学会 研究会資料 - SIG-SWO-A803-05 - Wikipedia からの連想シソーラス構築プロジェクト
http://sigswo.org/papers/SIG-SWO-A803/SIG-SWO-A803-05.pdf