memo.xight.org

日々のメモ

Wikipedia Thesaurus - Wikipediaを用いた世界最大規模のシソーラス辞書

Summary

Wikipedia研究所 による、Wikipediaを用いたシソーラス辞書。
Wikipediaの 約170万ページを解析し,7800万の関係性ペアを抽出することで,
世界最大規模のシソーラス辞書を構築したとのこと。

クリックして拡大

関連度の算出方法

pfibf リンク、被リンクの数と特徴度を考慮。論文 3.1 pfibf 参照。
link co-occurrence リンクの共起性。論文 3.2 リンク共起性解析 参照。
TFIDF いわゆるTF・IDF法。語の出現頻度と特徴度を考慮。

Reference

Wikipedia Thesaurus Beta
http://dev.wikipedia-lab.org/WikipediaThesaurusV2/

Wikipedia-Lab - Wikipediaシソーラス
http://wikipedia-lab.org/ja/index.php/Wikipedia%E3%82%B7%E3%82%BD%E3%83%BC%E3%83%A9%E3%82%B9

人工知能学会 研究会資料 - SIG-SWO-A803-05 - Wikipedia からの連想シソーラス構築プロジェクト
http://sigswo.org/papers/SIG-SWO-A803/SIG-SWO-A803-05.pdf