memo.xight.org

日々のメモ

カテゴリ : 形態素解析

1ページ目 / 全1ページ

形態素解析システム 茶筌

茶筌とは?

  1997年2月19日にversion 1.0 正式版が奈良先端科学技術大学院大学自然言語処理学講座からリリースされた,
  フリーの日本語形態素解析器

名前の由来

  開発拠点である奈良先端科学技術大学院大学のある奈良県生駒市高山町が,日本有数の茶筌の産地であることから.

国際表記は "ChaSen"


Reference

ChaSen's Wiki - FrontPage
http://chasen.naist.jp/hiki/ChaSen/

MeCab - Yet Another Part-of-Speech and Morphological Analyzer

MeCab (和布蕪)とは

  MeCab は, 奈良先端科学技術大学院大学自然言語処理学講座の開発する
  形態素解析器 ChaSenを基に開発された高速な形態素解析器です.
  解析精度は, ChaSen と変わらないにもかかわらず, 平均的に ChaSen の3-4倍のスピードで動作します.
 

Reference

MeCab: Yet Another Part-of-Speech and Morphological Analyzer
http://mecab.sourceforge.jp/

Sen(Java 形態素解析エンジン)

Sen とは?

  Sen は,Java で実装された形態素解析器です.
  現在は,日本語しか使えませんが,文字の種類(日本語の場合,,カタカナ,漢字&平仮名,記号)を判別するTokenizerと
  形態素解析の辞書を用意すれば,他の言語でも利用可能です.
  次世代形態素解析器 ChaSenTNG (TNG=The Next Generation) をベースに Java に移植しています.

追記

  現在 ChaSenTNG は MeCab に名称変更されている.

Reference

  Sen(Java 形態素解析エンジン)
  http://yamaguch.sytes.net/~tora/opensource/sen/