memo.xight.org

日々のメモ

How to WAM (GETA)

  $GETAROOT/etc/ci.conf に

handle: [Handle]
short-name: [Short-name]
dataroot: /usr/local/geta/data/corpus/mainichi/
jma:p: japanese.sh

  japanese.sh は形態素解析の結果を 1 行に 1 形態素を出力するためのもの.
  dataroot と同じディレクトリに配置する.

WAM の生成

$ mkw [Handle] freqfile

Google API を使ってみる

サンプルの使用法

  java -cp googleapi.jar com.google.soap.search.GoogleAPIDemo ライセンスキー search 検索語
  日本語が通らないという情報があったけど,通るようになっているっぽい.

API の使用方法

  全ての API は com.google.soap.search パッケージに属します.
  GoogleSearch クラスのオブジェクトに検索語を渡し, doSearch() メソッドを呼び出すと,
  検索が実行されて, その結果を収めた GoogleSearchResult オブジェクトが得られます.

GoogleSearch google=new GoogleSearch();
google.setKey(自分のライセンスキー);
google.setQueryString(検索文字列);
GoogleSearchResult result=google.doSearch();


  検索失敗時に GoogleSearchFault 例外が投げられるので, try〜catch 節で囲む.

  GoogleSearchResult オブジェクトから検索結果が取り出せます.
GoogleSearchResultElement[] element=result.getResultElements();
for (int i=0;i<=element.length-1;i++)
{
	// element[i] の情報を使う
}


  スペルミス指摘,キャッシュページの取り出しは, GoogleSearch オブジェクトの doGetCachedPage メソッドや
  doSpellingSuggestion メソッドを呼び出す.

Reference

  Google Web APIs
  https://www.google.com/apis/
  Atsushi's Homepage
  http://www.antun.net/tips/soap/google.html