memo.xight.org - 2004-03-27

2004-03-27 Sat

オートニュー速

- Summary

RSS の description と title を Bulkfeeds Similarity API に渡して形態素解析して
スコア上位2語を元のタイトル前後につけてます.
すると,なんか2ちゃんねるニュー速スレ風タイトルが自動生成されます.

- Reference
  オートニュー速 for RSS
  http://blog.bulknews.net/autonewsoku-anyrss.cgi
- via
  たつをのChangeLog - 2004-03-26
  http://chalow.net/2004-03-26.html#2004-03-26-2

多言語対応テキスト処理

- 問題
  FileReaderでは文字コード指定ができない

- 例

BufferedReader br = new BufferedReader(new FileReader(args[0]));

- 方法

FileInputStream fis = new FileInputStream(args[0]);
InputStreamReader isr = new InputStreamReader(fis, "UTF8");
BufferedReader br = new BufferedReader(isr);


- 指定できる文字コード一覧
  http://java.sun.com/j2se/1.4/ja/docs/ja/guide/intl/encoding.doc.html

- Reference
  Java関連メモ
  http://homepage3.nifty.com/memoire/pc/java.html

グーグルチキンレース

- Summary

1. Google の検索結果がより少ないものを探す. ただし1つも引っかからないのはナシ.
2. 検索語は何個でもよいが,できれば1つの方が望ましい.
3. 「似たページは除かれています 」 のメッセージは無い方が望ましい.
4. つーか何だかんだ言っても,面白ければ何でもいい.

- Reference
  グーグルチキンレース
  http://mypage.naver.co.jp/microsoft/special/g_chicken/