memo.xight.org

日々のメモ

Inxight Software - Unstructured Data Management Solutions

Hyperbolic Tree

  膨大なリンクを持つWebサイトやパソコンの中の複雑なファイル構造を見やすくするために,
  画面に双曲幾何学的な空間を作り,リンク構造を描き出す

Reference

  Inxight
  http://www.inxight.com/
  Inxight,情報の海から必要なデータを可視化するソフトを開発
  http://www.watch.impress.co.jp/internet/www/article/1999/0210/inxight.htm

sinnzeug - a new search-engine for content

Summary

  検索キーワードを2次元平面に配置することで,意味的に関連するページをグルーピングしながら検索を進めていくことができます

Reference

  sinnzeug - a new search-engine for content
  http://www.sinnzeug.de/

via

  My Bookmark: Information Visualization & Digital Museum
  http://www.ai-gakkai.or.jp/jsai/journal/mybookmark/16-2.html

GINGA

Summary

  本来は目に見えないインターネットのネットワーク構造や,そこを様々な情報が飛び交っている様子を,
  色々な視点から可視化しようと試みたもの.
  可視化された世界を自由に移動できる.

Reference

  GINGA
  http://www.plannet-arch.com/ginga/ginga.htm

via

  My Bookmark: Information Visualization & Digital Museum
  http://www.ai-gakkai.or.jp/jsai/journal/mybookmark/16-2.html

The Brain Technologies Corporation

Summary

  一度にリンク情報をダウンロードし,表示されているページからの子リンク /
  孫リンクだけを動的にグラフィック表示する.
  これにより,ユーザーは直接リンク構造をたどっていくことができ,極めて早く目的のリンク先にたどり着ける.

Reference

  The Brain Technologies Corporation
  http://www.thebrain.com/
  INTERNET Watch - TheBrainのリンク視覚化技術に米国特許
  http://www.watch.impress.co.jp/internet/www/article/2000/0308/thebrain.htm

TouchGraph

Tech Overview

  TouchGraphは,相互関係がある情報のネットワーク構造を視覚化する方法を提供する.
  ネットワークは対話型の様々な変形に向いているグラフとして与えられる.
  安定した視覚的なイメージはユーザの記憶を補助できる.
  TouchGraphはグラフをできるだけ静止しておくこと,さらに動的な変更が決定,反復,Undo可能にすることによりこれを実現する.

Dynamic Graph Layout

  TouchGraph の基本形のようだ.

適用例

  TouchGraph GoogleBrowser
  http://www.touchgraph.com/TGGoogleBrowser.html
  Planet-Wissen Navigator
  http://www.touchgraph.com/PlanetWissen.html
  TouchGraph WikiBrowser
  http://prdownloads.sourceforge.net/touchgraph/TGWB_102.zip

Reference

  TouchGraph
  http://www.touchgraph.com/
  SourceForge - TouchGraph
  http://touchgraph.sourceforge.net/

形態素解析システム 茶筌

茶筌とは?

  1997年2月19日にversion 1.0 正式版が奈良先端科学技術大学院大学自然言語処理学講座からリリースされた,
  フリーの日本語形態素解析器

名前の由来

  開発拠点である奈良先端科学技術大学院大学のある奈良県生駒市高山町が,日本有数の茶筌の産地であることから.

国際表記は "ChaSen"


Reference

ChaSen's Wiki - FrontPage
http://chasen.naist.jp/hiki/ChaSen/

MeCab - Yet Another Part-of-Speech and Morphological Analyzer

MeCab (和布蕪)とは

  MeCab は, 奈良先端科学技術大学院大学自然言語処理学講座の開発する
  形態素解析器 ChaSenを基に開発された高速な形態素解析器です.
  解析精度は, ChaSen と変わらないにもかかわらず, 平均的に ChaSen の3-4倍のスピードで動作します.
 

Reference

MeCab: Yet Another Part-of-Speech and Morphological Analyzer
http://mecab.sourceforge.jp/

汎用連想計算エンジン GETA

目的

  連想検索をはじめ,文書分類,単語間類似度計算など,大規模文書の分析に必要な要素技術をサポートすることを目的としている.

構成

  汎用連想計算エンジン(GETA)は,文書検索における単語頻度付き索引ファイルを典型とする,
  大規模かつ粗な行列型データを対象として,文書間および単語間の類似度を
  内積型メジャーにより高速計算することを中心とする一連のツール群から構成.

Reference

  汎用連想計算エンジン(GETA) 公開HP
  http://geta.ex.nii.ac.jp/

専門用語自動抽出システム

Summary

  「専門用語の多くは複合語,とりわけ複合名詞である.」ということに着目.

termex.pl

  茶筌の出力から専門用語を抽出
  http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/resource/termext/termex.tar.gz

Reference

  専門用語自動抽出システム
  http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/resource/termext/atr.html

Sen(Java 形態素解析エンジン)

Sen とは?

  Sen は,Java で実装された形態素解析器です.
  現在は,日本語しか使えませんが,文字の種類(日本語の場合,,カタカナ,漢字&平仮名,記号)を判別するTokenizerと
  形態素解析の辞書を用意すれば,他の言語でも利用可能です.
  次世代形態素解析器 ChaSenTNG (TNG=The Next Generation) をベースに Java に移植しています.

追記

  現在 ChaSenTNG は MeCab に名称変更されている.

Reference

  Sen(Java 形態素解析エンジン)
  http://yamaguch.sytes.net/~tora/opensource/sen/

Highlight を Toggle にする.

はじめて 簡単なvim のスクリプトを書いてみた.

set hlsearch
" C-h でハイライトをToggle
nmap <C-H> :call ToggleHighlight()<CR>
function! ToggleHighlight()
	if &hlsearch != ''
		set nohlsearch
		echo 'Highlight Off'
	else
		set hlsearch
		echo 'Highlight On'
	endif
endfunction

Reference

  新館 : vimエディタ-ユーザマニュアル和訳
  http://www.water.sannet.ne.jp/clean/gvim.doc/doc/usr_41.txt

フォルダの最終アクセス日時を更新を停止

レジストリ変更

  \\HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\FileSystem
  NtfsDisableAccessUpdate に REG_DWORD で 1 を設定.
  デフォルトは,値が設定されていない.

効果

  これを停止することによってNTFSへのアクセス速度向上が期待できます.

Reference

  NTFSの最終アクセス日時の更新を停止する
  http://www.asahi-net.or.jp/~ym3y-oksm/nt/w2k/w2k21.htm

ktermのタイトルを変更

方法

  タイトルを変更するためには, `\e]2;タイトル\a' という特別なエスケープシークエンスを用います.
  tcsh でこれをどう使うかなのですが,一つはプロンプトに埋め込んでしまう方法があります.一例をあげると,

set prompt='%{\e]2;kterm: %~\a\e]1;%.\a%}[ %d %w %D %T %Y ] %~\
%n@%m<%h>'


  とすると,タイトルには `kterm: カレントディレクトリ' と表示され,
  アイコンにした時には,そのタイトルにカレントディレクトリの最後の名前 (`%.')が表示されます.

追記

  TeraTerm でもタイトル変更可能.

Reference

  UNIX Tools
  http://www2u.biglobe.ne.jp/~hsaka/tool.html#tcsh_title

Windows2000 から Outlook Express をアンインストールするには

フォルダ

  %CommonProgramFiles%\Microsoft Shared\Stationery
  %APPDATA%\Identities
  %APPDATA%\Microsoft\Address Book

ファイル

  inetcomm.dll
  msoeacct.dll
  msoert2.dll
  msoe.dll
  msoeres.dll
  msimn.exe
  oeimport.dll
  oemiglib.dll
  oemig50.exe
  setup50.exe
  wab.exe
  wabfind.dll
  wabimp.dll
  wabmig.exe
  csapi3t1.dll
  directdb.dll
  wab32.dll
  wab32res.dll

レジストリ

  HKEY_LOCAL_MACHINE\Software\Microsoft\Outlook Express
  HKEY_LOCAL_MACHINE\Software\Microsoft\WAB
  HKEY_CURRENT_USER\Identities
  HKEY_CURRENT_USER\Software\Microsoft\Outlook Express
  HKEY_CURRENT_USER\Software\Microsoft\WAB

以上を削除


バッチファイルのありか

  http://homepage2.nifty.com/winfaq/downloads/rmoe5.cmd

Reference

  WinFAQ - Windows 2000 から Outlook Express をアンインストールするには?
  http://homepage2.nifty.com/winfaq/c/oetips.html#987

管理共有の解除

NT Workstation or NT Server の場合

  ネットワーク環境でWindowsNT を使用していると,ドライブ単位で C$, D$ のような共有設定が自動で行われる.
  レジストリの HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\LanmanServer\Parameters に値の追加で
  NT Workstation の場合はAutoShareWks, Server の場合は AutoShareServerという値を作成して
  REG_DWORD で0 を設定し,リブートする.

Windows2000の場合

  AutoShareWks を 0 にする.