memo.xight.org

日々のメモ

xdoc2txt

Summary

xdoc2txtはPDF,WORD,EXCEL,一太郎などの各種バイナリ文書から,テキスト要素を抽出する汎用テキストコンバータ

- 対応している拡張子

.rtf
.doc
.xls
.ppt
.jaw/jtw
.jbw/juw
.jfw/jvw
.jtd/jtt
.oas/oa2/oa3
.bun
.wj2/wj3/wk3/wk4/123
.wri
.pdf
.mht
.html

- Reference
  xdoc2txt - PDF,WORD,EXCEL,一太郎などの各種バイナリ文書からテキストを抽出
  http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html

via

  Orbium - 2004-05-07
  http://sasapanda.com/toshi/archives/000764.html