Word の .doc ファイルからテキストを抽出したいと思い、何かいいツールはないかと探したのだけれど、これというのが見つからなかったので自分で作ってみました。
要件としては
1.複数のファイルを一括変換したい。
2.フォルダを指定すると、サブフォルダも再帰的に処理したい。
3.抽出したテキストはテキストファイルとして保存したい。
調べた中ではこちらの VBScript が希望するものに近かったので、これを元に作成させて頂きました。
http://www.geocities.co.jp/SiliconValley-Bay/1992/vbs/doc2txt.html
で、出来たのがこちら。
doc2txt.zip
zipファイルを解凍すると doc2txt.vbs という VBScript がありますので、それに変換したいファイルなりフォルダをドラッグ&ドロップするだけ。
.doc の拡張子を .txt に変えたものが、元のファイルと同じフォルダに生成されます。
なお、すでに .txt ファイルがある場合は、処理をスキップするようにしてあります。
VBScript を書くのはこれが初めてで、見よう見まねで書いたのでおかしなところがあればご指摘ください。