読者です 読者をやめる 読者になる 読者になる

PDF文書の単語数をカウント

PDF をテキスト化して単語数を数える時、テキスト化の手段に xpdf パッケージに含まれている pdftotext というコマンドを利用する方法がある。

pdftotext text.pdf - | wc -w

とすればカウントできる。英文校正業者の使う単語カウントツールはどんなものを使ってるんだろう。