2011年11月12日土曜日

自炊

論文探しに苦労する日々を脱出すべく、自炊に挑戦することにした。

色々と調べたが、スキャナーはこれで問題なさそう。富士通Scan Snap S1500M(MはMac版のこと?)。約4万円で購入。価格.COMだと3万円前半からあるみたい。

Mac版を購入したら、Acrobat Professional8が同封されていた。最新版の10が5万円ぐらいで販売していることを考えれば、かなりのお買い得感。


設定は、これまた色々と調べて、白黒、スーパーファイン、向き・傾き補正OFF、文字をくっきりOFF、テキスト認識はしない、といった感じ。

OCRはAcrobatで行っている。白黒は、グレースケールとカラーに比べてファイルサイズは10分の1ぐらいになるらしい。文字くっきりはOCR認識の精度が落ちるとか。

私の場合、コピーされた論文をPDF化するのが最大の目的。多くのヒトは書籍の自炊をすると思うので問題にならないのだろうが、論文のPDF化にあたって結構厄介な問題が生じた。

コピーは紙面節約のため、1ページに2ページ分印刷されてることがしばしば。


で、収納の際は半分に折っておくのが普通。数ページの論文で、キッチリと折れ目がついている場合は問題ないのだが、このように厚みがあって、緩やかに折れ目がついていると厄介。


このような文献を真ん中でバッサリと切ると、折れ目が残り、ピョンと跳ねる。


スキャンする際には、ページ順に並べる必要がある。端がピョンとなっていると、こんな感じに端が揃いにくい。


図にするとこんな感じ。


このままスキャンすると、吸い込む際に隙間があるので、斜めにスキャンされることになる。

解決策としては、ど真ん中でなく、折り目の根元からカットするのが一番楽。しかし、文字が真ん中ギリギリまできていたりすると、文字までカットする可能性があるので注意が必要。

苦労したのは、この点のみ。複数枚吸い込みはほとんどなく、スキャン速度もとても早い。左右対称になるように切断、PDFになった後のページ数確認など、それなりに時間はかかるが、PC内に収納でき、キーワードで検索できることを考えれば、やる価値はあり、だと思う。