電脳の中の脳──脳科学・メンタルヘルスの最新研究やデバイス

脳科学やメンタルヘルスの最前線を、研究者・当事者目線からお伝え。生きづらさを解消するためのプロダクトの紹介も。

電脳上の本棚

家に、本が多すぎる。

だいたい15年ほど、この悩みを抱いて生き続けてきました。

特に専門書がひどく、1年に数回しか開かないのに1000ページ前後本棚を陣取っていることも。そういうものは近頃は電子書籍で買うようにしているのでこれ以上悲惨なことにはならないのですが……

どちらにせよ漫画や小説などの娯楽も多かったため、だいたい引っ越しのたびに

2000冊↑ → 1000冊前後 → 560冊(今ココ)

と泣く泣く処分を繰り返してきたものです。

※しかも自分の特性のために、どこに何があるかわからない

 

さて、毎回こうも泣いてはいられないので、ついに全書籍の電子化を敢行した……というのが今回の記事です。

f:id:julyfaraway:20190904105702p:plain

今回は「書籍」の効率化

 

まず用意すべきは、最新のScan Snapと裁断機

まず、今回の記事は真新しいものではありません(少なくとも、脳科学記事よりは)。

というのも、自炊技術に関しては先駆者たちの情報も非常に多く、有益なアプリやプロダクトの情報も調べればたくさん手に入れることができます。

今回の記事はあくまで、リーフがこのように運用しているよ……という紹介として捉えてもらえると良いかと思います。

ちなみにあくまで書籍を文字化・PDF化できるだけですので、読む時間の確保はまた別途必要なのは悪しからず……こういう要約サービスの本バージョンがあればいいんですが。

 

www.lifehacker.jp

 

書籍の電子化に必要な手続きとしては、

  1. 書籍の背表紙の裁断
  2. 書籍を全ページスキャン
  3. OCR・圧縮など、書籍データの最適化
  4. スキャンデータを、クラウドなど電子媒体からアクセスしやすい場所へ保存
  5. アクセス用のツールから、スキャンデータにアクセス

……といった感じになるでしょう。

このうち、確実に必要となるのが、1.を可能にする裁断機と、2.を可能にするドキュメントスキャナです。

 

裁断機としてリーフが使っているのはこちら。

プラス 裁断機 自炊 A4 かんたん替刃交換 PK-513LN 26-309

プラス 裁断機 自炊 A4 かんたん替刃交換 PK-513LN 26-309

 

200ページのコミック程度なら、頑張れば一発できれいに裁断可能です。

ただ、画像上部に出ている取っ手が収納不能なため、場所を取るのが難点です。

収納可能な裁断機として有名なものにはDUROREX 200DXがありますが、使っていないので今回は紹介に留めておきます。

DURODEX 自炊裁断機 ブラック 200DX

DURODEX 自炊裁断機 ブラック 200DX

 

 

スキャナに関しては、ScanSnap一択といってよいでしょう。

特に最新モデルでは、

  • Wi-Fiで端末と接続
  • 端末上のパネルで吸い出し→クラウドへ保存まで一括化可能
  • 吸い出し速度が従来のものの1.7倍ほど
  • ページ送りの精度が最高

と非常に進化しており、余裕があればぜひこちらの購入をおすすめします。

実際にリーフも古いScanSnapから切り替えたのですが、そもそも吸い出し速度が倍違うのでかかる手間が圧倒的に違いました。

 吸い出したデータは最適化すべし:Adobe Acrobat x clearscan

ドキュメントスキャナを標準的な設定(グレースケール、300dpi)で使うと、だいたいコミック1冊で100MB程度、文庫本でも80MB程度のPDFファイルが作成できます。

基本的にはこのままiPadなどのビューワに入れて読めば、電子化の完了といえます。

ただしリーフのように冊数が4桁に迫ると話は別です。100GBに迫るPDFファイル群など、ローカルはおろかクラウドに入れても容量を圧迫しすぎて、とてもじゃないですが他のファイルを扱えなくなります。

また、スキャンした(自炊した)PDFはそのままではただの画像ファイル。紙より取り回しに優れるとはいえ、検索機能やコピーペーストなど、コンピュータで扱えるようにしたいものです。

そこで、基本的にPDF文書にはOCR(Optical Character Recognition/Reader: 光学文字認識)処理をかけます。OCRをかけると、画像データからフォントの並びを認識し、「検索可能」な状態にしてくれます。

OCR処理をするソフトウェアは色々あるのですが、ここでのイチオシはAdobe Acrobat。リーフの所持しているのは今は亡きAcrobat Xですが、現在でも最新版は月額課金モデルで入手することができます。 

 
 
 

 Adobe Acrobatのキモは、OCRとともにファイルサイズ圧縮・文字画像のフォントデータ化をする"Clearscan"です。 

Clearscanは通常の"フォントデータを付加する"タイプのOCRと違い、画像そのものをフォントに置き換えます。そのため、画像データ部分がフォントデータになる分、ファイルサイズが1/2~1/3程度まで圧縮できるすぐれものです。

 

オリジナルデータはEvernote、普段遣いはGoogle drive

さて、非常に利便性の高いClearscanですが欠点が1つだけ。それは元ファイルを置き換えてしまうという、利点の裏返しの側面です。元ファイルを保存しておかないと、例えばclearscanではない別の手法を使いたくなったり、フォントに置換されていないもともとのデータを読むことができなくなります。

これを回避するには原本保存しかないのですが、上述の通りPDFファイルは1つ1つの容量が大きく一筋縄ではいきません。ローカルに保存する手もあるのですが、リーフは破壊・紛失のリスクが高いと踏み、Evernote Premium アカウントの取得に踏み切りました。

f:id:julyfaraway:20190905090314p:plain

月間10GBもアップロードでき、保存容量は無制限

Evernoteは無料プランだと月間アップロードは50MB、同期できるデバイスも2台までと、昔に比べて少々取り回しが悪くなりました。しかしそのぶん、プレミアムサービスは月間10GB、デバイス無制限、PDFファイルは自動で文字検索可能(OCRではなく、検索にPDFの文字がひっかかる)……など、様々なサービスが付帯しています。

基本的に、すべての書類・ファイルはEvernoteにアップロードし、強力な検索エンジンで検索して入手する……という手段に落ち着きました。

ただ欠点が一つ。iOSEvernoteアプリでは、インライン表示ができません。

 

f:id:julyfaraway:20190905090748j:plain

クリックすれば全画面表示はできる

これだと、Evernoteをビューワに使うのは少々面倒があります。また、よく使う見開き画像ビューワ"i文庫HD"はEvernoteとの同期に対応していない(というか、EvernoteのPDFと同期できるビューワがない)ため、別アプリで開くのにかなり問題があります。

したがって、圧縮したファイルはGoogle drive(フリーでも15GBまで保管可能)、原本はEvernote……と住み分けることで、なんとかこの問題を解決しました。

また、Windows版では

  • スキャンしたローカルフォルダから自動でEvernoteにアップロード(アップロードフォルダ機能)
  • Google driveもローカルフォルダと同期
  • driveと同期されたファイルに直接adobe acrobatで処理

とすることで、いちいちアップロードする手間をほぼ省くことができました。

(詳細は追記するかもしれません)

 

書籍のエコシステム:Scansnap, Adobe, Evernote, Google drive

最終的に、こんな感じに落ち着きました。

  1. 裁断書籍をScansnapでローカルへ保存
  2. 原本をEvernoteに保存、検索可能に
  3. 原本にclearscanをかけて、検索可能+圧縮状態に
  4. 圧縮ファイルをGoogle driveに保存
  5. ビューワ(i文庫HD)からGoogle driveに接続、必要な書籍をダウンロード
  6. iPad proでいつでも読める!

f:id:julyfaraway:20190905090827p:plain

これだと、

  • google driveが一杯になっても、アカウントの複数取得でカバー可能
  • 原本が必要になったりgoogleのサービスが落ちても、evernoteにバックアップが存在
  • 検索したいだけのときはEvernote、じっくり読むときはDrive経由のビューワと棲み分け可能

と、各種サービスの利点をうまく凝縮したエコシステムを構築できました。

ちなみにリーフはEvernoteにレシートや書類も(原本保管必須のもの以外は)すべて保管してあるため、「どこに何があるかわからない」問題も解決できていたりします。

神経発達の観点からも著しい苦手がある自分ですが、デバイスの力で解決できるように組み立てた好例かと思い、今後も類似例を紹介していこうと思います。

f:id:julyfaraway:20190905091538p:plain

書籍のエコシステム