裁断した本をスキャンしi文庫HDで読めるようにしてみた

| コメント(0) | トラックバック(0) このエントリーを含むはてなブックマーク

自分でスキャンしてi文庫HDで観れる電子書籍っぽいものを作ってみたので、その手順をかいておきます。

きっかけ

ものすごいアプリケーションに出会う。それは i文庫HD という「リアルで快適な読書が楽しめるiPad専用アプリケーション」です。

しかも、jpeg等に対応しているため、比較的電子書籍を用意できそうです。

詳しくは i文庫HD:マニュアル:使用できるファイル形式 を参照してください。

さらに、きっかけを与えてくれたのが、東和インフォセービングス さん提供の 書籍製本裁断バラシサービス です。

自分で裁断せずとも、本を送るだけで、裁断してくれます。 (クラウドの時代で言うと、Saidan as a Service , SaaS です)

前回までのあらすじ(?)

書籍製本裁断バラシサービス さんに裁断していただいた書籍があります。

IMGP0187
IMGP0187 posted by (C)k1ha410 IMGP0188
IMGP0188 posted by (C)k1ha410 IMGP0191
IMGP0191 posted by (C)k1ha410

電子書籍を自分で作成する手順

  1. 本を買ってくる
  2. 糊付けしてある部分を裁断(断裁)する
  3. バラバラになったページをスキャンする
  4. PDFや画像ファイルにする
  5. DropBoxなどを用いてiPadへ転送する
  6. i文庫HD のアプリケーションで閲覧

現在この手順の2番目「糊付けしてある部分を裁断(断裁)する」までは終わっています。

スキャンして電子書籍にする

スキャンの方法

世の中には、スキャナが存在していますが、電子書籍を作るのに向いているスキャナは、 ADF機能つきの以下のようなスキャナです。

このスキャナは、50枚程度までの紙の束を後部のADF(自動給紙方式)の所にセットしてスキャンを開始すると 両面をスキャンしてくれます。だいたい1分に20枚程度からスキャンしてくれます。

ただ、お値段もいいお値段です。

実際に楽天さんの価格を調べてみると最低でも4万円します。

もっと高速なタイプが欲しいということで、業務用とか考えると、14万程度します。

かといって、普通のスキャナでやろうとすると凄く大変です。 時間がかかります。

事務機器メーカの複合機

職場などに以下のような複合機がありませんか?

もし、これをお借りできるのだとすると、ものすごく高機能で、高速なスキャナが手に入ります。 しかもネットワーク対応だとすると、スキャンした画像が共有フォルダに格納されるくらいの手軽さです。

お試しする分には十分な機能です。

スキャン

今回は試しに RICOH さんの imagio MP C2500を試しに使ってみました。

上記のような機械で、「モノクロ:50枚/分 フルカラー:35枚/分」程度でスキャンしてくれます。

スキャン時のポイントは

  • 用紙サイズは不定形にして本のサイズを測って入れる
    こうすることで、自動認識を抑制します。
    普通ですと、自動認識を信頼するのですが、さすがに本の大きさの紙の認識率は悪いです。
  • スキャン時のdpiは300dpi。
    せっかくスキャンするので、欲を出して400dpiや600dpiでもいいのですがあえて300dpiにしました。
    もちろん200dpiでも十分ですが、後々の加工などを考えて少し余裕を持たせています
  • スキャン後のファイル形式はjpeg
    jpeg以外にもPDF化することもできるのですが、加工のしやすさからjpegにしました
  • 両面スキャン
    有無を言わず両面スキャン

この辺に注意をしてスキャンをします。

スキャンの結果

裁断頂いた本は以下の本でした。

星界の紋章(1)

書籍の種類としては小説で、コミックよりも小さくなっています。

この本は、先ほどのスキャナーのADFではスキャンできませんでした。小さすぎるのか途中で紙詰まりします。 凄く重要な経験です。

この本は、snapscanなどだとスキャン出来るのだろうと思います。

涼宮ハルヒの憂鬱(1)

この本は、B6サイズ、厚さ15mmの普通のコミック本です。

この本は表紙を含め簡単にスキャンできました。 だいたい5〜6分でスキャン完了しました。

ミナミの帝王スペシャル(ゼニの花編)

この本は、B6サイズ、厚さ30mmのコミック本ですが、紙質がジャンプやマガジンなどと同じような材質の本です。 ただ表紙だけは、しっかりした紙をつかっています。

この本は、本体部分は無理なくスキャンできました。紙質が悪いので心配でしたが大丈夫でした。 ただ、表紙は両面スキャンが出来ず片面ずつでした。

(この複合機は、機械的に裏表を変更するタイプなのでどうしても厚い紙などは紙詰まりするようです)

ハリー・ポッターと賢者の石

この本は、ハードカバーの本です。

本体部分は無理なくスキャンできました。また、表紙もOKですが、ハードカバーの表紙部分は厚すぎるので スキャナに入れることさえしませんでした。

残りの手順

  1. 本を買ってくる
  2. 糊付けしてある部分を裁断(断裁)する
  3. バラバラになったページをスキャンする
  4. PDFや画像ファイルにする
  5. DropBoxなどを用いてiPadへ転送する
  6. i文庫HD のアプリケーションで閲覧

スキャンした時点で、jpegになっているので、PDFや画像ファイルにするは必要ないのですが、

縦横の変換とファイル名の変換だけはしました。

縦横変換

電子書籍自炊処理班プランA を使って一括変換しました。

  • リサイズはせず 100%
  • その他オプションはデフォルトのまま
  • 縦横回転を 270度

この設定で行ったところ、目的の方向になりました。

ファイル名変換

スキャン後のファイル名が「2010102920431234_001.jpg」のようなファイル名であり、 しかもページ数が多い本だと、日付時刻が変わって連番部分が再度001から振り直される こととなり、ちょっと精神衛生上良くないので、ファイル名を連番にしました。

Flexible Renamer を使いました。

ZIPで圧縮

この時失敗した事があります。 表紙、本文共に両面スキャンしてそのまま zip 圧縮した所、意図しない形で表示されました。

言葉では簡単に表現できないので図にしてみました。

本の構成
本の構成 posted by (C)k1ha410

表紙を込で裁断すると上記のようになります。

1枚目は表紙です。本を開くと表紙の裏と2枚目の表が見えます。 次に、もう1枚めくると、2枚目の裏と3枚目の表が見えます。

私たちは赤い点線で囲んだ範囲を見ていることになります。

次にi文庫HDの表示を見てみます。

i文庫HDの表示単位
i文庫HDの表示単位 posted by (C)k1ha410

i文庫HDは2枚を1組として左右に分けて表示してくれます。もし、表紙を含め表裏ともにスキャンすると、1枚目の表、1枚目の裏という風に見えます。

こうすると、本来1組として見えるはずの表示ではなくずれた表示になってしまいます。

またi文庫HDは1枚目を表紙として表示してくれます。(設定で各書籍毎にどの画像を表紙として使うかは決めれますが、最初は1枚目が表紙として表示されます)

そこで、表紙だけは裏面を表示せずに、表だけ表示するようにしました。 そうすると、1枚目の表、2枚目の表のような順番で表示され、次からは本と同じ並びで表示されるようになります。

ただ、表紙の後ろに目次があった本がありました。1枚目裏に目次があり、2枚目表と一緒に表示される方が自然に見えました。

そこで、下のように白紙を挟んで(僕の場合には裏表紙の裏を白紙の代わりに代用)し、調整しました。

表紙の裏も残す場合
表紙の裏も残す場合 posted by (C)k1ha410

ZIPで固めて転送

あとは、そのファイル全てを1つのzipに圧縮し、DropBoxなどを経由してiPadに転送しました。

これでiPadのi文庫HDから取得でき表示できました。

今後した方がいい点

サイズの縮小

1枚のサイズは300dpiでスキャンしそのまま利用しているため、画像サイズが大きいです。 現在、200ページの本で67M(涼宮ハルヒの憂鬱(1)) 400ページの本で34M(ミナミの帝王スペシャル(ゼニの花編))となりました。

さすがに大きいので、リサイズが必要かと思います

グレースケール化

全てフルカラーでスキャンしていますが、グレースケール化することでもう少し見やすくなるのではないかと考えています。 また、サイズも小さくなるのではないかと考えます。

微細な傾き調整

カットの時の誤差か、スキャナの読み取り時の誤差か各ページ若干傾いています。 その傾きを補正できるといいのではないかと考えますが、ちょっと大変そうです。

さいごに

慣れてくると簡単にスキャンできるようになります。だいたい200ページの本で5分ほどでスキャンできたため、 傾き調整とリネームをしてzipに固めるだけです。

一番めんどいのが、全てのページがちゃんとスキャン出来ているかを確認する作業かと思います。

あと、小説がスキャンできるようになれば、個人的には満足します。

トラックバック(0)

トラックバックURL: http://www.m-tea.info/mt-tb.cgi/79

コメントする

あわせて読みたいブログパーツ

このブログ記事について

このページは、k1ha410が2010年10月30日 14:19に書いたブログ記事です。

ひとつ前のブログ記事は「裁断サービスの1冊あたりの実費用を計算してみた」です。

次のブログ記事は「フォト蔵のアルバムの写真のタグ取得Rubyスクリプト」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。