2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

【E Ink】Amazon Kindle 端末 74【電子書籍リーダー】

538 :名無しさん@お腹いっぱい。:2022/08/28(日) 14:23:50.38 ID:6awgKUvH.net
国会図書館が画像でしか公開していないのは、日本語の場合漢字の数が多すぎて自動でテキスト化するのが難しいため。

青空文庫のようにテキスト化するためには、膨大な人件費と時間が必要になる。
たとえば、青空文庫ではチェック漏れが減らせるようテキストの入力と校正は別々の人が作業するよう分けている。
また、入力作業の楽しさと比較すると、校正は単調で時間と根気が必要な作業のため、長年のあいだずっと作業者不足に悩まされている。

そのため、青空文庫では入力が済んでも校正が終らず、公開の遅れている作品が常時山積みとなっている。

青空文庫の場合は、ボランティアで人件費がかからないので活動費全体も年間20万円程度で済んでいるけど、仮に100人の人間を雇いテキスト制作の作業をしてもらった場合、ほぼ最低賃金(時給900円)で働いてもらっても、人件費だけで年間1億5千万円ほどの費用が発生することになる。

逆に言うと、青空文庫のボランティアって、実際には年間数億円単位の人件費が無償の作業として行われていると考えてもいい。
というのも、あの青空文庫の複雑なルールに沿って適切に作業を進められるような人材の多くは、本来の職場ではそれなりの賃金で働き生活にも余裕のある人が多いと予想でき、最低賃金で雇えるような人材ではないはずなんだよね。

話を戻すと、国会図書館の方針としては、まずは比較的低コストで早く作業が進められる画像でデータを公開するので、あとはそれをもとに自分たちで使いやすいようデータを加工してくださいということだと思う。

そうやって、自分でテキスト化したデータをネットで無料公開してくれる人が増えれば、私たち全体がもっと幸せになれると思う。

総レス数 1001
224 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★