東京大学総合図書館所蔵
大蔵経研究推進会議・SAT大蔵経テキストデータベース研究会作成
なお、この嘉興蔵の特徴や来歴等についての詳細は、 横手裕, 末木文美士, 渡辺麻里子, 菊地大樹監修『東京大学総合図書館所蔵嘉興大蔵経 : 目録と研究』(2010年9月発行)をご参照ください。
嘉興蔵は、明末(万暦17年/1589年頃)から清初にかけて江南地方で開版された民間による大蔵経出版事業であり、それまでの大蔵経が踏襲してきた折本形式を袋綴形式に変更したという点にも特徴がある。このため、方冊藏と呼ばれることもある。テクストは先行する明代の勅版北蔵を底本としつつ、宋代・元代に刊行された2つの大蔵経を対校本とし、1676年には、続蔵・又続蔵をあわせて1618部7334巻という大蔵経としては膨大な分量となって完成をみた。
我国では、江戸時代を通じて多くの嘉興蔵が輸入されており、江戸時代初期に輸入されたものの一つが鉄眼道光禅師による黄檗版大蔵経(鉄眼版)の底本となった。鉄眼版が我国にもたらした幅広い恩恵を顧慮するなら、その底本となったこの嘉興蔵の重要性もまた自明である。とりわけ、明治初期に刊行された初の金属活字版大蔵経である大日本校訂大藏經(縮刷蔵)において鉄眼版が原稿として用いられ、さらにこの縮刷蔵の拡大印刷板たる頻伽精舎校刊大蔵経が大正新脩大藏經の原稿として用いられたことは、我国の大蔵経史上において嘉興蔵が果たした役割の重要性を端的に示していると言えるだろう。
経典の探し方には3つの方法を提供しています。
検索キーワード入力欄に探している経典名の一部を入力してみてください。新字体・旧字体は気にしなくて 大丈夫です。そうすると、候補がリストされますので、目当ての経典名をみつけたらそれを選択してください。 検索キーワード入力欄に探している経典名が入力されたら「リスト」ボタンをクリックしてください。 そうすると、その経典の巻のリンクとチェックボックスがリストされます。
東京大学総合図書館では帙にわけて所蔵されています。その状況がわかるようにするために、帙ごとに分けたフォルダをたどって探せるようにしています。
SAT大蔵経テキストデータベースでは、経典本文約1億字をキーワード検索できるようにしています。対応する嘉興蔵の経巻が公開されている場合には、当該経巻へのリンクが表示され、たどっていけるようになっています。
経典の閲覧の仕方には、現状では以下のような仕方を提供しています。
経典名をクリックすると、Miradorという画像ビューアで 拡大縮小可能な画像が開きます。
右上の「表示モード切替」のアイコンにカーソルを あわせると
右上の「この資料の情報を表示」というアイコンをクリックすると
右上の「この資料の情報を表示」というアイコンをクリックすると
このシステムで採用しているビューワMiradorには、複数ページを比較したりするために並べて表示してそれぞれのページを拡大縮小したり移動したりする機能があります。たとえば、以下では『中論』の注釈書を並べてみています。
経典名の左側に表示されるチェックボックスをクリックすると 「選択中の巻」としてリストされます。ここにリストされた経巻は 画面中程のバーの右側にある「選択した巻を並べて表示」ボタンをクリックする と複数ページが並べて表示されます。
ページ画像表示中にも、複数画面表示することができます。この機能はビューワの標準機能なのですが、ちょっと操作が複雑なので、Miradorの解説ブログ等をご覧ください。
ページ画像の目次の中に「SAT Text DB」という箇所があります。ここをクリックすると、画面右側にSAT大正蔵テキストDBの当該経巻が表示されます。テキストデータが必要な場合にご利用ください。なお、嘉興蔵と大正蔵とでは経巻の区切り方が異なっている場合があり、必ずしも当該経巻が表示されるとは限りませんので、その点はご注意ください。
大正蔵のテキストを表示すると、IIIFアイコンが表示されます。ビューワを画面分割した上でそのアイコンをドラッグすると、大正蔵の当該ページが表示され、嘉興蔵と比較対照することができます。
右上の「この資料の情報を表示」というアイコンをクリックすると IIIF ManifestのURLが表示されます。このURLを他のIIIF対応ビューワに読み込ませると、どこのビューワでも嘉興蔵のページ画像を表示させることができます。
画面の左上の「アノテーション」アイコンをクリックするとアノテーション 機能に関するアイコンが表示されます。この機能を使って付加したアノテーションは 利用中のWebブラウザ(のローカルストレージ)に保存されます。色々お試ししてみてください。
これまで公開していた試験公開版ではパーマリンクを提供しておりました。今回のシステムでは、異なるビューアを採用していますが、パーマリンクは同じものを継続して使えるようにしております。
本システムでは、IIIF(International Image Interoperability Framework)を利用した高精細画像の公開を行っております。8000万画素で撮影したTIFF画像を最終的には14MB程度のPyramid Tiff画像に圧縮・変換し、IIP Image Serverを用いて画像を公開しています。IIIF Manifestファイルには画像に加えて目次情報も記載しており、今回採用しているIIIF対応ビューワMiradorでは目次情報を利用した閲覧ができるようになっています。ここでは、IIIFの普及に資するべく、本システム構築にあたって構築したいくつかの仕組みについて情報提供いたしますので、一例としてご参照ください。
本システムで準備した嘉興蔵の画像は、250MBのTIFF画像を3MB程度のJpeg画像に圧縮し、それをPyramid Tiff画像化しています。(将来、より容量の大きな画像の配信が可能になった暁には、再作成を行う予定です。)Pyramid Tiff化にあたっては、フリーソフトウェアのImageMagickを利用しております。特定のディレクトリ内にあるTIFF画像群を上記のように圧縮しました。また、圧縮作業にかかる時間を短縮するため、NAS上に置いた画像群を4台のサーバで分担して圧縮するようにしました。ImageMagickでの圧縮の仕方についてはこちらのページの「2.ピラミッド型タイル画像ファイルの用意」もご覧ください。
本システムでは、比較的高速に画像配信をしてくれるIIP Image Serverを採用しています。これは、SAT大正蔵図像DBと同じものを使っています。ApacheからFCGI経由で使っています。この設定の仕方についてはこちらのページの「1.サーバソフトのインストール」 をご覧ください。
IIIF Mnifest作成にあたっては、ページ画像が入ったディレクトリ群と目録情報のファイルを用意し、それらを読み込んで配列にし、その配列をJSONに変換するプログラムを作成した。これは各ディレクトリを自動的に逐次処理していくようになっており、それほど時間をかけずにすべてのIIIF Manifestが生成された。このシステムで公開しているIIIF Manifestは動的に生成されるものではなく、静的なJSONファイルがディレクトリに格納されているという形になっています。これはサーバの負荷をあまり高くしすぎないようにするための措置です。
ここで提供しているPDFファイルは、Jpeg画像から自動生成したものです。ImageMagickのconvertコマンドをシェルで繰り返し処理しました。 もっとうまく作るオプションもあると思いますので、より良いやり方を追究していただけたらと思います。
トップページに表示されているツリー表示には、Fancy treeというフリーソフトウェアを利用しています。これはDynatreeというソフトウェアの後継で、jQeuryのプラグインとして動作するものです。チェックボックスに関わる様々な動作を比較的詳細に行えることから、これを採用しました。詳しくは公式サイトをご覧ください。
検索窓に文字を入力するとその文字を含む経典名がリストされるようになっています。これはjQuery UIのAuto completeを用いています。このサンプルスクリプトの中に、文字の曖昧検索の例があり、ここではこれをほぼそのまま用いています。異体字マッピングに関しては、検索対象の文字が決まっているので、すべての文字を取り出してからCHISEの文字オントロジーと総当たりで対応する文字を抽出して、そのペアをスクリプトに読み込ませています。このページのソースに書き込んでしまっているので、興味がある方はこのページのHTMLソースをご覧になってみてください。
このページは、ソースを拝見していただけばわかるように、手でいちいち書いているものではなく、多くの部分は自動生成です。しかし、アクセス時のサーバへの負荷をあげすぎないようにするために、アクセスはHTMLで行っていただいています。実際にはPHPで書いており、HTMLに変換する際に経典名リストやCHISEの文字データを読み込んで異体字同時検索用データや経典名のJSONデータ等を生成しています。
このサイトの試験公開版では各ページ画像のパーマリンクを提供しておりました。これは、元々、Apacheのmod_rewriteモジュールを使ってビューワを表示するPHPスクリプトのURLへとマッピングするようになっていました。そこで、今回のバージョンにてパーマリンクを維持するにあたっても、Apacheのmod_rewrite機能を使って旧ビューワから新ビューワへのマッピングを行っています。mod_rewriteは正規表現を使ってURLの書き換えができますのでこのような用途には大変便利です。
ビューワとして組み込んでいるMiradorは、Bootstrapを使ってのサイズ調整を行っていますが、そのために、iframe内に読み込むようにしています。iframeに入れないことには、ビューワのサイズ調整がちょっと難しいことがありました。
ここでは、Miradorの初期設定ファイルをPHPで生成するようにしており、参照する冊・ページを読み込んでそれを表示させるための初期設定ファイルがアクセス毎に作成されています。そして、このPHPのプログラムでは、複数ページ画像表示の際には、複数ページの情報を読み込むとそれらを表示させるための設定ファイルを作成するようになっています。
このサイトでは、大量の細かな画像や、比較的大きなHTMLファイル・JSONファイルを配信しています。たくさんのファイルを一度に受信することも、サイズの大きなファイルを受信することも、ネットワークにとっては負担になってしまうので、通常設定ですとアクセスに時間がかかりがちです。そこで、それを解決するための手法を2つほど採用しています。いずれも、ここで採用しているWebサーバソフトApacheの設定ファイルにおいて設定可能となっています。一つは、KeepAlive 設定をOn にすること(ただし、デフォルト設定ですでにOnになっている場合もある。)、もう一つは、mod_deflateモジュールを用いてJSONファイルやHTMLファイルなどを転送する時に圧縮するという手法です。これらの工夫により、コンテンツの状況次第ではかなりネットワークへの負荷が低減できるはずです。