データベースと維持管理システム

宮城教育大学 鵜川義弘

自然史学会連合第6回シンポジウム
"博物学とインターネット"
デスクトップでナチュラルヒストリー
21世紀の自然史科学における画像データベース
国立科学博物館
平成12年10月14日(日)資料

 

データベースの今と昔

昔は、フィールドの文字数がどうの、トランザクションがどうのというややこしい話も多くあったが、そのころは、画像、Webなどというものは存在しなかった。情報科学分野で使う「データベース」は、その時代の定義であると考える。

データベースは、情報を整理して人が使える状態にしたもの。また情報を管理・提供するための手法。ノート、メモ、電子メールを集めたもの等を検索できるようにしたものも含まれる。ちなみに「情報」とは物理的属性はないが、受け手がいて意味を持つ知識(奥が深い)。

Webの利点

インターネットのホームページ(Web、WWW)は完全に一般大衆化した。Webの利点は、様々なプラットフォーム、OSで動くブラウザが用意されていること。検索内容と使い方の両方を同じ画面に提示することができ、データベースや、検索用のソフトウエアを配る必要がなくなった。従来、個別ソフトで提供されてきたデータベースもほとんどがWebでの提供になってきている。

サーバの種類と選択

  1. Webによるデータベースの提供方法には2種類ある
    1. 一旦ファイルに書きだしてからWebサーバで公開するタイプ(CD-ROM化ができ、ネットワークがないところでも利用できる利点がある)
      1. http://ameba.i.hosei.ac.jp/BIDP/makinoCD/makino2000/html_j/index.html
    2. データベースにWebのインターフェイスをつけそこからWebページを書き出して提供するタイプ
      1. http://wwwmakino.shizen.metro-u.ac.jp/database.htm
      2. http://wwwmakino.shizen.metro-u.ac.jp/search.htm
      3. http://mouse.miyazaki-med.ac.jp:591/mouse1/FMPro?-db=mouse_data.fmj&-lay=deta&-format=search.htm&-view
  2. Webサーバの種類
    1. http://www.netcraft.com/Survey/

実際のサーバ

  1. アリデータベースを例に実際のサーバを見てみるUNIX(Apache)とMac(WebStar)
    1. 鵜川管理のサーバたち My-Servers.html
    2. どのサーバを用いるばあいでも必要のないプロセスを殺し、安定運営ができるようにする。これは安全対策にも通じる。もちろんワープロ作業などには使ってはならず、24時間営業。
  2. ログの管理
    1. 生ログを見る。
    2. 蓄積整形後のデータを見る http://www.edb.miyakyo-u.ac.jp/stats/Ant.html
    3. どのサイトからリンクが作成されているか
      1. http://www.edb.miyakyo-u.ac.jp/ugawa/Xref/Ant-Xref.html
      2. http://bank.dna.affrc.go.jp/~qxugawa/disc-home/public_html/Ant-Xref.html

構築、維持管理の実際

論理的メンテナンス

データベースは、書籍、雑誌と違い、定点(同じ場所)でアクセスが可能。それゆえ、バージョンアップを期待してユーザは集まる。

データベースが創設された後、どのように維持、管理するかは、創設と同様に重要なこと。これは、データを入力する部分についても同様に言える。すべてのデータは、私自身が作成するのはないので、データ提供者が構築しやすい環境を整えなければいずれは荒廃する。

データ提供者にとって簡単に更新できるシステム設計が必要。

データ入力は、MS Wordと、ファイルメーカを使い、だれでも更新できるものとした。また、中間ファイルはタブ区切りのデータを用い、万が一、システム作成担当者が交代したばあいでも、他の方法でデータを利用できるようにした。

データベースの作成と更新

  1. Flow.html
  2. Mirror4Collab.html

サーバの設置時のセキュリティに関する注意

セキュリティ(安全対策)を考え、Firewallやパケットフィルタの導入をする組織が増えてきている。データベースのサーバは、人に見てもらうために、外部の脅威に直接さらされている。そのため、特に注意が必要。また、Unixを使う場合は、特に、加害者にならないように注意する。利用者が多く、攻撃されやすいシステムを使っている場合もより一層の注意が必要。セキュリティホールに関する情報をいち早く入手し、問題点に対してのパッチ(不具合を修正するプログラム)を当てること。

アーカイブの重要性

学術系を中心に発展してきたインターネット。民間の利用が主になったとはいえ、研究情報は、依然として大きな割合を占めている。研究に必要なデータベースがインターネットに公開された何年かの後、管理者不在でアクセスできなくなることは日常的に起きている。特に、データベースは容量が大きく研究論文と違って図書館にも収録されない。公的機関で、永続的にデータベースを提供できる場所を確保すべき。
  1. http://www.sfc.wide.ad.jp/~keiko/sciam/kahle.html
  2. http://www.ne.jp/asahi/coffee/house/ARG/036.html
  3. http://www.affrc.go.jp/Cinfo/news/ric/55/55-3.html
  4. http://www.jdaa.gr.jp/topmenu.htm

著作権

アリデータベースの更新を停滞させた事件。データベースは使ってもらってはじめてその価値が出てくる。積極的に使ってもらうためには、目をつむる部分も必要か?
  1. http://www.curri.miyakyo-u.ac.jp/curri-ex/pub/J-S/sub/A3.html
  2. http://www.aozora.gr.jp/cards/another.html
--鵜川義弘 http://edb.miyakyo-u.ac.jp/ugawa/