教育におけるデータベース利用の意義

  1. 教育におけるデータベース利用の意義
    1. 情報の共有の素晴らしさを伝えてもらうこと。「利用の意義」としたのは消極的
    2. データベース作成と提供の意義
      1. ご自身がお持ちの知識とデータを秘蔵のデータとしてはもったいない。弟子とお墓
      2. 多くの情報がデジタル化しやすくなりデータベース化にはもってこい。
      3. ここに参加されている方々にも是非データベースのクリエータになっていただきたい。なぜ?
    3. 教育関係者がデータベースに携わることの意義
      1. 専門的な情報、膨大な情報を、児童生徒に噛み砕き、まとめて伝える重要な役割
    4. データベースはアイデア。インターネットで検索で見つからないものを作成する。
  2. 内容
    1. 関与してきたデータベースの紹介
    2. インターネットでのデータベース検索
  3. 自己紹介 http://edb.miyakyo-u.ac.jp/ugawa/Ugawa.html
    1. ヒトゲノムから環境地図まで。これまでのデータベースの開発
      http://edb.miyakyo-u.ac.jp/ugawa/20011028/JACS16ugawa.html
  4. データベースとは
    1. 様々な情報を(整理して?)検索できるよう格納したもの。
    2. また情報を管理・提供するための手法や、計算機システムのことを言う。http://edb.miyakyo-u.ac.jp/ugawa/class/1M818/1M818.html
    3. データベースに協力してハマッテシマッタ人が何人も
      1. 今井先生
      2. 月井さん http://taxa.soken.ac.jp/Asagao/Yoneda/slides/slide080-158a.html
      3. 木原さん http://taxa.soken.ac.jp/MakinoDB/makino/html_j/index0.html
    4. ホタル(例であり、作成者と関係はありません)
      1. 大分発のホタル情報
        http://www.coara.or.jp/~ynakamra/
      2. 東京にそだつホタル
        http://members.jcom.home.ne.jp/hotaru-net/front.htm
  5. アリのデータベース http://ant.edb.miyakyo-u.ac.jp/
    1. たくさんの利用者 http://www.edb.miyakyo-u.ac.jp/stats/Ant.html
    2. 最初は、専門家のデータベースとしてスタートした。それが、公開すると、沢山の質問が来た。説明責任の問題
    3. 子供用のページを作ったらウケた。
      http://ant.edb.miyakyo-u.ac.jp/INTRODUCTION/Gakken79/Page_02.html
    4. アリの王国=2匹目のドジョウ
      http://ugw09.ipc.miyakyo-u.ac.jp/Ant2002/kingdom/0405/0405j.html
      1. 漫画も英語 http://ugw09.ipc.miyakyo-u.ac.jp/Ant2002/kingdom/0405/0405e.html
  6. 失敗例として環境家計簿
    1. 当初 http://eml.edb.miyakyo-u.ac.jp/JOHO/kakeibo/shisan.html
    2. 先生方のコメントにしたがって作成したページ
    3. http://eml.edb.miyakyo-u.ac.jp/JOHO/kakeibo/kids/keisan_t.htm
  7. インターネット検索
    1. 膨大な量のWebページ、写真、動画。調べ学習
    2. 様々なWebページを効率良く検索できるサーチエンジン
      1. 樹木検索はインターネットを使った他力本願
        http://taxa.soken.ac.jp/JUMOKU/index.html
  8. WWWの規模
    1. UC Berkeley How-much-info Projectによる情報量推計、25億ページ、深層5500億ページ(2000年)
      http://www.sims.berkeley.edu/research/projects/how-much-info/internet.html
      http://www.media.k.u-tokyo.ac.jp/how-much-info/internet.html(和訳)
    2. インターネットアーカイブによる図書館の情報量との比較
      http://www.archive.org/xterabytes.html
  9. インターネットで可能な検索には、検索対象の異なる2つがある
    1. データベース系
      個別に作成されたデータベースにWebブラウザで検索できるインターフェイスをつけたもので、特許、蔵書検索、論文検索、遺伝子検索などができるもの(対象がWebページではない)。データベースとは、情報を整理して人が使える状態にしたもの。また情報を管理・提供するための手法、システムを言う。
      1. 図書館蔵書検索 http://webcat.nii.ac.jp/webcat.html
      2. 特許情報の検索 http://www.ipdl.jpo.go.jp/
      3. インターネットタウンページ http://itp.ne.jp/
    2. Webページ系
      増え続ける世界中のWebページからデータを登録、または収集したものを検索対象とする、いわゆるサーチエンジン(参考例は次項で)。
  10. Webページを検索対象とするサーチエンジンには次の3種類がある
    参考:清水 奨氏「日本の Search Engine のリスト」http://www.ingrid.org/w3conf-bof/search.html
    1. ディレクトリ系(人手による良いページ探しをし、それを検索対象とする)
      収集に専門家が必要だが、うまく収集でき、数が増えれば、検索した場合に粒のそろったWebページが出てくる(下のロボット系では、あまり重要でないページ(=ノイズ)が多く出てくることが多い)。
      例:老舗Yahoo http://www.yahoo.co.jp/
      1. 登録数が多くないものは、単なるURL集と呼ばれる。検索用のウインドウもついていない。しかしこれらが無駄というわけでなく、無数のURL集/リンク集がこれから説明するロボットの検索対象となっているのも事実。
    2. ロボット系(ロボットによりリンクをたどり、芋づる式に全データをあつめそれを検索対象とする)
      最新情報は、ロボットによる収集に頼るしかないが、後述の問題が存在する。
      1. 収集量で最大級を誇っていたhttp://www.altavista.com/
      2. 日本の代表的サーチエンジンの1つhttp://www.goo.ne.jp/
      3. 収集したページの参照され方を調べ、被参照数が多いものが上位に出てくるhttp://www.google.com/
      4. ロボットの動きのより詳しい説明 http://edb.miyakyo-u.ac.jp/ugawa/class/docs/robots.html
    3. メタ系(他人のふんどしで相撲をとる、ちゃっかりタイプ(失礼))
      複数のディレクトリ系とロボット系に対して検索要求を出し、その結果をまとめて検索結果として返す。バナー広告の収入でなりたっている商用検索サーバの上前をはねることになり、運用がむずかしいと思われる。
      1. MetaCrawler http://www.go2net.com/search.html
  11. インターネット検索のまとめ
    1. データベース系
      1. 個別データベースに対する検索が可能
    2. Webページ系(いわゆるサーチエンジン)
      1. ディレクトリ系
      2. ロボット系
      3. メタ系
  12. インターネットの情報検索の問題点
    1. 玉石混交のインターネット、得られた情報を信用するかどうかの判断は個人の責任。
    2. 単純なキーワードで検索するとあまりにも大量の結果が出力され、必要なデータがノイズに埋もれてしまう問題。複数のキーワードの組み合わせで検索するなどを工夫する必要がある。
    3. あるはずなのに、Webページが出てこない。すべてのページが収集されているとは限らない。メタ系のサーチエンジンなら出てくる可能性がある。
      1. Webページ取りこぼしの可能性
        http://edb.miyakyo-u.ac.jp/ugawa/class/docs/notcovered.html
  13. 最後に、作成したデータベースは公開すること。
    1. 情報の共有
    2. 秘蔵のデータとしてはもったいない。

--鵜川義弘