学術コンテンツサービスのフロンティア -CiNii Booksの挑戦-

学術コンテンツサービスのフロンティア -CiNii Booksの挑戦-

(以下敬称略)

日時:2011年11月10日 13:00-14:30
場所:図書館総合展第2会場
主催:国立情報学研究所
講師:大向一輝(学術コンテンツサービス研究開発センター准教授)、学術基盤推進部 他
  

記録

開会挨拶 (武田学術コンテンツサービスセンター長)

  • 参加人数が定員を超えていて、うれしく思っている
  • NIIのサービスはオープンとコネクトをキーワードにしている
    • 様々なサービスがネット上にあふれている
    • 皆さんがNIIのサービスだけを使う訳じゃない
    • 皆さんに如何にNIIのサービスを使ってもらうかという時に、オープン、コネクトが大事だと思っている
  • 今日はCiNiiBooksとCiNii全文検索の話をメインにする
    • そういった中で学術情報の新しい流れを見て頂ければ
        

Part1 昨日までのCiNii(阿蘓品)

  

NIIの論文検索ツール史

  • NACSIS-IR、NACSIS-ELS、目次速報DBなどが統合して、05年からCiNiiになった
    • かれこれ四半世紀近く日本にはオンライン検索の歴史がある
  • NIIのサービスの利用状況を比較するとCiNiiが突出している
  • CiNiiに限ってみると、メインユーザーである大学生の生活行動を反映して波がある
  • Googleとの連携やUIのリニューアルなどで利用回数が伸びてきた
       

CiNiiとは

  • 国内最大の論文情報サービス
  • 1500万本の論文データを保有
    • うち、370万本程度の本文データを保有
  • 利用登録者数も大きく伸びている
  • 本文収録状況順調に伸びを続けている
  • システムは平成21年に大幅なリニューアルを行った
  • 翌年には著者名検索とフィードバック機能の実装
    • 毎日10件から100件くらいの指摘が寄せられる
  • 今年の8月には論文登録数が1500万件を突破した
  • 収録データを拡大した事によって本文到達率も上昇中
       

CiNiiのユーザー層

  • 大学関係者が6割
  • 利用頻度としては月に数回程度が6割
  • 大学で存在を教えられる事が多い
  • あってうれしいのは本文、無くて困るのも本文
  • 欲しい機能としては圧倒的に本文検索
       

Part2 きょうからのCiNii(大向)

   

はじめに

  • 東日本大震災に伴いNIIのサービスの稼働状況が不安定になった事をお詫びしたい
  • 今後のシステム構築の上で重要な課題の一つだと考えている
       

自己紹介

  • 国立情報学研究所
    • コンテンツ科学研究系(教員)
    • 学術コンテンツサービス研究開発センター
    • 学術基盤推進部学術コンテンツ課システム室(職員)
    • CiNiiやNACSIS-CATの開発に携わっている
         

きょうからのCiNii

  • 2011年11月9日リリース
  • サービス再編
    • CiNii Articles 日本の論文を探す
    • CiNii Books 大学図書館の本をさがす
  • 新機能
    • CiNii Articles全文検索
  • ユーザーインターフェース改善
      

サービス再編の方向性

  • データ構築とサービスの分離
    • モジュール化による開発効率の向上・通年開発体制
  • 統一されたユーザーインターフェースの提供
    • 多様なユーザーへの対応
         

サービス再編

  • CiNii Articles
    • きのうまでのCiNiiにあたるもの
    • 新機能として全文検索機能を実装した
  • CiNii Books
    • 全国の大学図書館蔵書の検索サービス
    • それに対応してWebcatは2013年に終了予定
          

CiNii Articles全文検索について

  • 400万論文の全文を対象とした検索機能
    • NII-ELS(電子図書館サービス)由来の論文
    • OCRによるテキスト化の後、検索エンジンに投入
    • スキャンに3,4か月かかった
  • 3番目のタブから検索・ウェブAPIの提供
  • 検索空間の拡大
    • 書誌に含まれない情報にヒットするようになった
    • 具体的には本文・キャプション・参考文献・謝辞など
  • 今までとは異なる新しい発見ができると思う
       

CiNii Articles全文検索の課題

  • 検索結果の品質
  • テキスト化の品質
    • スキャン→OCRの限界
    • 手書き論文の存在
  • スニペットが出せない
  • 何によってランキングするべきか?
  • 処理速度
    • 小規模なシステム
    • APIを通じた連続的・大量アクセスは非推奨
  • 書誌検索との統合
    • タブの統合
  • ランキングアルゴリズムの検討
       

CiNii Booksについて

大学図書館の本を探す
NACSIS-CAT書誌所蔵データの検索・表示サービス
APIの提供
  

CiNii Booksの設計方針

  • NACSIS-CATシステムとの分離
    • モジュール化・軽量化
    • クラウド対応化→業務継続計画への対応
  • CiNiiと同等のユーザーインターフェース
    • 多様なユーザーの想定
  • CATデータの徹底活用
    • 業務系システムでのみ利用可能だった検索項目を導入
  • 著者名典拠
    • 図書館との連携
         

基本的な書誌項目

  • 地域や任意の図書館で絞り込み可能
  • 所蔵一覧の高機能化
    • 絞り込み、各館OPACへの直接リンク
  • CiNii Articlesへのリンク
  • 著者名典拠
    • 著者URIとしての公開
    • 書誌検索との統合
         

CiNii Booksのロードマップ

  • とりあえず機能を出した
    • だが、これでもう開発しないかというとそんな事は無い
  • CiNii認証の導入
    • アクセス元によって各種情報を出しわける
    • 所蔵一覧の並べ替え、
    • 各種電子ソースへのリンク
  • Articles&Books
    • ArticleとBooksの将来的な統合を想定
        

まとめ

  • 進化するプラットフォームとしてのCiNii
  • 大学図書館の環境は変わる・変えられる
    • だからこそフィードバックの重要性を認識している
  • 学術情報サービスをウェブらしく
    • CiNiiが提供するコンテンツは唯一無二、評価されないはずはない
    • ただし、ウェブの常識と乖離すると評価の対象から外れる
    • コンピュータから、あるいはユーザから
  • ウェブらしさを形容するものとは?
    • デザイン・インターフェース、URI、メタデータ
  • 常に変化、より高度に
    • 変化にいつでも対応できることがウェブらしさの本質
         

Linked Open Dateのご紹介(加藤)

  

Linked Open Date(LOD)とは?

  • 例えば、夏目漱石をネットで調べて紹介するときにどう紹介する?
    • 今時はwikipediaを使うのかもしれないが、一次情報がしっかりしていないといけない
  • 例えば著作に関しては書誌データがある
  • 一方バイオグラフィーはまた別の話がある
    • 正岡子規と友達だったとか松山在住だったとか
  • さらに坊ちゃんと松山が関係があるというのは学術的な話
    • しかし松山はそれを観光情報としてまとめて公開している
    • これはこれで書誌とは違う話
  • そういう様々なデータを色んな人がまとめて解釈して、紹介する
  • こうした時に、こういう関係したデータを最初から関係させておくことはできないか?
  • それがLOD
  • 一次ソースを公開している人達が自分たちが公開しているデータと関係するデータを頑張って繋げようとしている
    • 国立国会図書館ではWeb NDL Authorities
    • これの裏にLODが存在する
         

LODチャレンジについて

  • CiNiiのAPIを使ってプログラムをしているという事は、LODを使ってプログラミングをしているという事
  • 今年はCiNiiAPIコンテストはしないのだが、LODを使ってコンテストをしたいと思っている
    • それがLODチャレンジ
    • 詳しくは配布資料を参照して欲しい
  • LODの運動の中では、一次情報を作成している人がそれを公開するのが一番重要
    • 一次情報作成者で公開しても良い、LODにのりたいという人はデータセット部門に応募してほしい
  • 11月-12月にLODチャレンジで―というイベントが開催される
    • 興味がある人は是非参加して欲しい
         

質疑

Q:NDLの雑誌索引がCiNiiに流れているが、厳密にはいつの時点でCiNiiに流れているのかを知りたい
学生は今CiNiiにしか見ていない、学生にレファレンス教育をする時に厳密に知りたい

A:アップデートのタイミングでいうとNDL-OPACと変わらない。OPACとアルゴリズムが違うので、検索結果がずれる可能性はある。致命的なものを発見した時には是非指摘を頂きたい。

Q:Web APIのコンテストを今回はやらないという事だが、今までのコンテストでCiNiiのAPIがどう使われてきたかという知見を開発に生かしたり、外で発表したりというようなアイディアはあるか

A:おっしゃる通りで、何故 APIを公開しているかというと、われわれは基本的なサービスを提供しなければならない。でもそのデータが持っている価値はそれだけではない。書誌のデータでしかなくても適切に編集されれば人を探すツール、機関を探すツールになりえる。そういう意味ではコンテストには大きなフィードバックを頂いたと思っているし、今後の開発にも生かしていかなければならないと考えている

Q:今後ArticleとBooksが統合するという話をしていたが、今後統合した時に、雑誌単位である程度紐づけた検索を想定しているのか、それとも全文でどこかしらヒットすれば良いというような検索方式にするのか

A:どっちも、という事になる。きちんと巻号が入力されている分に関しては、きちんと紐づけるというような事には非常に興味があるが、一方で全文検索も全く別のニーズとして必要だと考えている

Q:利用者一般のレベルからすると、CiNii BooksとWebcat Plusが一緒になっていくことが望ましいと思うが、その見通しはどうか

A:われわれとしては、必要とする情報によって必要とされるシステムはかなり変わってくると思っている。Webcat Plusは新しい本を探していくためのサービスだがCiNii Booksは大学図書館の本を探すもの。両者の統合に関してはまだロードマップがあるような状態ではない。今後のニーズの掘り下げなどをとして考えていきたいと思っている

フォーラムを見た感想

まだ新しくなったCiNiiを使った事が無いのですが、説明をうかがっている限り非常に魅力的に感じました。今までのCiNiiよりもさらにストレスなく目的とする資料に辿り着く事が出来るようになっていると感じました。どのように利用出来るのか楽しみです。
また、これでCiNii Booksも今後も開発が続いていくとの事なので、CiNiiが進化していくなかでどのように変わっていくのか楽しみにしたいと思います。
    
    
(執筆:松野渉)