シラバス参照

公式版のシラバスを表示  
最終更新日:2020/09/11  
筑波大学 教育課程編成支援システム

GB31701 情報検索概論

2.0 単位, 3・4 年次, 秋AB 木1,2
北川 博之, 天笠 俊之

授業概要

情報検索に関する入門.情報検索の基本概念,ブール検索モデル,索引語の抽出と重み付け,ベクトル空間モデル,索引手法,情報検索システムの評価,クラスタリング,マルチメディア情報検索,XML,WWW検索に関して講述する.

備考

オンライン(オンデマンド型)

授業形態

講義

学位プログラム・コンピテンスとの関係

・汎用コンピテンス
2. 批判的・創造的思考力
4. 広い視野と国際性
・専門コンピテンス
3. 情報システム分野の専門能力
6. 実践的技術力と問題解決能力
7. 情報専門技術者としての倫理

授業の到達目標(学修成果)

情報検索に関わる基礎的事項(基本概念,ブール検索モデル,索引語,ベクトル空間モデル,索引手法,情報検索システムの評価,クラスタリング,マルチメディア情報検索,XML,Web検索)を理解し,それらに関する説明や議論ができる.

キーワード

情報検索, 文書検索, マルチメディア検索, 構造化文書, WWW

授業計画

講義ビデオを用いて以下の項目について順次解説する.毎回,講義内容に関するクイズをレポート課題として課す.

第1回情報検索の基本概念とブール検索モデル:
基本用語,情報検索の特徴,情報検索の分類,応用と関連分野,ブール検索モデル,転置ファイルによる実装,ファジイ検索モデル
  
第2回索引語の抽出と重み付け:
索引語・不要語,語幹抽出,日本語における索引語抽出,索引語の重み付け
  
第3回ベクトル空間モデル:
ベクトル空間モデルとは,文書の類似度,適合性フィードバック,主成分分析,潜在的意味インデクシング(LSI)
  
第4回情報検索のための索引手法:
転置ファイルによるベクトル空間モデルの実装,転置ファイルの構築,文字列索引(接尾辞配列),シグネチャファイル
  
第5回情報検索システムの評価:
有効性の指標,再現率と適合率,再現率・適合率曲線,平均適合率,F尺度,E尺度
  
第6回文書のクラスタリング:
クラスタリングとは,階層的クラスタリング,単一パス法,k-means法
  
第7回マルチメディア情報検索:
マルチメディア検索の基本概念,特徴ベクトルと類似度,画像データ検索,時系列データ検索,空間索引,空間充填曲線
  
第8回XML(1):
構造化文書,XML文書,属性,整形式と妥当なXML文書
  
第9回XML(2):
文書型宣言,実体,名前空間,XPath
Web検索(1):
主なWeb検索機構,Web検索の仕組みと特徴
  
第10回Web検索(2):
クローラ,ハイパーリンクに利用,PageRank,HITS
  

履修条件

線形代数の初歩的知識があることが望ましい.また,理解を深めるためにはデータベース概論Iを履修していることが望ましい.

成績評価方法

毎回のレポート,学期末試験により評価を行う予定であるが,従来形式の学期末試験実施が難しい場合は,レポートのみで総合評価する.

学修時間の割り当て及び授業外における学修方法

毎回manabaに掲載する授業コンテンツ(講義ビデオ,説明用スライド,クイズ)を視聴し,クイズの解答をレポートにまとめ期日までに提出すること.レポートは採点結果をフィードバックすると共に,解答をmanabaに掲載するので,理解度が不十分だったところを確認し復習すること.

教材・参考文献・配付資料等

講義スライドを用いる.一部のトピックにについては以下が参考になる.

1. 徳永健伸,「情報検索と言語処理」(東京大学出版会)
2. 北研二,津田和彦,獅々堀正幹,「情報検索アルゴリズム」(共立出版)

オフィスアワー等(連絡先含む)

北川博之: 随時メール等にて質問や相談に対応します.

北川 博之 1000852 http://www.kde.cs.tsukuba.ac.jp/~kitagawa/
天笠 俊之 1002320 http://www.kde.cs.tsukuba.ac.jp/~amagasa/

その他(受講生にのぞむことや受講上の注意点等)

他の授業科目との関連

ティーチングフェロー(TF)・ティーチングアシスタント(TA)

TA1名を配置