辻慶太のホームページ |
情報分析
第5回
今日のレジュメ
Koremade_no_keiko.txt
Nyusha_kibosha.txt
LC_gate_counts.csv
LC_references.csv
fruits.txt
shohin.csv
groceries.csv
第4回
tmp
練習用Excelファイル
libraries1.txt
libraries2.txt
スニペットの作られ方
MeCab (形態素解析ソフトとしては今はこちらの方が一般的)
茶筌
keita.txt
shokuhin.csv
BIBLIS_1989_2004_200papers_+2authors.dat (共著の隣接行列)
上記行列の元データ:特に使わない
上記を隣接行列に変えるRubyプログラム(こちらも特に使わない)
records.dat (貸出履歴例)
第3回
だれでも簡単に使えるテキストマイニングツール
・ 夏目漱石の「坊っちゃん」を無料テキストマイニングしてみた
専門用語(キーワード)自動抽出システム
テキスト比較ツール difff《デュフフ》
・ 小保方博士号論文
・ 小保方博士号論文の冒頭の一部
・ 盗用されたNIHのホームページ
KH Coder
・ NDL「日本の図書館におけるレファレンスサービスの課題と展望」
・ 上記の自由回答「10年前と比べてレファレンス質問の内容にどのような変化がありますか」
・ 対応分析とは
第2回
hoko.csv
shogakukin.csv
kenshu.csv