『睡眠不足?!』 の新着エントリー
-
文字列探索スターターキット - 睡眠不足?! d:id:sleepy_yoshi
最近重点的に勉強しているので,これまで集めた教科書情報,資料等へのリンクをまとめてみる.紹介している教科書はほとんど読んでいないので妄言注意.この他にお薦め教科書,勉強法があればぜひ教えてください. 文字列探索は検索対象テキストの中から転置インデクスのような外部データ構造を利用せずに目的の文字... 続きを読む
-
IR研究者をスコアリングしてみた - 睡眠不足?! d:id:sleepy_yoshi
前回の記事に対するブックマーク,コメントありがとうございます.最初の四天王は考えてみれば,アルゴリズムと検索アーキテクチャにかなり寄っていました.情報検索の中でも「全文検索システム」という観点で見ていたからです.IRと一言でいっても(人工知能ほど大きな分野ではないかもしれませんが)自然言語処理... 続きを読む
-
情報検索ことはじめ〜研究者編〜 - 睡眠不足?! d:id:sleepy_yoshi
昨年書いた教科書編が(僕にとっては)嬉しくて跳ね上がるほどブックマークされたので,調子に乗って第二弾を書いてみました.皆様ありがとうございます(ブックマークにがんばってくださいというコメントがあったのがめちゃくちゃ嬉しかったです).今回は研究寄りですが,少しでも誰かの役に立てば幸いです. 僕は... 続きを読む
-
情報検索ことはじめ〜教科書編〜 - 睡眠不足?! d:id:sleepy_yoshi
情報検索(IR)の勉強を本格的に始めて8ヶ月.大体どんな分野があって,どんなことを勉強すればいいのかわかってきた(と思う).この気持ちを忘れないうちにメモしておこう.以下,若輩があーだこーだ言ってるだけなので,間違いや他に情報があれば,ぜひコメントをお願いします.# ここで述べている情報検索と... 続きを読む
-
18 Matrix decomposition and latent semantic indexing (pp.369-384... d:id:sleepy_yoshi
ちょっと飛ばして,先にIIR18章を読んでみた.単語文書行列を特異値分解して新しい空間でベクトル空間モデルを使うというLSIの話.ページ数が少なかったので,魔が差して翻訳もしてみた.さらに数式が多いのでTeXで書いてみた.ここまで来たらこだわろうとAB型の悪い癖が出て,数式や演習も全部訳してみ... 続きを読む
-
転置インデックスで学ぶ検索エンジンの中身アプリ - 睡眠不足?! d:id:sleepy_yoshi
学生の頃から情報検索っぽい研究をやっていたくせに,転置インデックスてこんなものなんだ,ということを知るまで検索エンジンが正直怖かった.転置インデックスの概要を理解したら急に甘く見はじめるようになった(それはそれでいかんのだけど).位置情報を持たせたり,転置インデックスの圧縮をした状態で説明され... 続きを読む
-
ナイーブベイズによるテキスト分類アプリで日本語を扱えるようにしま... d:id:sleepy_yoshi
たくさんの方にブックマークして頂いて,感謝感激でした.感謝の意味をこめて少しだけ改良しました.といっても自分の力ではないですが... 昨日の日記でも紹介したTinySegmenterによって日本語の文も扱えるようにしましたNaive Bayes Text Classifer ver.2 日本語... 続きを読む
-
ナイーブベイズによるテキスト分類体験アプリ - 睡眠不足?! d:id:sleepy_yoshi
もともとは研究室の新入生にNaive Bayesのイメージをつけるためにつくったもの.Naive Bayesを世の中に広めるために,きちんと公開することにしました.Text classification by Naive Bayes (2008-09-11追記)好評だったので日本語を扱えるよう... 続きを読む