-
入力メソッドワークショップで発表しました〜「Social IMEの共有辞書... d:id:nokuno
入力メソッドワークショップ(別名IM飲み会)で「Social IMEの共有辞書をクリーニングしてみた」というタイトルで発表しました. WorkshopOnInputMethods2011 - chaime - ChaIME -- Term-based Yet Another Japanese ... 続きを読む
-
CRFがよくわからなくてお腹が痛くなってしまう人のための30分でわか... d:id:echizen_tm
計算機科学機械学習の3大有名手法といえばSVM、CRF、LDAではないだろうか(と勝手に思っている)。SVM(Support Vector Machine)については以前記事を書いたので今回はCRF(Conditional Random Fields)について書いてみたい。機械学習超入門IV ... 続きを読む
-
データマイニングで使われるトップ10アルゴリズム - iAnalysis 〜お... d:id:isseing333
2008年のデータマイニング学会、IEEE ICDMで選ばれたデータマイニングで使われるトップ10アルゴリズムに沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので... 続きを読む
-
オンライン凸最適化と線形識別モデル学習の最前線 : Preferred Resea... research.preferred.jp
岡野原です。 今日まで奈良女子大で行われていたIBIS2011で表題についての講演をしてきました。 Ibis2011 okanohara View more presentations from PFI Marketing 内容は線形識別モデルの学習について(Perceptron, PA, C... 続きを読む
-
データ分類とか学習器について、ぬるプログラマーによるぬるプログラ... d:id:oxalis-gps
SVMという、使い方によってはすごいモノがあります(唐突) 誤解を恐れず、パッと簡単に説明すると ラベル付けをしたデータを教師データとして、学習器に与えると、学習モデルを吐いてくれて、評価器にデータを与えると、学習モデルを使って inputはaなのかbなのか?(二値分類) という回答を返してく... 続きを読む
-
自然言語処理の教科書はもう全部FSNLP一冊でいいんじゃないかな - Ec... d:id:echizen_tm
書籍自然言語処理の優秀なエンジニア各位にオススメ本を聞くと大抵FSNLP(Foundations of Statistical Natiral Language Processing)という答えが返ってくる。またブログ等でFSNLPを絶賛している方も多い。私は自然言語処理は長尾本で満足してしま... 続きを読む
-
averaged stochastic gradient descentのご紹介 : Preferred Researc... research.preferred.jp
そろそろ寒くなってきましたね。早速風邪を引きました。徳永です。 今日は私の使っている自作の足置き(制作費600円)の紹介でお茶を濁そうと思っていたのですが、途中で方向転換しました。今日は機械学習の話をします。 Léon Bottouという研究者(彼はまたDjVuというドキュメントフォーマットの... 続きを読む
-
LibSVMのcross validationオプションでprecision/recallを出力する -... d:id:sleepy_yoshi
SVMの定番ツールのひとつであるlibsvmにはcross validationオプション(-v) があり,ユーザが指定したFoldのcross validationを実行してくれる.実行例 % ./svm-train -v 2 heart_scale * optimization finis... 続きを読む
-
「文字列カーネルSVMによる辞書なしツイート分類」を発表してきまし... d:id:a_bicky
NLP第7回自然言語処理勉強会で「文字列カーネルSVMによる辞書なしツイート分類 〜文字列カーネル入門〜」を発表してきました。文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜 View more presentations from abicky※資料は発表後だいぶ変更しました... 続きを読む
-
文字列カーネルによる辞書なしツイート分類 〜文字列カーネル入門〜 www.slideshare.net
Loading… Flash Player 9 (or above) is needed to view presentations. We have detected that you do not have it on your computer. To install it, go he... 続きを読む
-
線形識別器でカーネルトリックを使う方法 : Preferred Research research.preferred.jp
WEB+DB PRESS Vol.64に「作って学ぶ日本語入力」という特集記事を書かせていただきました。徳永です。全国の書店で発売中ですので、ぜひみなさんお買い求めください。(宣伝) さて今回は、線形識別器でカーネルを使うのと同じ効果を得るための手法を紹介したいと思います。 カーネルとは SV... 続きを読む
-
ビボウロク: PythonでLIBSVMを使う hy-adversaria.blogspot.com
2011年4月2日土曜日 PythonでLIBSVMを使う 導入方法 1.ここからLIBSVMのzipファイルもしくはtar.gzファイルをダウンロードし適当なディレクトリに解凍。(最新版3.1) 2.解凍したフォルダに移動し、makeコマンド実行。以下のファイルができるはず。 svm.o s... 続きを読む
-
cabocha - Japanese dependency parser - Google Project Hosting code.google.com
CaboCha is a Japanese dependency/syntactic parser based on machine learning. 続きを読む
-
Infinite SVM - ICML 読み会 - Mi manca qualche giovedi`? d:id:n_shuyo
ICML, SVM, ノンパラベイズ, 機械学習7/16 に行われた、id:nokuno さん主催の ICML 2011 論文読み会にのこのこ行ってきました。参加者&会場提供してくださった PFI の @unnonouno さん、ありがとうございます。 ICML2011読み会を開催しました #... 続きを読む
-
機械学習超入門IV 〜SVM(サポートベクターマシン)だって30分で作れち... d:id:echizen_tm
計算機科学ニーズがあるのかさっぱりわからない機械学習超入門だけどひっそり続けていきたい。前回は識別関数の基礎であるパーセプトロンの簡単な説明とPerlによる実装を解説した。実はこの時点でかの有名なSVM(Support Vector Machine、サポートベクターマシン)もほぼ完成していたの... 続きを読む
-
[チュートリアル講演] カーネルマシン staff.aist.go.jp
次へ: はじめに [チュートリアル講演] カーネルマシン 赤穂 昭太郎1 Shotaro Akaho s.akaho@aist.go.jp 概要: サポートベクタマシン (SVM) に代表されるカーネルを用いた学習機械について解説する. これらにほぼ共通しているのは,基本的に線形の学習機械の延... 続きを読む
-
交差検定の k の値はどれくらいにすればいいのか - ほくそ笑む d:id:hoxo_m
機械学習, R分類器(識別器)のモデルを評価する手法に交差検定(クロスバリデーション)があります。交差検定を行うには、データをいくつに分割するかを表す k の値を決めてあげなければなりません。SVM のチューニングのしかた(1) において、交差検定の k の値を決めるとき、僕は個人的にk = ... 続きを読む
-
日本語の単語分割 - 自然言語処理 on Mac d:id:hjym_u
nlp日本語の単語分割処理は、一般に、単語辞書と単語間連接の規則や学習データに基づいて行われます。オープンソースとして有名なものがいくつもあります。 KAKASI - 漢字→かな(ローマ字)変換プログラム 日本語形態素解析システムJUMAN - KUROHASHI-KAWAHARA LAB c... 続きを読む
-
SVMの定番入門書「サポートベクターマシン入門(赤本)」の読み方 - Ec... d:id:echizen_tm
- コンピュータ・IT
- svm 機械学習 machine learning machinelearning ml
- 58 users
- 2011/06/09
計算機科学SVMを学びたい人にとっては「サポートベクターマシン入門」通称「赤本」は最適な入門書であるといえる。理論から実践までバランスよく解説されており、本書を読むだけでSVMの実装が可能になる。しかし本書はSF小説を彷彿とさせる独特な翻訳の文体のため機械学習に不慣れな読者にとっては読みこなす... 続きを読む
-
機械学習超入門III 〜機械学習の基礎、パーセプトロンを30分で作って... d:id:echizen_tm
- コンピュータ・IT
- 機械学習 ml machine learning SVM perceptron
- 37 users
- 2011/06/07
計算機科学機械学習には大きく分けて「識別関数」「識別モデル」「生成モデル」の3つの種類がある。このなかで識別関数は確率を使わないので初心者が入門するのに最適。識別関数で有名なのはSVM(Support Vector Machine、サポートベクターマシン)。名前を聞いたことがある人も多いと思う... 続きを読む
-
森北出版|パターン認識のためのサポートベクトルマシン入門 www.morikita.co.jp
サポートベクトルマシン(サポートベクターマシン)は,その認識能力の高さと応用性から,優れたパターン認識の手法として注目されています.本書は,その基礎をわかりやすく説明するとともに,多クラス問題への拡張方法や,各種のモデルごとの違いなど,実用上重要な項目についての解説が充実しています.入門書とし... 続きを読む
-
SVMの正則化項がマージン最大化のために必要な理由 - 射撃しつつ前転 d:id:tkng
ラージマージンとマージン最大化について2回ほど書いてきた。 あの後もSVMとマージンパーセプトロンについてうだうだと考えていたのだが、もうちょっとシンプルな説明を思いついた。 SVMの特徴はヒンジロスを採用している点と、正則化項があるところである。 ヒンジロスはもう何度も出てきているが、max... 続きを読む
-
[O] echizen_tm さんが機械学習の勉強のはじめ方について解説してい... diary.overlasting.net
echizen_tm さんが機械学習の勉強のはじめ方について解説していた Tweet [日記] 宝の地図を探す冒険者が集う酒場でお茶を飲んでいたら、こんな会話が聞こえてきた。 アルティメット ヒッツ ドラゴンクエストV 天空の花嫁 [Amazonで詳細を見る] ガヤガヤ どこから来たんだ? 疲... 続きを読む
-
LIBLINEARを用いた機械学習入門(単語分割) - nokunoの日記 d:id:nokuno
これはよいチュートリアル、ということでやってみました。 LIBLINEARを用いた機械学習入門(単語分割) 注意点として文字コードがUTF-8の場合、以下のように指定する必要があります。 #!/usr/bin/env ruby -Ku 後は手順通りに、コーパスをダウンロードしてスクリプトを実行... 続きを読む