Niigata.pm tech talk #2 がありました
teck talk #2 が開催されてから一週間が経ちました。
タイミング外してるとは言え、(発表しなかったとは言え&懇親会見送りとは言え)そのレポートです。
(内容に誤解があることがありますので、ツッコミよろしくお願いします)
概要はこちらから Niigata.pm tech talk #2 : ATND
今回のテーマは「データ処理」
データベース運用の話とかDB関係のモジュールの話が多いのかなと思っていましたが、全くなかったところが Niigata.pm なんでしょうか? しかし皆さんアルゴリズムの話がきちんとできるあたり日々勉強してるんだなと。
あと、neko_gata_s さんが単純ベイズ分類器をトークテーマに選んだ理由を話してるんですけど、すげーなとか。
Talk
LT
- about Data::Peticom @hayajo
- ワンライナーでデータ処理 @john_7701
トークに関するメモ
Enjoy! テキスト解析 30min @__papix__
はじめての文書検索と分類 40min Takashi Yukawa (長岡技術科学大学 知識システム研究室)
類似文書検索
文書分類
事例(学生さん 3名の発表)
- Twitterのツイート本分からの位置情報抽出
- 大規模災害時に負傷者に関するツイートから位置情報をマップ等に表示したい
- ツイートに地名を含むものから地名を「都道府県」「市町村」... など4つに分類(抽出) => 緯度、経度に直す
- 省略される地名(ex 「大字」とか「〇〇郡」とか)で時間がかかる
- 怒りを含むメッセージかを判別
- 問い合わせメールに怒りを含んでいるものがあればそれを先に対応とか
- 価格.comのレビューで「怒っているアイコン」「怒っていないアイコン」のついたレビューを学習データに用いる
- 問い合わせメールを分類器にかける
- Wikipediaから概念ベース作成
今回 ust配信されてました @aokcub++
Niigata.pm のステッカーもらいました