古橋 cedec awards 2012 fluentdで受賞 self-introduction treasure data hadoop, big data logを入れる仕組みを誰も作っていなかった -> fluentd video 概要 logをjson形式で集めて蓄積する 次のバージョンどうするか アンケート ログ解析に何を使っているか 7割の方がfluentd 保存先? mongdb 46%くらい RDBMS 40%強 導入障壁 検討中 ドキュメントが不足 英語のDocが足りない、と思っている人は? -> 12人ぐらい 日本語のDoc欲しい人は? -> 4人ぐらい(ほとんど居ない) プラグインなど機能が少ない 実績が… なぜロギングするのか error notify new reric performance monitor 資源の仕様傾向をみて、あらかじめサーバを増強など user segment analysis ユーザの使用傾向 funnnel analysis TOPページに来た人 -> サインアップしてくれた人はそのうち何%? heatmap 時刻と曜日の二軸グラフ化 なぜロギングにfluentdを? alerting / analysis / archiving で様々な使い方をする log sourceも様々な物がある log sourceと蓄積先・alalysisをどうつなげるか bash script? perl? 悪魔的なスクリプトは… メンテナンスできる人がいなくなると困る スクリプト書く人と、フロントエンドを書く人が別 期待するログのフォーマットが違う logrotate 最大24h待たされる fluentd をhubに使えば上記の問題は解決する! Input / Output / buffering それぞれpluginになっている input pluginですべてjsonにする output pluginはjsonに対応すればよい logの必須3要素 時刻 タグ jsonレコード fluentdの特徴 拡張可能な plugin 形式 json という統一フォーマット インストールが楽 plugins一覧 DL人気順に並んでいる 既存システムとの比較 scribe 拡張可能ではない 統一フォーマット無い .... 誰がfluentdを使っているのか slide share viki context logic nhn japan cookpad quora.com にどのように使われているのか、実績が書かれている fluentdの次バージョンについて filter pluginの導入 に filterを書けるようにする予定 filter pluginによるpipelineが可能になる予定