2012年9月アーカイブ

昨日に引き続きCassandra Summitのレポートです。


Buy It Now, Cassandra at eBay
eBayにおけるCassandraの使用方法のレポートです。
ソーシャルシグナル(いいねボタンなど)のデータを直接投入しているしているとのことです。
このデータを使用してリアルタイムレコメンデーションを実現しているとのこと。
データモデルの提示もありかなり有効なセッションでした。


End-to-end Analytic Workflows with Cassandra
HadoopファミリーととCassandraを用いたアナリティクスの入門でした。
Cassandra + Oozie の話が興味深かったです。

Hastur: Open-Source Scalable Metrics with Cassandra (Noah Gibbs)
Cassandraを用いたモニタリングシステムの解説でした。
データ設計方法が詳細に語られていますでこれも参考になると思います。

Big Data at Disney

ディズニーにおけるデータ運用方法の全体像の報告です。
ディズニーのもつ全てのデータ、(ムービーやテレビ番組、ディズニーランドの情報など)を一元管理するための仕組みとのことです。「Data as a Sservice」という言葉がこの設計の壮大さを表しているなと。正直、激しく壮大な話なので直接的にこのセッションが参考になる所も少ないとは思いますがデータ活用方法の一つの局地としてみると非常に興味深かったです。

Changing the Game, Cassandra + Solr

普通にDataStaxEnterpriseにおけるSolrの使用方法でした。
(正直、Cassandraあまり関係ないやんというツッコミがなくも無いですが)
最近、業務絡みでDataStaxEnterpriseを調査しているのですがAll in one パッケージとして非常に優れていますのでとても有効なプロダクションであると思っています。


Technical Deep Dive: Data Modeling
かなり濃ゆいCassandraにおけるデータ設計方法の解説でした。
非常に役に立ちますのでCassandraを使用してみようとしている方はスライド及びビデオ必見です。自分も改めてもう一度見直す予定です。

セッション全体を通して実用例、モデリング方法、運用方法など色々な情報が詰め込まれており非常に楽しく且つ役に立つセッションが多かった印象です。ビデオも公開されているので、聞き逃したセッションもみておこうかなと考えています。

Summit終了後のAfter-party at Computer History Museumの様子はまた、明日書きます。

ほぼ一ヶ月たってしまいましたが先月参加したCassandraSummitの報告をしたいと思います。

因みに自分の英語はズタボロなので内容の正確性は保証できかねますのでそのあたりは差っ引いてください。

因みにCassandraSummit2012の様子はここから一部見ることが可能です。Cassandra Summit 2012 Presentations

参加して一番感じたのはアメリカでのCassandraの勢いです。

有料のカンファレンスに登録800名との事。大きなホテルのカンファレンスフロア全てを借りきって4トラックのセッションを一日埋める。すごいですね。

全体的な印象としては前日のプレカンファレンスに参加しても感じたのですがCassandraをアナリティクスに用いている場合が多いかなと。DataStaxEnterpriseを用いるだけでなく独自でもトラッキング情報をCassandraに放り込んで後で解析するなどです。また、DataStaxEnterpriseとCassandraの話がシームレスに交じるのでDataStaxEnterpriseをある程度知ってないと混乱するかもと思いました。
(SolrandraはCassandraの機能ではありません。)

アナリティクスは自分もそちらのほうが親和性高いかなとも感じますのでCassandra自身そちらの方に進むかもしれないなと感じています。

さて、自分が参加した参加したセッションに関してコメントしていきたいと思います。


KeyNote
オープニングが和太鼓から始まって多少面食らいましたがなかなか楽しかったですね。
異国で見る和の雰囲気はなんか嬉しいです。

Billy Bosworth(DataStax CEO)

盛大にHBaseをディスっていて楽しかったです。(笑)
先日行われたHBaseConは600人しか集められなかったけどCassandraSummitは800人集めたぜハッハーとか、ビジネスにおけるパイの大きさが全然違うぞとかなどなど。
HBaseConを見ていないので本当の所はわかりませんがこの辺にも勢いを感じました。



Jonathan Ellis(DataStax CTO)

JonathanのKeyノートは普通にDataStaxEnterpriseの宣伝でしたね。Cassandraの内容が半分とDataStaxEnterpriseの内容が半分でその境目がシームレス。これは誤解を生むようなと感じました。内容としては1.2で導入予定のバーチャルノードやJBODが気になりましたね。Cassandraは高性能のハードで運用するとリソースを使い切れないのが現状なので擬似的に複数ノードに分けることによりハードウェア性能を使いきろうという考えです。JBODに関しては現行のCassandraが複数台のハードディスク搭載していてもその一本が飛ぶことによりノードダウンと同じ状態になるので全てのディスクを束ねてRAID0にする方が良いという本末転倒な状況だったのでその対応が入ったというのは大きいと思います。


We Messed Up, So You Don't Have to (Jason Brown, Ed Capriolo, Matt Dennis, Matt Pfeil)

使用者による運用に関するトークセッションです。
先日Cassandra勉強会でもお話ししていただいたJason Brownさんが参加されるので半分会いに行くという目的もあったのですが内容としては、正直自分の英語力では少し厳しかったです。このセッションの為に公開ビデオを待っていたくらいです。結構細かいCassandraの運用Tipsが盛り込まれているのでビデオは割と必見かもしれません。自分も改めて見なおしています。

 

続きはまた明日書きます。

ウェブページ