2010年3月13日土曜日

chrome extensionでgoogle codeを英語版に強制する

appengineの古いドキュメントにいちいち飛ばされるのがイラッとするので
これを使ってます。便利。accept-languageを動的に変えられると
もっといいんですけど、NSAPIとか使わないと無理じゃないですかね。

URL Patterns
https://chrome.google.com/extensions/detail/aeenbkfcmogkgbkkibbjpmkegldfgapl

設定はこんな感じ

2010年2月26日金曜日

Chrome extensions | appengine-easy-monitor

http://bit.ly/aD9QuP
devfest_jpのQuizのため、適当に作りました><
前日にappengineの大規模な障害とかあったので、
こういうのあってもいいかな?
statusページを10分ごとにjqueryで適当にスクレイピングして
当日のステータスに応じたアイコンを出すようにしてみました。
詳細データはアイコンにリンクしています。

2010年2月22日月曜日

Scalaでappengineのapiproxy hookを作る

Hackathonから帰ったあと、@marblejenkaさんがappengineのlower levelなネタを
作ってるのを聞いてたので、appengineのライブラリ以外をscalaで作ったらどうなるんだろ、
と思ってApiProxyのHookを書いてみた。

簡単だろ、と思ってたら意外なところでハマってしまった。
最初こんな感じで書いた。
class HookDelegate(val delegate:Delegate[_ <: Environemnt]) 
  extends Delegate[Environment] {

 def makeSyncCall(e:Environment,
  s:String,m:String,r:Array[Byte]):Array[Byte] = {
  delegate.makeSyncCall(e,s,m,r)
 }

 def makeAsyncCall(e:Environment,
   s:String,m:String,r:Array[Byte],
     c:ApiConfig):Future[Array[Byte]] = {
  delegate.makeAsyncCall(e,s,m,r,c)
 }

 def log(e:Environment,r:LogRecord) = {
  delegate.log(e,r)
 }

}

アウト。
コンパイル時に型が違いますエラーをdelegate.makeXXX,logの呼び出しで喰らう。
Delegateが共変ではないってことになるのかな。

渡すdelegateはApiProxy.getDelegateで取得することを想定しているのだけど、
これ仮型引数が分からない。scalaのエラーによると、<? extends Environment>
ってのは分かってるんだけど、型として<? extends Environment>ってのは用意できない。
まあJavaで同じことしてもエラーになるんだけど、ApiProxy.getDelegateはraw type
、イレイジャ通って戻ってくるので、キャストして呼べるんだよね。

1日悩んで、どうしたらいいんだろと考えてひらめいた。

class HookDelegate[E <: Environment](val delegate:Delegate[E]) 
  extends Delegate[E] {

 def makeSyncCall(e:E,
   s:String,m:String,r:Array[Byte]):Array[Byte] = {
  delegate.makeSyncCall(e,s,m,r)
 }

 def makeAsyncCall(e:E,s:String,m:String,r:Array[Byte],
   c:ApiConfig):Future[Array[Byte]] = {
  delegate.makeAsyncCall(e,s,m,r,c)
 }

 def log(e:E,r:LogRecord) = {
  delegate.log(e,r)
 }

}

これならOK。
コンストラクタの引数を元に仮型引数を決定できるので渡されたdelegateを
元に推論すればいいじゃん!とひらめいたのでした。
・直接このHookのmakeSyncCallは呼び出せない
・Hook内でEnvironmentをいじれない
けれども。
多分Javaだとタイプセーフにはできないような気がする。

Scala Hackathon #2に参加した

2/20に開催された@yuroyoroさん主催のscala hackathon #2に参加した。
場所はOracle青山センター、とても綺麗な施設で、かっこよかった。

で、今回自分が何をしていたかというと、
・既存blogのatomからbloggerにインポートするappengineアプリをscala化する
ってのをテーマにやろうと思ってたんだけど、思った以上に基礎ができていない
ことが判明したので
・swingアプリをかっこよくscalaで短く書く
にした。

Javaでの繰り返し、swingのイベントハンドラ処理ってのは冗長な記述が多い
⇒scalaってLLだべ?
⇒かっこよくJavaScriptとかそういうのみたいにワンライナーで書く
⇒モテる

そういう動機。

ただ、swing周り、scalaでは全てのswingコンポーネントが
ラップされているわけでは無いようなので、自分で書くべきところが
多そうだなー、という印象。イベントハンドラは取り合えず後回しにして
繰り返しをかっこよく書くことに専念した。

たとえば、テーマのクラス、Javaで書くとこんな感じ。
getDefaultsをオーバーライドして、テーマのデフォルト値を上書きする。

public class MyTheme extends NimbusLookAndFeel {
  @Override
  public UIDefaults getDefaults() {
    UIDefaults table = super.getDefaults();
    for(Entry<Object,Object> entry:table.entrySet()) {
      if(entry.getValue() instanceof Font) {
        table.put(entry.getKey(), new Font("MS UI Gothic",Font.PLAIN,12));
      }
    }
    return table;
  }
} 

冗長なのは、forとinstanceofでのエントリのフィルタリング。 これをscalaでもっと短くしていきたい。

class MyTheme(font:Font) extends NimbusLookAndFeel {
  override def getDefaults : UIDefaults = {
    val defaults=super.getDefaults
    defaults++=(for((k,v) <- defaults if v.isInstanceOf[Font] ) yield (k,font))
    defaults 
  }
}


主要な部分は短くなったけど、valへの代入と値を返す部分が残る。
Scala特有の書き方はscalaの型で無いとダメなところが一番の理由かな。
implicit conversionを勉強すると省略する方法が分かるのかもしれない。
あとはコレクションの扱いが色々あって、書き方が一通りでは無いから
もう少しかっこいいのが書けそうな気がする。

ハマッたこと。
1.mapのエントリについて
UIDefaultsはHashtableインターフェースを実装しているので、エントリは
Entryであらわせるんだけども、これがscalaだとどのように帰ってくるか
最初分からなかった。コンパイルエラーでは (k,v) のような表現の型なのは
分かるんだけど、検索キーワードになるような言葉を付けてくれよとは思った。
調べた結果、Tupleと言うみたい。
アクセスするには、entry._1とかentry._2とか書くとらしいんだけど、
@yuroyoroさんのアドバイスで{case (k,v) => } というようなPartial Functionを
書くと_1とか_2とか書かなくてもいいよ!と聞いて、
ん、もしかしたら、forでも(k,v)?と書いてみたら受けることができた。

※そもそもPartial Functionってなんぞやと思って調べたところ、
「引数と戻り値に対して仮型引数を定義する関数の型」っぽい。
caseの一つ一つをPartial Functionとして定義できるってことが分かった。

2.条件分岐、型のマッチ
上記ではif文の中のisInstanceOfでフォントかどうか評価しているんだけど、
isInstanceOfってかっこ悪くね?⇒caseクラスいいんじゃね?⇒
でも結局この(k,v)ってペアのvの評価を一発で出来ないとかっこ悪くね?
どう書くんだろ?

ここまででHackathonが終わってしまった。

10:00~19:00までやってこれだけかよ!

とりあえず、今回書いたコードでscalaのかっこいいところ
1.forの中にfilterを書ける。
2.forの処理結果をコレクションで戻せる。

@yuroyoroさん、ほんと、初心者の質問してしまって申し訳なかったです。
さすがにそろそろコップ本を買って勉強します。

※コードと格闘しててLTはほぼスルー気味でした。ごめんなさい。

2009年12月29日火曜日

appengineのリクエストライフサイクルの推測

今までのテスト結果などからまとめたリクエストライフサイクルを図にすると多分こんな感じ。



ここで、スピンアップを行なう実行単位をスピナープロセスと仮定すると、それらも起動時間がそれなりにかかるかもしれない。
まず、キューと予想されるリクエストの集合から、最初のスピンアップとなったリクエストを抜き出すと、こんな感じになる。このテストは500ms待ちのみのサーブレットで行なったものなので、全て同時に実行していれば1.2秒程度で並んでおかしくないのだけど、4秒、5秒と掛かっている場合がある。

また、スピナープロセスはリクエスト処理で何かブロックされてしまうと、次のスピンアップがブロックされてしまう。これは別のWebハンドラを作っておいて、デプロイ直後のリクエストでURLFetchServiceでそのURLをキックしてみると分かる。別のキューに振られないとインスタンスが起動できずにRequest was abortedされるはず。

処理時間やスピンアップに時間が掛かってると、スケールアウトのプロセスを一部ブロックしているようなものなので、急激なリクエストの増加に対応できないってことになる。
これはある意味AppEngineの弱点かもしれない。

2009年12月10日木曜日

昨日の続き

インスタンスの起動間隔について

キューごとのインスタンスの起動間隔は処理開始時間をみるとちょうど処理時間+spinup時間程度になってるようだ。

昨日の内容のツッコミ

  1. higayasuo @WdWeaver 検証のやつですけど、なぜ1つのqueueに関連付けれられているインスタンスがあの5個と特定できているのかがわからない #appengine
  2. WdWeaver @higayasuo 最初に投げたリクエストのうち、インスタンスが起動したリクエストの時間より前のリクエストを処理しているものが5つあった、ってことです。
  3. WdWeaver @higayasuo で、UUID=b8418f11-f0a4-443e-b4d8-35cad8a2cc3cを境にして、それ以降の起動インスタンスはこの5個のインスタンスが処理した時間帯のリクエストを処理していません
  4. WdWeaver @higayasuo んで、キュー共用してればキューの中から拾って処理が可能なんじゃないかなと思ったので、キューの分割単位になってるんじゃないかなーと。マシン単位なのか、ソフトウェア的な分割なのかは分からないですけど。
  5. higayasuo @WdWeaver thx. だとするとキューが40というのも説明がつきますね #appengine
  6. WdWeaver @higayasuo はい。ただ、昨日追加で実験してみたところ、必ず40というわけでもないようです。

2009年12月9日水曜日

appengineのスケールアウトの結果を吟味した

#ajn3で披露したスケールアウトの様子について、リクエストの到着時刻を元にログを並べ直すと、面白い事実が分かってきた。(ちなみにappcfgでダウンロードするログにはこの到着時刻やcpu時間等が含まれないので非常に分析しづらい。)
テスト方法についても反省点があるので、ここにメモを残そうと思う。
分析に使っている結果シートはこちら
0.5秒待ちで、120件を一気に投げてみた結果はこちら

JMeterの挙動について

設定ミス、私自身もJMeterの設定について不勉強だったため、初期値として60thread,30request/secとして設定したJMeterの挙動が、期待するものとは違った。
まず、すべてのthreadは、スピンアップした直後にリクエストを送信していた。
したがって、60reqeustが当初appengine側に送信されていた。
また、各クライアントスレッドはレスポンス待ちを行うため、次回のリクエストまで1秒以上~10秒前後未満(最大、キューのタイムアウトまで)の待ちが発生する。
以上の状況から、リクエストの間隔が一定のレベルでかかるような状況を作ることができていなかった。
負荷のかかり方が、appengine側のスループットに依存する状況(スケールの状況に依存するってこと・・・)になってしまっているため、平均すると、リクエストは11.3req/sec程度に落ち着いていた。
大体スケールしたインスタンス数(13個)になってるので、ああ、なるほどなと。
テストの系にJMeterの挙動が含まれるような形になってしまっていたのは残念。

ただ、以降に記述するとおり、最初の1秒間に実行された60個のリクエストが興味深い結果を残してくれていた。

リクエストのキューについて

インスタンスを起動したリクエスト時刻以前のリクエストを同一インスタンスで処理するパターンと、起動したリクエスト以降のリクエストのみを処理するパターンが存在していた。
リクエストのキューはおそらく物理的に複数存在し、キューに複数のインスタンスがぶら下がるようになっていると考えられる。(要するにGDDの説明通りの構成ってことかな)
これは物理的な構成を考える根拠になりそうだ。
おそらく物理的に分割されているため、キューが別々になってしまったリクエストはキューをまたがったインスタンスへ移動することはできないのだろう。
ひとつのキューにぶら下がったインスタンスで処理しきれないリクエストがRequest was abortedにつながっているように思える。
具体的にはUUIDがb8418f11-f0a4-443e-b4d8-35cad8a2cc3cのインスタンスで、少なくともキューが
全て共用されていれば、このインスタンスでも起動時刻以前のリクエストを処理していないとおかしい。

リクエストキューの個数について

ひとつのリクエストのキューに対し、40件程度詰め込まれていることが事実としてある(リクエスト時刻を巻き戻って処理しているインスタンスのリクエスト合計がちょうどこれくらい)。実はこれがquotaとリソースの利用状況との関係になるのではないかと予想が立った。
GDDの説明だと、初期状態だと1つのフロントエンドに3つのAppEngineマシンがぶら下がっている構図だ。さて、40*3とは?120だ。ちょうどfreequotaのリクエストの秒間の上限に近い値となる。
もちろん、物理的な振り分け自体はこのようにならないと思うが、利用リソースの計算としてはここを目指した設定値ではないかと考えている。

キューの割り振りについて

1つのIPからのリクエストのテストであったため、多数のIPからアクセスされる状況については分からないが、上記のリクエストキューの個数と時刻をみると、フロントエンドから、単純にリクエスト40件程度ずつラウンドロビンをしているように見える。ただ、この結果を踏まえ、0.5秒待ち、120件のリクエストを一気に投げてみた結果から、キューのサイズは可変で、フロントエンドの負荷分散ももう少し高度なことをやっていそうなことがわかった。

リクエストキューの個数と失敗数の検証

上記から予想している40個というリクエストキューのサイズと、失敗数を検証してみたい。
60件のリクエストのうち、ひとつのキューにぶら下がりスケールしていると思われるインスタンスのUUIDを抜き出し、60件のリクエストのうち、処理できた件数を集計する。
1. 52f48031-6af2-487e-9809-84fb51adde63 .. 10件
2. 988cbe3a-1751-4a09-8faf-67f51f07e6c3 .. 9件
3. b3c1eb76-277b-4e17-b713-ea9d09a875e8 .. 7件
4. eda3152a-8445-478e-876c-1460b5ebd016 .. 5件
5. 514bd79b-1b19-429d-a383-e26382144fdd .. 4件
... 全部で35件。失敗した件数が5件なので、計算は合う。
リクエストとしての処理時間から逆算した処理可能数と比較すると、少し処理した数が多いが、処理時間はフロントエンドとの通信遅延なども入った値と考えるとつじつまあわせはできそうだ。

とりあえず今日はここまで