一人目,課金ゲームのマルコフ連鎖モデル. 目標物が2つある場合の最もシンプルな場合についての考察. 議論によって推移確率が導かれ,期待利得計算も可能となった. で,それが試行回数の単調関数にならなければ,最適停止問題として遊べるのだけど,本日…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。