13階 @13th___floor
はじめまして、13階です。 ボードゲームやそのシステムを作成、研究する人(たち?)です。 活動はかなり前から行っていましたが、発信を始めたのは最近です。 ドメモの論文をきっかけにボードゲームの論文を執筆しております。もちろんゲーム開発も! よかったら読んでください!
- UNOの論文 研究報告 第2回目
- 2020/8/16 9:01
概要
UNOの研究報告 第2回目です!
前回は手札にあるカードをランダムに出すモデルについて考察しました。今回からはある程度カードを出すための指標を設けたモデルを使用します。
使用するモデルは手札にある出せるカードのうち、点数の低いカードから出すモデルです!
ちなみに、UNOにおけるカードの得点は以下のとおりです。
- ワイルド(ワイルド、ワイルドドロー4):50点
- 記号(スキップ、リバース、ドロー2):20点
- 数字:数字の分だけの点数(9なら9点、1なら1点)
モデルの説明
本モデルは基本的なプレイヤーモデルの1つになります。
「手札にあるカードをランダムに出すモデル」を改良(良くなるかはわからないけれど)して、点数の低いカードから出すようにしました。
思考フローは以下の通りです。
- 前のプレイヤーがドロー2 、ドロー4 、スキップを出してないことを確認する。
- 場に出ている1番上のカードを確認し、自分の手札に出せるカードを挙げる。
- 出せるカードのうち点数の最も低いカードを選択して場に出す(点数が同じカードがあった場合はランダムに出す、またワイルドのカードにおける色選択はランダムに行う)。
- 出せるカードがない場合、山札からカードを1枚取る。
- 手番を次のプレイヤーへ移す。
シミュレーションの結果
本モデルをpythonによって実装し、10000回シミュレーションした結果を以下に示します。
手札にある出せるカードのうち、点数の低いカードから出すモデルのシ ミュレーション結果。横軸が UNO 終了時に取得している得点、縦軸がその得点で 終了したゲーム回数である。 A のみ本モデルを使用し、 B 、 C 、 D は手札にある出 せるカードをランダムに出すモデルをしようしている。また A 、 B 、 C 、 D の順に カードを出す。図から 500 点以上獲得している回数が最も多いのは A である。ま た、回数は 1400 回付近にあり、手札にある出せるカードをランダムに出すモデル の A と比べて 200 回程度増加している。
考察
図は手札にある出せるカードのうち、点数の低いカードから出すモデルのシミュレーション結果です。
500にプロットされている点を見ると、A(本モデルを使用したプレイヤー)とB、さらにBとC、Dの点がそれぞれ顕著に離れています。
Aが500 にプロットされている点でもっとも多いゲーム回数になっている要因は、前回説明した1番目にプレイすることが有利に働いたこと、及び本モデルの思考フローにあると考えられます。 これは今回のAの結果と手札にある出せるカードをランダムに出すモデルのAの結果を比較した時、今回のほうが500点以上を取ったゲーム回数が多いためです。1番目にプレイすることの優位性に加えて、点数の低いカードから出すという行動がこの結果につながりました。
点数の低いカードから出すという行動における特徴を考えてみましょう。
- 序盤には数字のカード、中盤から終盤にかけて記号、ワイルドのカードを出す。
- 最後に出すカードが記号、ワイルドのカードの確率が高くなる。
- 終盤における手札の合計得点が高い傾向にある。
中盤から終盤にかけて記号、ワイルドのカードを出すということは、長所だと言えます。 記号、ワイルドのカードは基本的に相手を妨害するカードです。スキップ、リバース、ドロー2、ドロー4はどれも次のプレイヤーへ手番を回しません。 特にドロー2、ドロー4は相手の手札を増やすことができます。 終盤にこれを行うことで、自分が上がったときの相手が持つ手札の合計得点が増加し、自分が獲得する得点が増えます。
また、最後に出すカードがワイルドのカードになりやすいというのも長所です。 ワイルドのカードを持った状態でUNOと宣言すれば、自分に手番が回りさえすれば上がることが出来ます。 数字や記号では、色やカードの値によって上がれない場合もあります。
一方で、終盤における手札の合計得点が高くなるというのは短所だと考えられます。 例えば、ワイルドのカードでUNOと宣言した状態で、他の誰かに上がられてしまえば、上がったプレイヤーは50点を獲得できます。 数字のカードでUNOと宣言していれば最高でも9点しか相手に与えないのだから、ワイルドのカードで上がろうとするのはリスクがあります。
結果として、このモデルは勝ったときにはより大きな点数を獲得できる反面、負けたときに勝ったプレイヤーへより大きな点数を与えることになります。
次に、本モデルを使用した実験結果のうち、BとC、Dの500点以上を取ったゲーム回数の差について考えてみましょう。
結果を見れば明らかにBのほうが500点以上を取ったゲーム回数が多いです。 手札にある出せるカードをランダムに出すモデルでは、1番目のプレイヤーは顕著に飛び出ていましたが、2番目以降のプレイヤーについては差がほとんどありませんでした。
本モデルを使用した実験結果でBとC、Dの間に顕著な差が生まれているのは、本モデルが原因だと想定されます。BとC、Dの間にある差は、Aの次かそうでないかという点だと考えられます。Aは本モデルを使用しています。 本モデルの次のプレイヤーは何らかの有利さを受けていると言えます。
本モデルの特徴から次のプレイヤーが受ける有利さは以下のようなものになります。
- 手札に出せるカードのうち、点数の低いカードから出すため、序盤で記号やワイルドのカードによる妨害を受けにくい。
- 自分の前のプレイヤー(点数の低いカードから出すモデル)は終盤まで得点の高いカードを持っているため、上がったときに獲得できる点数が高くなります。
重要なのは、序盤に受ける有利さです。
厄介なスキップ、ドロー2、ドロー4を受けにくくなるため、自分の番が飛ばされることが減ります。 自分はスキップ等の妨害カードを出すことができ、次のプレイヤーの手番を潰すことができます。
結果、手札が他のプレイヤーに比べて早く減り、上がる確率が上がります。 また、点数の低いカードから出すモデルは最後まで高い得点のカードを持っているため、上がったときに獲得できる点数が高くなります。
その他
13階サークルのブログでも同様の記事を公開しております。コメントなどどうぞ!
13階サークルブログ