« 前のひとこと | トップページ | 次のひとこと »

cocolog:95568454

アクセルロッドのメタ規範ゲームの拡張を Claude さんに作ってもらってシミュレーションした。裏切り者が実は裏切ってない場合があり、その場合はそれを罰そうとした者が逆に罰されるという設定。 (JRF 2552)

JRF 2025年8月 4日 (月)

(「グローバル共有メモ」や Twitter (X) で書いたことのコピペを中心に。)

アクセルロッドのメタ規範ゲームは↓に載っていた。

『社会システムモデリング』(高橋 真吾 & 後藤 裕介 & 大堀 耕太郎 著, 共立出版, 2022年4月)
https://www.amazon.co.jp/dp/4320096517
https://7net.omni7.jp/detail/1107286159

JRF2025/8/40148

まず囚人のジレンマを多人数に拡張したゲームがある。協力者と非協力者(裏切り者)がいて、非協力のほうが得られる得点(報酬)が高いというゲームである。これを協力に導くために構想されたのがまず「規範ゲーム」である。このとき、罰を与える者がいて、その者は非協力者に罰(ペナルティ)を与えるようになる…ただし、罰コストを支払って。この「規範ゲーム」では、社会が協力に導かれることもあるが、非協力状態に導かれることもある。

「メタ規範ゲーム」は、罰を与えない者に罰を与える、つまり「メタ罰」を導入することで、協力状態が導かれるようにするものである。

簡単(?)にいうと。

JRF2025/8/49612

……。

○ 2025-08-03T04:15:35Z

>(…Axelrodの…)メタ規範ゲームの結果は、社会的ジレンマ状況では、非協力的行動をとった人を罰するだけでは協力的な社会は必ずしも実現せず、罰しなかった人を罰するというメタ規範があれば協力的な社会が実現することを示唆している。<(高橋真吾 他『社会システムモデリング』共立出版, p.130)

これは私の注目されない状況を説明しているのではないか。私が裏切っているか、少なくとも裏切り者を罰していないから、社会的に「無視」という罰を受けているのではないか?

JRF2025/8/49548

私はどうもデビルマン的人物と目されることがあるようで、裏切りのある人物だと見られているように思う。理系を裏切るとか、通常の表現の自由派でなく刑法175条は維持すると主張するなどで裏切っている。…と。ただ、私自身は正しいことしかやってないわけではないが、十分正しいこともやっていると自負している。自分なりの正しさを優先することが、「罰」につながっているならやるせない。アクセルロッドのメタ規範ゲームが社会に受け容れられて「罰」になっているのではないか。

これを反転させる方法はないものか?

JRF2025/8/49604

こういうメタ規範ゲームの拡張を考えてみたらどうだろう。一定の確率で「裏切り」は裏切りではないとする。その場合、裏切りとして罰した者は、逆に裏切りと判定される。それでも罰しようとしない者は一定確率で罰されなければならない。罰しようとしない者が罰される確率を制御することで、社会が協力的になるか非協力的になるか見る。…ということはできないだろうか?

今度 AI さん達に手伝ってもらって試してみよう。

JRF2025/8/41244

……。

○ 2025-08-03T04:29:33Z

Claude さんにシミュレーションを作ってもらった。会話とプログラムは↓。

《Meta-Norm Game and Social Betrayal - Claude》
https://claude.ai/share/c1e95004-238c-419e-b02d-041bd487578c

プログラムだけ↓にも上げておいた。

《拡張メタ規範ゲーム シミュレーション》
http://jrockford.s1010.xrea.com/misc/meta_norm_simulation.html

JRF2025/8/46798

ラウンド数300ぐらいにして、誤判定確率と非罰者への罰確率だけいじって「シミュレーション開始」を押して実験していただければと思う。誤判定確率 0.00 非罰者への罰確率 0.00 が単純な「規範ゲーム」で、誤判定確率 0.00 非罰者への罰確率 1.0 が「メタ規範ゲーム」になる。非罰者への罰確率を下げて罰実行率がまずまずに落ちる数値になったら、誤判定確率 0.00 を少し上げると、罰実行率が大きく落ちる。そこでそれを補償するには、非罰者への罰確率を上げる必要があるのがわかる。…という感じ。

JRF2025/8/47095

結論としては、誤判定確率を上げることは罰コスト(平均)を上げることに相当し、罰実行率を上げるためには、非罰者への罰確率を上げる必要がある。それが社会的コストとなる。…ということのようだ。

つまりデビルマン的人物が多いと、ギスギスした社会にせざるを得ないということのようだ。これは予期しない結果だ。

JRF2025/8/43372

メタ罰という概念が、何か直接的過ぎるのだと思う。このシミュレーションは、基本的に罰が非協力を封じるという構造だった。この枠組みを維持するなら、正しい罰者を評価する仕組みがあればよいのだと思うが、それも私には違和感がある。

JRF2025/8/40121

……。

○ 2025-08-03T07:42:17Z

若干バージョンアップしておいた。「正しい罰者を評価する」に相当する、罰コストをマイナスだけでなくプラスでも試せるようにしておいた。ただ、デビルマン的人間が現れるのは罰コスト(マイナス)になるというの変わってないので、本質は同じなのだが。

罰報酬(通常マイナスの罰コストのマイナスのプラスの罰コスト)がある状況だと、メタ罰がなくても協力状態になる。デビルマン的人間が多く現れるような混乱した世の中では罰報酬を上げる。…これがシンプルな結論なのかもしれない。

JRF2025/8/48051

« 前のひとこと | トップページ | 次のひとこと »