Offer of a reward does not always promote trust in spatial games
이 논문은 공간적 신뢰 게임에서 보상이 항상 신뢰를 촉진하는 것은 아니며, 과도한 보상이 오히려 비환원 전략을 유발해 신뢰 진화를 억제하고, 적정 수준의 비용이 더 큰 보상이 신뢰 형성에 더 유리할 수 있음을 보여줍니다.
62 편의 논문
이 논문은 공간적 신뢰 게임에서 보상이 항상 신뢰를 촉진하는 것은 아니며, 과도한 보상이 오히려 비환원 전략을 유발해 신뢰 진화를 억제하고, 적정 수준의 비용이 더 큰 보상이 신뢰 형성에 더 유리할 수 있음을 보여줍니다.
이 논문은 평균 보상 게임을 해결하기 위한 새로운 결정론적 대칭 재귀 알고리즘을 제안합니다.
이 논문은 다중 레이어 사회 네트워크에서의 의견 역학을 동기화 조정 게임으로 모델링하여, 레이어 간 결합 메커니즘이 단일 레이어만으로는 달성할 수 없는 전역적 합의나 안정성을 유도하거나 저해할 수 있음을 분석하고 수렴 조건을 규명합니다.
이 논문은 게임과 무관한 미분 가능 균형 블록 (DEB) 을 모듈로 활용하여 계약 설계, 기계 스케줄링, 역균형 문제 등 다양한 인센티브 설계 과제를 단일 신경망으로 해결하는 '딥 인센티브 설계 (DID)' 프레임워크를 제안합니다.
이 논문은 LLM 이 두 팔 밴딧 과제에서 학습률 저하와 높은 역온도로 인해 확률적 편향을 강화하고 경직된 탐험을 보이며, 이는 인간-AI 상호작용에 중요한 함의를 가진다는 것을 발견했습니다.
이 논문은 브랜드 광고의 고유한 특성을 활용하여 복잡한 머신러닝 모델 없이도 온라인 등분위 회귀를 통해 단조로운 입찰 - 지출 및 입찰 - 전환 모델을 구축하는 경량 예측 제어 (MPC) 프레임을 제안하며, 이를 통해 실시간 입찰 환경에서 지출 효율성과 비용 통제력을 크게 향상시킨다고 설명합니다.
이 논문은 현재 벤치마크가 모델 개발자에게 테스트 데이터에 특화된 전략적 학습을 유도하여 내재적 품질을 왜곡하는 문제를 지적하고, '튜닝 후 테스트 (tune-before-test)' 프로토콜을 통해 내재적 품질에 기반한 유일한 나시 균형을 달성할 수 있음을 증명합니다.
이 논문은 희소성과 편향된 상호작용 하에서 계층과 불평등이 어떻게 창발하는지, 그리고 편향을 고려한 게임 이론이 자본주의나 평등주의와 같은 사회 시스템의 비선형적 동역학과 재분배 정책 분석에 어떻게 적용될 수 있는지를 규명합니다.
이 논문은 AI 기반 진화 탐색 기법인 AlphaEvolve 를 활용하여 양자 거래에서 무작위 제안자 (RO) 메커니즘의 최적 효율성 대비 worst-case 성능 하한을 기존 2.02 에서 2.0749 로 개선한 새로운 사례를 발견했다고 요약할 수 있습니다.
이 논문은 기존 1 단계 역게임 이론의 한계를 극복하기 위해, 다중 에이전트 간 상호작용에서 각 에이전트가 상대방의 목표에 대해 어떻게 추론하는지를 파악하는 2 단계 역게임 추론 프레임워크를 제안하고, 이를 통해 실제 시나리오에서 발생하는 목표 불일치를 효과적으로 규명합니다.
이 논문은 분산형 에너지 자원의 복잡한 선호도를 반영하면서도 프로슈머의 인지적 부담을 줄이기 위해, 기계 학습을 활용한 조합 시계 교환 방식을 도입하여 지역 에너지 시장의 선호도 수집을 간소화하고 효율적인 가격 수렴을 달성하는 새로운 시장 메커니즘을 제안합니다.
이 논문은 리더 - 팔로워 상호작용에 Pearl 의 인과 계층을 도입한 순차적 인과적 다중 에이전트 시스템 (S-CMAS) 을 제안하고 이론적 분석을 수행했으나, 50 회 이상의 시뮬레이션과 합성 예시를 통해 합리적 최선 대응을 전제로 한 역산 (backward induction) 하에서는 고전적 스택버그 균형 대비 후생 개선 효과가 전혀 나타나지 않는다는 부정적 결론을 도출하여, 합리적 선택에 기반한 고전적 게임 이론 프레임워크가 인과적 추론의 이점을 포착하는 데 근본적인 한계가 있음을 시사합니다.
이 논문은 유-기-오! TCG 에서 주어진 게임 상태에서 특정 전략이 승리하는지 여부를 결정하는 문제가 계산 불가능하며, 실제로 -완전 (complete) 임을 증명하고 이를 위해 현재 금지/제한 목록에 따라 합법적으로 구성할 수 있는 두 가지 덱을 제시합니다.
이 논문은 이론적 근거가 부족한 기존 ToM 벤치마크의 한계를 극복하기 위해 양자적 반응 균형 (QRE) 을 기반으로 한 게임 이론적 평가 프레임워크를 제안하고, 이를 통해 다양한 대규모 언어 모델의 전략적 추론 능력을 인간 데이터에 기반한 연속적 척도로 정량화하고 검증했습니다.
이 논문은 블랙박스 신경망 정책의 해석 불가능성을 해결하기 위해 대규모 언어 모델을 활용해 인간이 읽을 수 있는 코드로 직접 정책을 생성하는 '코드-스페이스 응답 오라클 (CSRO)' 프레임워크를 제안하며, 이를 통해 경쟁력 있는 성능과 함께 설명 가능한 다양한 다중 에이전트 전략을 도출할 수 있음을 보여줍니다.
이 논문은 그래프 기반 메트릭 선호도 환경에서 즉각 결선투표 (IRV) 의 배제 구역 (exclusion zone) 문제와 왜곡 (distortion) 을 연구하여, 일반 그래프에서는 NP-난해하지만 트리 구조에서는 다항 시간 내에 해결 가능함을 증명하고, 특정 조건을 만족하는 모든 순위 기반 탈락 규칙에 대해 해당 문제의 계산적 한계를 규명했습니다.
이 논문은 대규모 언어 모델 (LLM) 기반 가격 책정 에이전트가 과점 시장에서 자율적으로 초경쟁적 가격을 형성하며, 프롬프트의 사소한 변화가 가격 수준에 큰 영향을 미치고 경매 상황으로도 확장된다는 점을 실험을 통해 규명하여 AI 기반 가격 결정의 규제에 새로운 도전을 제기한다고 요약할 수 있습니다.
이 논문은 고란틀라 (Gorantla) 등이 제기한 미해결 문제를 해결하여, 동일한 선호도를 가진 개 그룹과 종류의 재화 (또는 채무) 에 대해 공정한 할당이 존재하도록 하는 각 재화 유형의 최소 개수 에 대한 명시적 상한을 유도하고, 이를 구성적 증명과 케이크 나누기 등 관련 영역으로 확장하는 새로운 기법을 제시합니다.
이 논문은 불완전 감시 하의 반복 게임에서 가설 검정을 기반으로 한 '테스트 후 처벌' 전략을 제시하여, 협력적 혼합 행동 프로필을 관찰된 순수 행동의 실현을 통해 통계적으로 검증하고 편차 증거가 축적되면 영구적으로 처벌로 전환함으로써 불완전 감시 조건에서도 Folk 정리를 성립시키는 방법을 연구합니다.
이 논문은 다중 에이전트 협력의 질을 평가할 때 기존 성과 기반 지표가 시간적 구조를 간과하여 협력 실패를 놓칠 수 있음을 지적하고, 이를 해결하기 위해 '완벽한 교대 (Perfect Alternation)'를 기준으로 한 새로운 시간 민감성 지표 (ALT) 를 제안하며, 이를 통해 학습된 정책이 전통적 지표에서는 높은 점수를 받지만 무작위 정책보다 협력 성능이 현저히 낮을 수 있음을 실증합니다.