齋藤優太
齋藤優太
ホーム
論文・出版
ブログ
連絡先
履歴書
英語
Light
Dark
Automatic
日本語
English
Theory
Optimal Off-Policy Evaluation from Multiple Logging Policies
We study off-policy evaluation (OPE) from multiple logging policies, each generating a dataset of fixed size, i.e., stratified …
Nathan Kallus
,
Yuta Saito
,
Masatoshi Uehara
引用
コード
会議録
arXiv
引用
×