网上赌钱-盈乐博娱乐城_百家乐详解_sz新全讯网xb112 (中国)·官方网站

Recent advances in Distributional Reinforcement Learning分布式強化學習的最新進展

時間:2024-01-20 10:44    來源:     閱讀:

光華講壇——社會名流與企業家論壇第6718期

主 題Recent advances in Distributional Reinforcement Learning分布式強化學習的最新進展

主講人上海財經大學 周帆副教授

主持人統計學院 林華珍教授

時間:1月22日 15:00-16:00

舉辦地點:柳林校區弘遠樓408會議室

主辦單位:統計研究中心和統計學院 科研處

主講人簡介:

周帆,上海財經大學統計與管理學院副教授,博士畢業于美國北卡羅萊納大學教堂山分校。主要研究方向包括強化學習,深度學習,因果推斷。在Journal of American Statistical Association,Journal of Machine Learning Research, Biometrics等統計學機器學習期刊以及NeurIPS, ICML, KDD等國際人工智能頂會接收發表一作通訊文章數十篇,曾獲得國際泛華統計協會新研究者獎,北卡教堂山分校Barry H. Margolin Award,并入選上海市人才計劃(青年)。

內容簡介

Although distributional reinforcement learning (DRL) has been widely examined in the past few years, very few studies investigate the validity of the obtained Q-function estimator in the distributional setting. We discuss some of our works in ensuring the monotonicity of the obtained quantile estimates and the theoretical necessity. Moreover, we undertake a comprehensive analysis of how the approximation errors within the Q-function impact the overall training process in DRL. We both theoretically analyze and empirically demonstrate techniques to reduce both bias and variance in these error terms, ultimately resulting in improved performance in practical applications.

分布式強化學習(DRL)在過去幾年里得到了廣泛的研究,但很少有研究調查在分布式環境中獲得的 Q 函數估計器的有效性。主講人將介紹為確保所獲得的分位數估計的單調性方面所做的一些工作并探討理論上的必要性。此外,主講人對Q函數中的近似誤差如何影響DRL的整體訓練過程進行了全面分析。主講人將對減少這些誤差項中的偏差和方差的技術進行理論分析和實證演示,并展示這一技術最終在實際應用中實現了性能的提高。

西南財經大學  版權所有 webmaster@swufe.edu.cn     蜀ICP備 05006386-1號      川公網安備51010502010087號
博王国际娱乐| 百家乐群号| 百家乐官网平注法到6568| 威尼斯人娱乐城老品牌值得您信赖lm0| 广州百家乐官网赌场| 九州百家乐的玩法技巧和规则| 盈博国际娱乐城| 网上百家乐真的假| 百家乐破解赌戏玩| 南京百家乐官网赌博现场被| 百家乐庄闲排| 百家乐官网如何投注| 大发888娱乐城送白菜| 哪家百家乐官网优惠最好且信誉不错| 博狗官网| 正品百家乐网站| 做生意 风水| 百家乐官网连跳趋势| 贞丰县| 爱拼百家乐的玩法技巧和规则| 做生意门口怎么摆放| 百家乐官网赌博机玩法| 太阳城娱乐城网站| 大发888假冒网站| 百家乐正式版| 网络百家乐官网骗局| 威尼斯人娱乐城信誉lm0| 澳门百家乐官网赌技巧| 百家乐官网游戏机压法| TT娱乐城投注,| 二八杠网站| 怎么赢百家乐的玩法技巧和规则| 百家乐分析概率原件| 国际百家乐规则| 正品百家乐官网网站| 澳门百家乐官网官网站| 百乐门线上娱乐| 大发888bet游戏平台| 威尼斯人娱乐城最新地址| 百家乐常用公式| 伯爵百家乐赌场娱乐网规则|