熟女人妻水多爽中文字幕,国产精品鲁鲁鲁,隔壁的少妇2做爰韩国电影,亚洲最大中文字幕无码网站

æŠ€è¡“é »é“

: ç†±æœè©žï¼š; å·¥æ¥(yÃ¨)è‡ªå‹•åŒ–; é‹å‹•æŽ§åˆ¶; ä¼ºæœé›»æ©Ÿ; è®Šé »å™¨; å‚³æ„Ÿå™¨; ç›´é©…(qÅ«)é›»æ©Ÿ; å·¥æ¥(yÃ¨)æ©Ÿå™¨äºº; æ¸›é€Ÿæ©Ÿ

æŠ€è¡“é¦–é

æ‚¨ç¾(xiÃ n)åœ¨çš„ä½ç½®ï¼š ä¸åœ‹å‚³å‹•ç¶²(wÇŽng) > æŠ€è¡“é »é“ > æŠ€è¡“ç™¾ç§‘ > æŽ¨è–¦ç³»çµ±(tÇ’ng)ä¸çš„EEå•é¡ŒåŠè§£æ±ºå•é¡Œçš„åŸºæœ¬Banditç®—æ³•è©³ç´°æ¦‚è¿°

æŽ¨è–¦ç³»çµ±(tÇ’ng)ä¸çš„EEå•é¡ŒåŠè§£æ±ºå•é¡Œçš„åŸºæœ¬Banditç®—æ³•è©³ç´°æ¦‚è¿°

æ™‚é–“ï¼š2018-10-15 11:00:39ä¾†æºï¼šç¶²(wÇŽng)çµ¡è½‰(zhuÇŽn)è¼‰

å°Žèªžï¼š?ExplorationandExploitation(EEå•é¡Œï¼ŒæŽ¢ç´¢èˆ‡é–‹ç™¼(fÄ))æ˜¯è¨ˆç®—å»£å‘Šå’ŒæŽ¨è–¦ç³»çµ±(tÇ’ng)é‡Œå¸¸è¦‹çš„ä¸€å€‹å•é¡Œï¼Œç‚ºä»€ä¹ˆæœƒæœ‰EEå•é¡Œï¼Ÿç°¡å–®ä¾†èªªï¼Œæ˜¯ç‚ºäº†å¹³è¡¡æŽ¨è–¦ç³»çµ±(tÇ’ng)çš„æº–ç¢ºæ€§å’Œå¤šæ¨£æ€§ã€‚

1ã€æŽ¨è–¦ç³»çµ±(tÇ’ng)ä¸çš„EEå•é¡Œ

ExplorationandExploitation(EEå•é¡Œï¼ŒæŽ¢ç´¢èˆ‡é–‹ç™¼(fÄ))æ˜¯è¨ˆç®—å»£å‘Šå’ŒæŽ¨è–¦ç³»çµ±(tÇ’ng)é‡Œå¸¸è¦‹çš„ä¸€å€‹å•é¡Œï¼Œç‚ºä»€ä¹ˆæœƒæœ‰EEå•é¡Œï¼Ÿç°¡å–®ä¾†èªªï¼Œæ˜¯ç‚ºäº†å¹³è¡¡æŽ¨è–¦ç³»çµ±(tÇ’ng)çš„æº–ç¢ºæ€§å’Œå¤šæ¨£æ€§ã€‚

EEå•é¡Œä¸çš„Exploitationå°±æ˜¯ï¼šå°ç”¨æˆ¶æ¯”è¼ƒç¢ºå®šçš„èˆˆè¶£ï¼Œç•¶ç„¶è¦åˆ©ç”¨é–‹é‡‡è¿Žåˆï¼Œå¥½æ¯”èªªå·²ç¶“(jÄ«ng)æŽ™åˆ°çš„éŒ¢ï¼Œç•¶ç„¶è¦èŠ±ï¼›è€Œexplorationå°±æ˜¯ï¼šå…‰å°è‘—ç”¨æˆ¶å·²çŸ¥çš„èˆˆè¶£ä½¿ç”¨ï¼Œç”¨æˆ¶å¾ˆå¿«æœƒè†©ï¼Œæ‰€ä»¥è¦ä¸æ–·æŽ¢ç´¢ç”¨æˆ¶æ–°çš„èˆˆè¶£æ‰è¡Œï¼Œé€™å°±å¥½æ¯”é›–ç„¶æœ‰ä¸€é»žéŒ¢å¯ä»¥èŠ±äº†ï¼Œä½†æ˜¯é‚„å¾—ç¹¼çºŒ(xÃ¹)æ¬ç£šæŽ™éŒ¢ï¼Œä¸ç„¶èŠ±å®Œäº†å°±å¾—å–è¥¿åŒ—é¢¨ã€‚

2ã€Banditç®—æ³•

Banditç®—æ³•æ˜¯è§£æ±ºEEå•é¡Œçš„ä¸€ç¨®æœ‰æ•ˆç®—æ³•ï¼Œæˆ‘å€‘å…ˆä¾†äº†è§£ä¸€ä¸‹Banditç®—æ³•çš„èµ·æºã€‚Banditç®—æ³•ä¾†æºäºŽæ·å²æ‚ ä¹…çš„è³åšå¸ï¼Œå®ƒè¦è§£æ±ºçš„å•é¡Œæ˜¯é€™æ¨£çš„ï¼š

ä¸€å€‹è³å¾’ï¼Œè¦åŽ»æ–è€è™Žæ©Ÿï¼Œèµ°é€²è³å ´ä¸€çœ‹ï¼Œä¸€æŽ’è€è™Žæ©Ÿï¼Œå¤–è¡¨ä¸€æ¨¡ä¸€æ¨£ï¼Œä½†æ˜¯æ¯å€‹è€è™Žæ©ŸåéŒ¢çš„æ¦‚çŽ‡å¯ä¸ä¸€æ¨£ï¼Œä»–ä¸çŸ¥é“æ¯å€‹è€è™Žæ©ŸåéŒ¢çš„æ¦‚çŽ‡åˆ†å¸ƒæ˜¯ä»€ä¹ˆï¼Œé‚£ä¹ˆæ¯æ¬¡è©²é¸æ“‡å“ªå€‹è€è™Žæ©Ÿå¯ä»¥åšåˆ°æœ€å¤§åŒ–æ”¶ç›Šå‘¢ï¼Ÿé€™å°±æ˜¯å¤šè‡‚è³åšæ©Ÿå•é¡Œï¼ˆMulti-armedbanditproblem,K-armedbanditproblem,MABï¼‰ã€‚

æ€Žä¹ˆè§£æ±ºé€™å€‹å•é¡Œå‘¢ï¼Ÿæœ€å¥½çš„è¾¦æ³•æ˜¯åŽ»è©¦ä¸€è©¦ï¼Œä¸æ˜¯ç›²ç›®åœ°è©¦ï¼Œè€Œæ˜¯æœ‰ç–ç•¥åœ°å¿«é€Ÿè©¦ä¸€è©¦ï¼Œé€™äº›ç–ç•¥å°±æ˜¯Banditç®—æ³•ã€‚

Banditç®—æ³•å¦‚ä½•åŒæŽ¨è–¦ç³»çµ±(tÇ’ng)ä¸çš„EEå•é¡Œè¯(liÃ¡n)ç³»èµ·ä¾†å‘¢ï¼Ÿå‡è¨æˆ‘å€‘å·²ç¶“(jÄ«ng)ç¶“(jÄ«ng)éŽä¸€äº›è©¦é©—ï¼Œå¾—åˆ°äº†ç•¶å‰æ¯å€‹è€è™Žæ©Ÿçš„åéŒ¢çš„æ¦‚çŽ‡ï¼Œå¦‚æžœæƒ³è¦ç²å¾—æœ€å¤§çš„æ”¶ç›Šï¼Œæˆ‘å€‘æœƒä¸€ç›´æ–å“ªå€‹åéŒ¢æ¦‚çŽ‡æœ€é«˜çš„è€è™Žæ©Ÿï¼Œé€™å°±æ˜¯Exploitationã€‚ä½†æ˜¯ï¼Œç•¶å‰ç²å¾—çš„ä¿¡æ¯å¹¶ä¸æ˜¯è€è™Žæ©ŸåéŒ¢çš„çœŸå¯¦æ¦‚çŽ‡ï¼Œå¯èƒ½é‚„æœ‰æ›´å¥½çš„è€è™Žæ©ŸåéŒ¢æ¦‚çŽ‡æ›´é«˜ï¼Œå› æ¤é‚„éœ€è¦é€²ä¸€æ¥æŽ¢ç´¢ï¼Œé€™å°±æ˜¯Explorationå•é¡Œã€‚

ä¸‹é¢ï¼Œæˆ‘å€‘å°±ä¾†çœ‹ä¸€ä¸‹ä¸€äº›ç¶“(jÄ«ng)å…¸çš„Banditç®—æ³•å¯¦ç¾(xiÃ n)å§ï¼Œä¸éŽæˆ‘å€‘é‚„éœ€è¦è£œå……ä¸€äº›åŸºç¤ŽçŸ¥è˜ã€‚

3ã€åŸºç¤ŽçŸ¥è˜

3.1ç´¯ç©éºæ†¾

Banditç®—æ³•éœ€è¦é‡åŒ–ä¸€å€‹æ ¸å¿ƒå•é¡Œï¼šéŒ¯èª¤çš„é¸æ“‡åˆ°åº•æœ‰å¤šå¤§çš„éºæ†¾ï¼Ÿèƒ½ä¸èƒ½éºæ†¾å°‘ä¸€äº›ï¼Ÿæ‰€ä»¥æˆ‘å€‘ä¾¿æœ‰äº†è¡¡é‡Banditç®—æ³•çš„ä¸€å€‹æŒ‡æ¨™ï¼šç´¯ç©éºæ†¾ï¼š

é€™é‡Œtè¡¨ç¤ºè¼ªæ•¸(shÃ¹),rè¡¨ç¤ºå›žå ±ã€‚å…¬å¼å³é‚Šçš„ç¬¬ä¸€é …è¡¨ç¤ºç¬¬tè¼ªçš„æœŸæœ›æœ€å¤§æ”¶ç›Šï¼Œè€Œå³é‚Šçš„ç¬¬äºŒé …è¡¨ç¤ºç•¶å‰é¸æ“‡çš„armç²å–çš„æ”¶ç›Šï¼ŒæŠŠæ¯æ¬¡å·®è·ç´¯åŠ èµ·ä¾†å°±æ˜¯ç¸½çš„éºæ†¾ã€‚

å°æ‡‰åŒæ¨£çš„å•é¡Œï¼Œé‡‡ç”¨ä¸åŒbanditç®—æ³•ä¾†é€²è¡Œå¯¦é©—ç›¸åŒçš„æ¬¡æ•¸(shÃ¹)ï¼Œé‚£ä¹ˆçœ‹å“ªå€‹ç®—æ³•çš„ç¸½regretå¢žé•·æœ€æ…¢ï¼Œé‚£ä¹ˆå“ªå€‹ç®—æ³•çš„æ•ˆæžœå°±æ˜¯æ¯”è¼ƒå¥½çš„ã€‚

3.2Betaåˆ†å¸ƒ

æœ‰é—œBetaåˆ†å¸ƒï¼Œå¯ä»¥åƒè€ƒå¸–åï¼šhttps://www.zhihu.com/question/30269898ã€‚é€™é‡Œåªåšä¸€å€‹ç°¡å–®çš„ä»‹ç´¹ã€‚betaåˆ†å¸ƒå¯ä»¥çœ‹ä½œä¸€å€‹æ¦‚çŽ‡çš„æ¦‚çŽ‡åˆ†å¸ƒã€‚å®ƒæ˜¯å°äºŒé …åˆ†å¸ƒä¸æˆåŠŸæ¦‚çŽ‡pçš„æ¦‚çŽ‡åˆ†å¸ƒçš„æè¿°ã€‚å®ƒçš„å½¢å¼å¦‚ä¸‹ï¼š

å…¶ä¸ï¼Œaå’Œbåˆ†åˆ¥ä»£è¡¨åœ¨a+bæ¬¡ä¼¯åŠªåˆ©è©¦é©—ä¸æˆåŠŸå’Œå¤±æ•—çš„æ¬¡æ•¸(shÃ¹)ã€‚æˆ‘å€‘ç”¨ä¸‹é¢çš„åœ–ä¾†èªªæ˜Žä¸€ä¸‹Betaåˆ†å¸ƒçš„å«ç¾©ï¼š

ä¸Šåœ–ä¸ä¸€å…±æœ‰ä¸‰æ¢ç·šï¼Œæˆ‘å€‘å¿½ç•¥ä¸é–“çš„ä¸€æ¢ç·šï¼Œç¬¬ä¸€æ¢ç·šä¸a=81ï¼Œb=219ã€‚ä¹Ÿå°±æ˜¯èªªåœ¨æˆ‘å€‘é€²è¡Œäº†300æ¬¡ä¼¯åŠªåˆ©è©¦é©—ä¸ï¼ŒæˆåŠŸ81æ¬¡ï¼Œå¤±æ•—219æ¬¡çš„æƒ…æ³ä¸‹ï¼ŒæˆåŠŸæ¦‚çŽ‡pçš„ä¸€å€‹åˆ†å¸ƒï¼Œå¯ä»¥çœ‹åˆ°ï¼Œpçš„æ¦‚çŽ‡åœ¨0.27å·¦å³æ¦‚çŽ‡æœ€å¤§ï¼Œä½†æˆ‘å€‘ä¸èƒ½èªªæˆåŠŸçš„æ¦‚çŽ‡å°±æ˜¯0.27ï¼Œé€™ä¹Ÿå°±æ˜¯é »çŽ‡æ´¾å’Œè²è‘‰æ–¯æ´¾çš„å€(qÅ«)åˆ¥ï¼Œå“ˆå“ˆã€‚æ¤æ™‚ï¼Œæˆ‘å€‘åˆåšäº†300æ¬¡è©¦é©—ï¼Œæ¤æ™‚åœ¨ç¸½å…±600æ¬¡ä¼¯åŠªåˆ©è©¦é©—ä¸ï¼ŒæˆåŠŸäº†181æ¬¡ï¼Œå¤±æ•—äº†419æ¬¡ï¼Œæ¤æ™‚æˆåŠŸæ¦‚çŽ‡pçš„æ¦‚çŽ‡åˆ†å¸ƒè®Šå‘³äº†è—è‰²çš„ç·šï¼Œåœ¨0.3å·¦å³æ¦‚çŽ‡æœ€å¤§ã€‚

4ã€ç¶“(jÄ«ng)å…¸Banditç®—æ³•åŽŸç†åŠå¯¦ç¾(xiÃ n)

ä¸‹æ–‡ä¸çš„æ”¶ç›Šå¯ä»¥ç†è§£ç‚ºè€è™Žæ©ŸåéŒ¢çš„è§€æ¸¬æ¦‚çŽ‡ã€‚

4.1æ¨¸ç´ Banditç®—æ³•

å…ˆéš¨æ©Ÿè©¦è‹¥å¹²æ¬¡ï¼Œè¨ˆç®—æ¯å€‹è‡‚çš„å¹³å‡æ”¶ç›Šï¼Œä¸€ç›´é¸å‡å€¼æœ€å¤§é‚£å€‹è‡‚ã€‚

4.2Epsilon-Greedyç®—æ³•

é¸ä¸€å€‹(0,1)ä¹‹é–“è¼ƒå°çš„æ•¸(shÃ¹)epsilonï¼Œæ¯æ¬¡ä»¥epsilonçš„æ¦‚çŽ‡åœ¨æ‰€æœ‰è‡‚ä¸éš¨æ©Ÿé¸ä¸€å€‹ã€‚ä»¥1-epsilonçš„æ¦‚çŽ‡é¸æ“‡æˆªæ¢ç•¶å‰ï¼Œå¹³å‡æ”¶ç›Šæœ€å¤§çš„é‚£å€‹è‡‚ã€‚æ ¹æ“š(jÃ¹)é¸æ“‡è‡‚çš„å›žå ±å€¼ä¾†å°å›žå ±æœŸæœ›é€²è¡Œæ›´æ–°ã€‚

é€™é‡Œepsilonçš„å€¼å¯ä»¥æŽ§åˆ¶å°exploitå’Œexploreçš„åå¥½ç¨‹åº¦ï¼Œæ¯æ¬¡æ±ºç–ä»¥æ¦‚çŽ‡ÎµåŽ»å‹˜æŽ¢Explorationï¼Œ1-Îµçš„æ¦‚çŽ‡ä¾†é–‹ç™¼(fÄ)Exploitationï¼ŒåŸºäºŽé¸æ“‡çš„itemåŠå›žå ±ï¼Œæ›´æ–°itemçš„å›žå ±æœŸæœ›ã€‚

å°äºŽEpsilon-Greedyç®—æ³•ä¾†é¦–ï¼Œèƒ½å¤ æ‡‰å°è®ŠåŒ–ï¼Œå³å¦‚æžœitemçš„å›žå ±ç™¼(fÄ)ç”Ÿè®ŠåŒ–ï¼Œèƒ½åŠæ™‚æ”¹è®Šç–ç•¥ï¼Œé¿å…å¡åœ¨æ¬¡å„ª(yÅu)ç‹€æ…‹(tÃ i)ã€‚åŒæ™‚Epsilonçš„å€¼å¯ä»¥æŽ§åˆ¶å°Exploitå’ŒExploreçš„åå¥½ç¨‹åº¦ã€‚è¶ŠæŽ¥è¿‘0ï¼Œè¶Šä¿å®ˆï¼Œåªæƒ³èŠ±éŒ¢ä¸æƒ³æŽ™éŒ¢ã€‚ä½†æ˜¯ç–ç•¥é‹è¡Œä¸€æ®µæ™‚é–“åŽï¼Œæˆ‘å€‘å·²ç¶“(jÄ«ng)å°å„itemæœ‰äº†ä¸€å®šç¨‹åº¦äº†è§£ï¼Œä½†æ²’ç”¨åˆ©ç”¨é€™äº›ä¿¡æ¯ï¼Œä»ç„¶ä¸åšä»»ä½•å€(qÅ«)åˆ†åœ°éš¨æ©ŸExplorationï¼Œé€™æ˜¯Epsilon-Greedyç®—æ³•çš„ç¼ºé»žã€‚

4.3Thompsonsamplingç®—æ³•

Thompsonsamplingç®—æ³•ç”¨åˆ°äº†Betaåˆ†å¸ƒï¼Œè©²æ–¹æ³•å‡è¨æ¯å€‹è€è™Žæ©Ÿéƒ½æœ‰ä¸€å€‹åéŒ¢çš„æ¦‚çŽ‡pï¼ŒåŒæ™‚è©²æ¦‚çŽ‡pçš„æ¦‚çŽ‡åˆ†å¸ƒç¬¦åˆbeta(wins,lose)åˆ†å¸ƒï¼Œæ¯å€‹è‡‚éƒ½ç¶è·ä¸€å€‹betaåˆ†å¸ƒçš„åƒæ•¸(shÃ¹)ï¼Œå³wins,loseã€‚æ¯æ¬¡è©¦é©—åŽï¼Œé¸ä¸ä¸€å€‹è‡‚ï¼Œæ–ä¸€ä¸‹ï¼Œæœ‰æ”¶ç›Šå‰‡è©²è‡‚çš„winså¢žåŠ 1ï¼Œå¦å‰‡è©²è‡‚çš„loseå¢žåŠ 1ã€‚

æ¯æ¬¡é¸æ“‡è‡‚çš„æ–¹å¼æ˜¯ï¼šç”¨æ¯å€‹è‡‚ç¾(xiÃ n)æœ‰çš„betaåˆ†å¸ƒç”¢(chÇŽn)ç”Ÿä¸€å€‹éš¨æ©Ÿæ•¸(shÃ¹)bï¼Œé¸æ“‡æ‰€æœ‰è‡‚ç”¢(chÇŽn)ç”Ÿçš„éš¨æ©Ÿæ•¸(shÃ¹)ä¸æœ€å¤§çš„é‚£å€‹è‡‚åŽ»æ–ã€‚

4.4UCBç®—æ³•

å‰é¢æåˆ°äº†ï¼ŒEpsilon-Greedyç®—æ³•åœ¨æŽ¢ç´¢çš„æ™‚å€™ï¼Œæ‰€æœ‰çš„è€è™Žæ©Ÿéƒ½æœ‰åŒæ¨£çš„æ¦‚çŽ‡è¢«é¸ä¸ï¼Œé€™å…¶å¯¦æ²’æœ‰å……åˆ†åˆ©ç”¨æ·å²ä¿¡æ¯ï¼Œæ¯”å¦‚æ¯å€‹è€è™Žæ©Ÿä¹‹å‰æŽ¢ç´¢çš„æ¬¡æ•¸(shÃ¹)ï¼Œæ¯å€‹è€è™Žæ©Ÿä¹‹å‰çš„æŽ¢ç´¢ä¸åéŒ¢çš„é »çŽ‡ã€‚

é‚£æˆ‘å€‘æ€Žä¹ˆèƒ½å¤ å……åˆ†åˆ©ç”¨æ·å²ä¿¡æ¯å‘¢ï¼Ÿé¦–å…ˆï¼Œæ ¹æ“š(jÃ¹)ç•¶å‰è€è™Žæ©Ÿå·²ç¶“(jÄ«ng)æŽ¢ç´¢çš„æ¬¡æ•¸(shÃ¹)ï¼Œä»¥åŠåéŒ¢çš„æ¬¡æ•¸(shÃ¹)ï¼Œæˆ‘å€‘å¯ä»¥è¨ˆç®—å‡ºç•¶å‰æ¯å€‹è€è™Žæ©ŸåéŒ¢çš„è§€æ¸¬æ¦‚çŽ‡p'ã€‚åŒæ™‚ï¼Œç”±äºŽè§€æ¸¬æ¬¡æ•¸(shÃ¹)æœ‰é™ï¼Œå› æ¤è§€æ¸¬æ¦‚çŽ‡å’ŒçœŸå¯¦æ¦‚çŽ‡pä¹‹é–“ç¸½æœƒæœ‰ä¸€å®šçš„å·®å€¼?ï¼Œå³p'-?<=p<=p'+?ã€‚

åŸºäºŽä¸Šé¢çš„è¨Žè«–ï¼Œæˆ‘å€‘å¾—åˆ°äº†å¦ä¸€ç¨®å¸¸ç”¨çš„Banditç®—æ³•ï¼šUCB(UpperConfidenceBound)ç®—æ³•ã€‚è©²ç®—æ³•åœ¨æ¯æ¬¡æŽ¨è–¦æ™‚ï¼Œç¸½æ˜¯æ¨‚è§€çš„èªç‚ºæ¯å€‹è€è™Žæ©Ÿèƒ½å¤ å¾—åˆ°çš„æ”¶ç›Šæ˜¯p'+?ã€‚

å¥½äº†ï¼ŒæŽ¥ä¸‹ä¾†çš„å•é¡Œå°±æ˜¯è§€æ¸¬æ¦‚çŽ‡å’ŒçœŸå¯¦æ¦‚çŽ‡ä¹‹é–“çš„å·®å€¼?å¦‚ä½•è¨ˆç®—äº†ï¼Œæˆ‘å€‘é¦–å…ˆæœ‰å…©å€‹ç›´è§€çš„ç†è§£ï¼š1ï¼‰å°äºŽé¸ä¸çš„è€è™Žæ©Ÿï¼Œå¤šç²å¾—ä¸€æ¬¡åé¥‹æœƒä½¿?è®Šå°ï¼Œç•¶åé¥‹ç„¡çª®å¤šæ™‚ï¼Œ?è¶¨è¿‘äºŽ0ï¼Œæœ€çµ‚æœƒå°äºŽå…¶ä»–æ²’æœ‰è¢«é¸ä¸çš„è€è™Žæ©Ÿçš„?ã€‚2ï¼‰å°äºŽæ²’æœ‰è¢«é¸ä¸çš„è€è™Žæ©Ÿï¼Œ?æœƒéš¨è‘—è¼ªæ•¸(shÃ¹)çš„å¢žå¤§è€Œå¢žåŠ ï¼Œæœ€çµ‚æœƒå¤§äºŽå…¶ä»–è¢«é¸ä¸çš„è€è™Žæ©Ÿã€‚

å› æ¤ï¼Œç•¶é€²è¡Œäº†ä¸€å®šçš„è¼ªæ•¸(shÃ¹)çš„æ™‚å€™ï¼Œæ¯å€‹è€è™Žæ©Ÿéƒ½æœ‰æ©Ÿæœƒå¾—åˆ°æŽ¢ç´¢çš„æ©Ÿæœƒã€‚UCBç®—æ³•ä¸p'+?çš„è¨ˆç®—å…¬å¼å¦‚ä¸‹ï¼š

å…¶ä¸åŠ è™Ÿå‰é¢æ˜¯ç¬¬jå€‹è€è™Žæ©Ÿåˆ°ç›®å‰çš„æ”¶ç›Šå‡å€¼ï¼ŒåŽé¢çš„å«åšbonusï¼Œæœ¬è³ª(zhÃ¬)ä¸Šæ˜¯å‡å€¼çš„æ¨™æº–å·®ï¼ŒTæ˜¯ç›®å‰çš„è©¦é©—æ¬¡æ•¸(shÃ¹)ï¼Œnæ˜¯è©²è€è™Žæ©Ÿè¢«è©¦æ¬¡æ•¸(shÃ¹)ã€‚

ç‚ºä»€ä¹ˆé¸æ“‡ä¸Šé¢å½¢å¼çš„?å‘¢ï¼Œé‚„å¾—å¾žChernoff-HoeffdingBoundèªªèµ·ï¼š

å› æ¤(ä¸‹é¢çš„æˆªåœ–ä¾†è‡ªäºŽçŸ¥ä¹Žhttps://zhuanlan.zhihu.com/p/32356077)ï¼š

5ã€ä»£ç¢¼å¯¦ç¾(xiÃ n)

æŽ¥ä¸‹ä¾†ï¼Œæˆ‘å€‘ä¾†å¯¦ç¾(xiÃ n)å…©å€‹åŸºæœ¬çš„Banditç®—æ³•ï¼ŒUCBå’ŒThompsonsamplingç®—æ³•ã€‚

5.1UCBç®—æ³•

ä»£ç¢¼ä¸æœ‰è©³ç´°çš„æ³¨é‡‹ï¼Œæ‰€ä»¥æˆ‘ç›´æŽ¥è²¼å®Œæ•´çš„ä»£ç¢¼äº†ï¼š

importnumpyasnpT=1000#Tè¼ªè©¦é©—N=10#Nå€‹è€è™Žæ©Ÿtrue_rewards=np.random.uniform(low=0,high=1,size=N)#æ¯å€‹è€è™Žæ©ŸçœŸå¯¦çš„åéŒ¢æ¦‚çŽ‡estimated_rewards=np.zeros(N)#æ¯å€‹è€è™Žæ©ŸåéŒ¢çš„è§€æ¸¬æ¦‚çŽ‡ï¼Œåˆå§‹éƒ½ç‚º0chosen_count=np.zeros(N)#æ¯å€‹è€è™Žæ©Ÿç•¶å‰å·²ç¶“(jÄ«ng)æŽ¢ç´¢çš„æ¬¡æ•¸(shÃ¹)ï¼Œåˆå§‹éƒ½ç‚º0total_reward=0#è¨ˆç®—deltadefcalculate_delta(T,item):ifchosen_count[item]==0:return1else:returnnp.sqrt(2*np.log(T)/chosen_count[item])#è¨ˆç®—æ¯å€‹è€è™Žæ©Ÿçš„p+deltaï¼ŒåŒæ™‚åšå‡ºé¸æ“‡defUCB(t,N):upper_bound_probs=[estimated_rewards[item]+calculate_delta(t,item)foriteminrange(N)]item=np.argmax(upper_bound_probs)reward=np.random.binomial(n=1,p=true_rewards[item])returnitem,rewardfortinrange(1,T):#ä¾æ¬¡é€²è¡ŒTæ¬¡è©¦é©—#é¸æ“‡ä¸€å€‹è€è™Žæ©Ÿï¼Œå¹¶å¾—åˆ°æ˜¯å¦åéŒ¢çš„çµ(jiÃ©)æžœitem,reward=UCB(t,N)total_reward+=reward#ä¸€å…±æœ‰å¤šå°‘å®¢äººæŽ¥å—äº†æŽ¨è–¦#æ›´æ–°æ¯å€‹è€è™Žæ©Ÿçš„åéŒ¢æ¦‚çŽ‡estimated_rewards[item]=((t-1)*estimated_rewards[item]+reward)/tchosen_count[item]+=1

5.2Thompsonsamplingç®—æ³•

Thompsonsamplingç®—æ³•æ¶‰åŠåˆ°äº†betaåˆ†å¸ƒï¼Œå› æ¤æˆ‘å€‘ä½¿ç”¨pymcåº«ä¾†ç”¢(chÇŽn)ç”Ÿæœå¾žbetaåˆ†å¸ƒçš„éš¨æ©Ÿæ•¸(shÃ¹)ï¼Œåªéœ€è¦ä¸€è¡Œä»£ç¢¼å°±èƒ½åœ¨é¸æ“‡åˆé©çš„è€è™Žæ©Ÿã€‚

np.argmax(pymc.rbeta(1+successes,1+totals-successes))

æ¨™ç°½ï¼š

0

åˆ†äº«åˆ°ï¼š

ä¸Šä¸€ç¯‡ï¼šå¾®è»Ÿæ–°çš„æ©Ÿå™¨å¸ç¿’æ¡†æž¶æ ¸å¿ƒç”¢(chÇŽn)...

ä¸‹ä¸€ç¯‡ï¼šæ·ºæžäº¤æµæŽ¥è§¸å™¨é‹ç”¨IT7300äº¤...

ä¸åœ‹å‚³å‹•ç¶²(wÇŽng)ç‰ˆæ¬Š(quÃ¡n)èˆ‡å…è²¬è²æ˜Žï¼šå‡¡æœ¬ç¶²(wÇŽng)æ³¨æ˜Ž[ä¾†æºï¼šä¸åœ‹å‚³å‹•ç¶²(wÇŽng)]çš„æ‰€æœ‰æ–‡å—ã€åœ–ç‰‡ã€éŸ³è¦–å’Œè¦–é »æ–‡ä»¶ï¼Œç‰ˆæ¬Š(quÃ¡n)å‡ç‚ºä¸åœ‹å‚³å‹•ç¶²(wÇŽng)(www.hysjfh.com)ç¨å®¶æ‰€æœ‰ã€‚å¦‚éœ€è½‰(zhuÇŽn)è¼‰è«‹èˆ‡0755-82949061è¯(liÃ¡n)ç³»ã€‚ä»»ä½•åª’é«”ã€ç¶²(wÇŽng)ç«™æˆ–å€‹äººè½‰(zhuÇŽn)è¼‰ä½¿ç”¨æ™‚é ˆæ³¨æ˜Žä¾†æºâ€œä¸åœ‹å‚³å‹•ç¶²(wÇŽng)â€ï¼Œé•åè€…æœ¬ç¶²(wÇŽng)å°‡è¿½ç©¶å…¶æ³•å¾‹è²¬ä»»ã€‚

æœ¬ç¶²(wÇŽng)è½‰(zhuÇŽn)è¼‰å¹¶æ³¨æ˜Žå…¶ä»–ä¾†æºçš„ç¨¿ä»¶ï¼Œå‡ä¾†è‡ªäº’è¯(liÃ¡n)ç¶²(wÇŽng)æˆ–æ¥(yÃ¨)å…§(nÃ¨i)æŠ•ç¨¿äººå£«ï¼Œç‰ˆæ¬Š(quÃ¡n)å±¬äºŽåŽŸç‰ˆæ¬Š(quÃ¡n)äººã€‚è½‰(zhuÇŽn)è¼‰è«‹ä¿ç•™ç¨¿ä»¶ä¾†æºåŠä½œè€…ï¼Œç¦æ¢æ“…è‡ªç¯¡æ”¹ï¼Œé•è€…è‡ªè² ç‰ˆæ¬Š(quÃ¡n)æ³•å¾‹è²¬ä»»ã€‚

ç›¸é—œè³‡è¨Š

å·¥æŽ§è¨ˆç®—æ©Ÿè»Ÿä»¶æŠ—å¹²æ“¾æŠ€è¡“

æŠ€è¡“ç†±é»ž

ç”¢(chÇŽn)å“æ–°èž

æ›´å¤š>

æŽ¨è–¦å°ˆé¡Œ

æ›´å¤š>

æŠ€è¡“è¦–é »

æ›´å¤š>

ç¶²(wÇŽng)ç«™ç°¡ä»‹|æœƒå“¡æœå‹™|è¯(liÃ¡n)ç³»æ–¹å¼|å¹«åŠ©ä¿¡æ¯|ç‰ˆæ¬Š(quÃ¡n)ä¿¡æ¯|ç¶²(wÇŽng)ç«™åœ°åœ–|å‹æƒ…éˆæŽ¥|æ³•å¾‹æ”¯æŒ|æ„è¦‹åé¥‹|sitemap

å‚³å‹•ç¶²(wÇŽng)-å·¥æ¥(yÃ¨)è‡ªå‹•åŒ–èˆ‡æ™ºèƒ½åˆ¶é€ çš„å…¨åª’é«”â€œäº’è¯(liÃ¡n)ç¶²(wÇŽng)+â€å‰µ(chuÃ ng)æ–°æœå‹™å¹³è‡º

ç¶²(wÇŽng)ç«™å®¢æœæœå‹™å’¨è©¢é‡‡è³¼å’¨è©¢åª’é«”åˆä½œ

Chuandong.com Copyright ?2005 - 2025 ï¼ŒAll Rights Reserved æ·±åœ³å¸‚å¥§ç¾Žå¤§å”å»£å‘Šæœ‰é™å…¬å¸ ç‰ˆæ¬Š(quÃ¡n)æ‰€æœ‰
ç²µICPå‚™ 14004826è™Ÿ | ç‡Ÿæ¥(yÃ¨)åŸ·(zhÃ)ç…§è‰æ›¸ | ä¸è‰¯ä¿¡æ¯èˆ‰å ±ä¸å¿ƒ | ç²µå…¬ç¶²(wÇŽng)å®‰å‚™ 44030402000946è™Ÿ

ä¸»ç«™èœ˜è››æ± æ¨¡æ¿ï¼š çŸ³é—¨åŽ¿| è¥¿è—| æ°¸åº·å¸‚| å…´æ–‡åŽ¿| æ™´éš†åŽ¿| å…´ä¸šåŽ¿| ä¸Šæž—åŽ¿| æ™¯ä¸œ| ä¹é¾™å¡åŒº| ç±³è„‚åŽ¿| é«˜å°åŽ¿| ä¹æ±Ÿå¸‚| è¾¾å·žå¸‚| å—å¬åŽ¿| å…æžç‰¹åŒº| å¾é—»åŽ¿| æ–°é‡ŽåŽ¿| é€šå±±åŽ¿| å¤§è‹±åŽ¿| æ™®å…°åº—å¸‚| ä¸œæ˜ŽåŽ¿| å˜‰é±¼åŽ¿| çµå·åŽ¿| ä¸¹é˜³å¸‚| ä½›å¦| ä¹Œæ°åŽ¿| å®‰å²³åŽ¿| é¾™äº•å¸‚| æ¶žæºåŽ¿| å‡¤å‡°åŽ¿| æœ¨é‡Œ| é“œå±±åŽ¿| æ –éœžå¸‚| æ˜Œéƒ½åŽ¿| å¢¨çŽ‰åŽ¿| å¤§ååŽ¿| é¢å°”å¤çº³å¸‚| èµ¤å³°å¸‚| è½®å°åŽ¿| æ™‹å®åŽ¿| ç¢å®åŽ¿|

<center id="woiii"></center>

<table id="woiii"><center id="woiii"></center></table>