华附“博士论坛”系列4：数学博士朱果专场-进德修业-华南师范大学附属中学-官方网站

华附“博士论坛”系列4：数学博士朱果专场

发布人：李之宁 | 来自：科研与教师发展处 | 2025-05-21

强化学习：让AI通过“试错”自主学习

——华南师大附中“博士论坛”系列4开讲

2025年5月14日，第4期“博士论坛”活动在华南师大附中的石牌校区圆满落幕。本次活动由数学科教师朱果博士担任主讲嘉宾，他以“强化学习：让AI通过“试错”自主学习”为题，为同学们分享了一场深入浅出的知识盛宴。

图片8.png

从横扫游戏的AlphaGo到自动驾驶，强化学习（RL）正掀起人工智能新浪潮！本讲座将带你穿越机器学习的进化史——从传统算法的“死记硬背”到深度学习的“抽象理解”，最终抵达强化学习的“自主决策”。通过有趣的视频，直观感受RL如何通过奖励机制让AI像宠物般学会“做对动作有零食吃”。

朱老师的讲座先介绍了机器学习的概况，以判断西瓜是否甜和小狗图像识别两个例子介绍了有监督学习，以聚类算法应用于异常识别的例子介绍了无监督学习。接着通过一个生动有趣的视频介绍了强化学习，以篮球比赛，王者荣耀游戏，围棋三个例子介绍强化学习的基本内容。然后以“多臂老虎机”模拟游戏这个最简单的学习任务，展示AI如何在未知收益的拉杆中，通过“探索与利用”平衡策略实现收益最大化。最后讲座介绍了强化学习在各行各业中的应用，让同学们对智能时代有更清晰的认识与规划。

图片9.png