强化学习:让AI通过“试错”自主学习
——华南师大附中“博士论坛”系列4开讲
2025年5月14日,第4期“博士论坛”活动在华南师大附中的石牌校区圆满落幕。本次活动由数学科教师朱果博士担任主讲嘉宾,他以“强化学习:让AI通过“试错”自主学习”为题,为同学们分享了一场深入浅出的知识盛宴。

从横扫游戏的AlphaGo到自动驾驶,强化学习(RL)正掀起人工智能新浪潮!本讲座将带你穿越机器学习的进化史——从传统算法的“死记硬背”到深度学习的“抽象理解”,最终抵达强化学习的“自主决策”。通过有趣的视频,直观感受RL如何通过奖励机制让AI像宠物般学会“做对动作有零食吃”。
朱老师的讲座先介绍了机器学习的概况,以判断西瓜是否甜和小狗图像识别两个例子介绍了有监督学习,以聚类算法应用于异常识别的例子介绍了无监督学习。接着通过一个生动有趣的视频介绍了强化学习,以篮球比赛,王者荣耀游戏,围棋三个例子介绍强化学习的基本内容。然后以“多臂老虎机”模拟游戏这个最简单的学习任务,展示AI如何在未知收益的拉杆中,通过“探索与利用”平衡策略实现收益最大化。最后讲座介绍了强化学习在各行各业中的应用,让同学们对智能时代有更清晰的认识与规划。

讲座以AI学习井字棋为例,讲解了强化学习算法的底层逻辑,让同学们了解到强化学习的本质是数学,概率与优化等知识的综合应用。

讲座分享了强化学习在各行各业的应用,也介绍了当前AI领域的发展方向,鼓励同学们打好基础,为人类科技发展添砖加瓦。
活动结束后,学生们纷纷表示受益匪浅。以下是部分学生的感想:
文字:博士工作站
图片:游江涛
初审:李之宁
复审:贺建
终审:肖朝云