当前位置: 首页 >> 教师风采 >> 进德修业

华附“博士论坛”系列4:数学博士朱果专场

发布人:李之宁    |    来自:科研与教师发展处    |    2025-05-21


强化学习:让AI通过“试错”自主学习

——华南师大附中“博士论坛”系列4开讲

     

      2025年5月14日,第4期“博士论坛”活动在华南师大附中的石牌校区圆满落幕。本次活动由数学科教师朱果博士担任主讲嘉宾,他以“强化学习:让AI通过“试错”自主学习”为题,为同学们分享了一场深入浅出的知识盛宴。

图片8.png


  从横扫游戏的AlphaGo到自动驾驶,强化学习(RL)正掀起人工智能新浪潮!本讲座将带你穿越机器学习的进化史——从传统算法的“死记硬背”到深度学习的“抽象理解”,最终抵达强化学习的“自主决策”。通过有趣的视频,直观感受RL如何通过奖励机制让AI像宠物般学会“做对动作有零食吃”。

朱老师的讲座先介绍了机器学习的概况,以判断西瓜是否甜和小狗图像识别两个例子介绍了有监督学习,以聚类算法应用于异常识别的例子介绍了无监督学习。接着通过一个生动有趣的视频介绍了强化学习,以篮球比赛,王者荣耀游戏,围棋三个例子介绍强化学习的基本内容。然后以“多臂老虎机”模拟游戏这个最简单的学习任务,展示AI如何在未知收益的拉杆中,通过“探索与利用”平衡策略实现收益最大化。最后讲座介绍了强化学习在各行各业中的应用,让同学们对智能时代有更清晰的认识与规划。

图片9.png


  讲座以AI学习井字棋为例,讲解了强化学习算法的底层逻辑,让同学们了解到强化学习的本质是数学,概率与优化等知识的综合应用。

图片10.png


  讲座分享了强化学习在各行各业的应用,也介绍了当前AI领域的发展方向,鼓励同学们打好基础,为人类科技发展添砖加瓦。

  活动结束后,学生们纷纷表示受益匪浅。以下是部分学生的感想:

图片11.png

 

图片12.png

 

图片13.png

 

图片16.png



文字:博士工作站

图片:游江涛

初审:李之宁  

复审:贺建  

终审:肖朝云