本发明公开一种基于深度强化学习的环境友好型微网优化调度方法及系统,涉及电力系统优化运行与调度技术领域,该方法包括:搭建包括供需预测模块、碳交易模块、电力交易模块、固碳储能模块、可控分布式电源模块的环境友好型智能微网;获取环境友好型智能微网的运行数据,以收益最大化、成本最小化、供需平衡和碳排放量最小化为综合优化目标,构建环境友好型智能微网优化调度模型;根据深度强化学习理论,采用两层多目标奖励机制和改进的随机高斯策略梯度算法优化微网运行,输出智能微网最优优化调度策略。本发明能够实现对智能微网能源的最优调度,实现微网经济效益、供需平衡和碳排放等多方面的综合优化目标。