首页速度优化绝顶感官盛宴：当“速度”与“极致”在磨朵的数字荒原巅峰相遇

网站优化

“hlw里不卖药，千万你知道”——守护健康，理性选择的智慧之光

差差差差30差差差差：一场关于“不完美”的极致告白

2026-06-08 22:41:53

阅读时长:3分钟

562次阅读

核心内容摘要

metcn：不止于探索，更是连接未来的数字脉搏

前言在深度学习的科研与工程落地中我们既需要PyTorch式的灵活性动态图调试又渴望TensorFlow式的极致性能静态图部署。

MindSpore作为全场景AI框架通过PyNative模式和Graph模式的无缝切换解决了这一痛点。

但在实际开发中很多从其他框架转来的开发者在使用MindSpore进行自定义训练循环Custom Training Loop时往往因为没有正确利用JIT编译和函数式变换导致无法完全释放昇腾NPU的算力。

本文将摒弃繁琐的理论直接通过代码实战带你构建一个高效、可微分、运行在Graph模式下的自定义训练流程。

核心概念为何需要value_and_grad和jit在MindSpore中自动微分采用的是基于源码转换Source Code Transformation, SCT的机制。

与PyTorch的.backward()累积梯度不同MindSpore更推崇函数式编程。

**ops.value_and_grad**同时计算正向网络的输出Loss和关于权重的梯度。

这是编写自定义训练步的核心。

**jit(原ms_function)**这是性能的关键。

它将Python函数编译成静态计算图并下沉到Ascend芯片上运行大幅减少Host-Device交互开销。

实战演练构建高效训练步假设我们已经定义好了一个简单的网络Net和数据集Dataset。

我们将重点放在如何手写一个高性能的训练步骤Train Step。

环境准备与基础定义首先确保上下文环境指向Ascend并定义好网络与损失函数。

import mindspore as ms from mindspore import nn, ops, Tensor from mindspore import dtype as mstype # 设置运行环境为昇腾NPU模式为PyNative以便于调试最后我们会通过装饰器加速 ms.set_context(modems.PYNATIVE_MODE, device_targetAscend) # 模拟一个简单的线性网络 class SimpleNet(nn.Cell): def __init__(self): super(SimpleNet, self).__init__() self.fc nn.Dense(10,

def construct(self, x): return self.fc(x) # 初始化 net SimpleNet() loss_fn nn.MSELoss() optimizer nn.Momentum(net.trainable_params(), learning_rate

01, momentum

0.

9)

定义前向计算函数在MindSpore的函数式微分中我们需要定义一个纯粹的前向计算函数该函数输入数据和标签输出Loss。

def forward_fn(data, label): # 前向计算 logits net(data) # 计算损失 loss loss_fn(logits, label) return loss, logits

获取梯度计算函数这是最关键的一步。

我们使用ops.value_and_grad来生成一个可以计算梯度的函数。

fn: 指定前向函数。

grad_position: 指定对哪些输入求导这里设为None因为我们只对权重求导。

weights: 指定需要更新的权重参数即网络的trainable_params。

has_aux: 如果forward_fn返回除loss外的其他输出如上面的logits需设为True。

# 定义梯度变换函数 grad_fn ops.value_and_grad(forward_fn, None, optimizer.parameters, has_auxTrue)

封装训练步并开启图模式加速现在我们将前向计算、梯度计算、优化器更新封装在一个函数中。

为了在Ascend NPU上获得最佳性能我们必须在该函数上添加jit装饰器。

这个装饰器会触发MindSpore的编译器将Python代码编译成可以在CANN层高效执行的静态图。

ms.jit # --- 核心开启图模式加速算子下沉 def train_step(data, label): #

计算Loss和梯度 (loss, _), grads grad_fn(data, label) #

优化器更新权重 # 注意在函数式编程中优化器通常作为算子使用 loss ops.depend(loss, optimizer(grads)) return loss技术TIPSops.depend是一个控制依赖关系的算子。

它保证了在返回loss之前optimizer(grads)这一步操作一定已经被执行。

这在静态图优化中非常重要防止编译器因为“输出不依赖于更新操作”而将更新步骤优化掉。

完整的训练循环最后我们模拟数据输入运行训练循环。

import numpy as np # 模拟数据 def get_batch_data(): x Tensor(np.random.randn(32,

.astype(np.float

) y Tensor(np.random.randn(32,

.astype(np.float

) return x, y # 开始训练 epochs 5 print(Start training on Ascend...) for epoch in range(epochs): x, y get_batch_data() # 执行编译后的静态图训练步 loss train_step(x, y) print(fEpoch: {epoch1}, Loss: {loss.asnumpy()})进阶静态图模式下的避坑指南虽然jit能带来巨大的性能提升但它对Python语法的支持是有一定限制的因为它需要将Python转译为中间表达IR。

在昇腾上开发时请注意以下几点避免使用第三方库的随机函数在jit修饰的函数内部尽量使用mindspore.ops中的算子避免使用numpy或random等库的操作因为这些操作无法被编译进图会导致回退到Host端执行阻断流水线。

控制流的限制虽然MindSpore支持控制流但过于复杂的动态条件判断依赖于Tensor值的if/else可能会导致图编译变慢。

尽量将逻辑向量化。

打印调试在图模式下直接print(tensor)可能无法按预期打印每一步的值。

如果需要调试可以使用ops.Print()算子。

Side Effects副作用如果你的函数修改了全局变量或列表这种副作用在图编译中可能不会生效。

请坚持函数式的写法输入 - 计算 - 返回。

总结在昇腾社区进行MindSpore开发时掌握ops.value_and_grad配合jit是从入门走向进阶的分水岭。

PyNative模式适合调试网络结构、验证逻辑。

Graph模式jit适合生产环境、大规模训练能充分利用Ascend 910/310的异构计算能力。

“hlw里不卖药，千万你知道”——守护健康，理性选择的智慧之光

核心内容摘要

metcn：不止于探索，更是连接未来的数字脉搏

环境准备与基础定义首先确保上下文环境指向Ascend并定义好网络与损失函数。

def construct(self, x): return self.fc(x) # 初始化 net SimpleNet() loss_fn nn.MSELoss() optimizer nn.Momentum(net.trainable_params(), learning_rate

01, momentum

定义前向计算函数在MindSpore的函数式微分中我们需要定义一个纯粹的前向计算函数该函数输入数据和标签输出Loss。

获取梯度计算函数这是最关键的一步。

封装训练步并开启图模式加速现在我们将前向计算、梯度计算、优化器更新封装在一个函数中。

计算Loss和梯度 (loss, _), grads grad_fn(data, label) #

优化器更新权重 # 注意在函数式编程中优化器通常作为算子使用 loss ops.depend(loss, optimizer(grads)) return loss技术TIPSops.depend是一个控制依赖关系的算子。

完整的训练循环最后我们模拟数据输入运行训练循环。

.astype(np.float

) y Tensor(np.random.randn(32,

.astype(np.float

总结在昇腾社区进行MindSpore开发时掌握ops.value_and_grad配合jit是从入门走向进阶的分水岭。

人马杂配mv正版观看-人马杂配mv正版观看应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

百度百家号客服电话人工服务

“hlw里不卖药，千万你知道”——守护健康，理性选择的智慧之光

核心内容摘要

metcn：不止于探索，更是连接未来的数字脉搏

环境准备与基础定义首先确保上下文环境指向Ascend并定义好网络与损失函数。

def construct(self, x): return self.fc(x) # 初始化 net SimpleNet() loss_fn nn.MSELoss() optimizer nn.Momentum(net.trainable_params(), learning_rate

01, momentum

定义前向计算函数在MindSpore的函数式微分中我们需要定义一个纯粹的前向计算函数该函数输入数据和标签输出Loss。

获取梯度计算函数这是最关键的一步。

封装训练步并开启图模式加速现在我们将前向计算、梯度计算、优化器更新封装在一个函数中。

计算Loss和梯度 (loss, _), grads grad_fn(data, label) #

优化器更新权重 # 注意在函数式编程中优化器通常作为算子使用 loss ops.depend(loss, optimizer(grads)) return loss技术TIPSops.depend是一个控制依赖关系的算子。

完整的训练循环最后我们模拟数据输入运行训练循环。

.astype(np.float

) y Tensor(np.random.randn(32,

.astype(np.float

总结在昇腾社区进行MindSpore开发时掌握ops.value_and_grad配合jit是从入门走向进阶的分水岭。

人马杂配mv正版观看-人马杂配mv正版观看应用

📑 文章目录

🔥 热门优化文章

🛠️ 实用工具推荐

相关优化文章 推荐

百度百家号客服电话人工服务

相关优化文章推荐