PyTorch 食谱
PyTorch 简介
torch.autograd
学习 PyTorch
non_blocking
pin_memory()
图像和视频
音频
后端
强化学习
在生产环境中部署PyTorch模型
分析 PyTorch
使用FX进行代码转换
前端API
扩展 PyTorch
模型优化
torch.compile
并行和分布式训练
使用ExecuTorch的边缘
推荐系统
多模态
Recipes 是简短、可操作的示例,展示了如何使用特定的 PyTorch 功能,与我们的完整教程不同。
学习如何使用PyTorch的torch.nn包为MNIST数据集创建和定义神经网络。
基础
了解如何在PyTorch中使用state_dict对象和Python字典来保存或加载模型。
基础知识
了解在PyTorch中保存和加载模型以进行推理的两种方法 - 通过state_dict和通过整个模型。
保存和加载用于推理或恢复训练的通用检查点模型有助于从上次停止的地方继续。在本教程中,探索如何保存和加载多个检查点。
在本教程中,学习如何保存和加载多个模型可以帮助重用您之前训练过的模型。
学习如何通过部分加载模型或加载部分模型来预热训练过程,这可以帮助您的模型比从头开始训练更快地收敛。
了解如何使用PyTorch相对简单地跨设备(CPU和GPU)保存和加载模型。
了解何时应该清零梯度以及这样做如何帮助提高模型的准确性。
学习如何使用 PyTorch 的基准测试模块来测量和比较代码的性能
学习如何测量代码片段的运行时间并收集指令。
学习如何使用PyTorch的分析器来测量操作符的时间和内存消耗
学习如何使用PyTorch的分析器与仪器和追踪技术API(ITT API)在Intel® VTune™ Profiler GUI中可视化操作符标签
学习如何使用 torch.compile IPEX 后端
学习如何使用元设备来推理模型中的形状。
学习从检查点加载nn.Module的技巧。
学习如何使用torch日志API来观察编译过程。
nn.Module 中的新扩展点。
学习如何使用 AOTInductor 进行 Python 运行时的端到端示例。
学习如何使用Captum将图像分类器的预测归因于其相应的图像特征,并可视化归因结果。
可解释性,Captum
学习TensorBoard与PyTorch的基本用法,以及如何在TensorBoard UI中可视化数据
可视化,TensorBoard
将动态量化应用于一个简单的LSTM模型。
量化,文本,模型优化
学习如何以TorchScript格式导出您训练好的模型,以及如何在C++中加载您的TorchScript模型并进行推理。
TorchScript
学习如何使用Flask,一个轻量级的Web服务器,从你训练好的PyTorch模型快速设置一个Web API。
生产环境,TorchScript
在移动设备(Android 和 iOS)上使用 PyTorch 进行性能优化的指南列表。
移动设备,模型优化
学习如何从头开始制作使用LibTorch C++ API并使用带有自定义C++操作符的TorchScript模型的Android应用程序。
移动
学习如何将一系列 PyTorch 模块融合成一个模块,以在量化前减少模型大小。
移动端
学习如何在不损失太多准确性的情况下减少模型大小并使其运行更快。
移动设备,量化
学习如何将模型转换为TorchScript并(可选)为移动应用程序进行优化。
学习如何在 iOS 项目中添加模型并使用 PyTorch pod 进行 iOS 开发。
学习如何在 Android 项目中添加模型并使用 PyTorch 库进行 Android 开发。
学习如何在iOS和Android设备上使用移动解释器。
如何使用PyTorch分析器来分析基于RPC的工作负载。
生产
使用 torch.cuda.amp 来减少运行时间并节省 NVIDIA GPU 上的内存。
实现最佳性能的技巧。
如何在Intel® Xeon CPU上使用run_cpu脚本以获得最佳运行时配置。
在AWS Graviton CPU上实现最佳推理性能的技巧
学习如何利用英特尔® 高级矩阵扩展。
使用 torch.compile 加速优化器
使用LRScheduler和torch.compiled优化器加速训练
学习如何使用用户定义的内核与``torch.compile``
学习如何在``torch.compile``中配置编译时缓存
学习如何使用区域编译来控制冷启动编译时间
Intel® PyTorch* 扩展介绍
使用Intel® Neural Compressor轻松实现PyTorch量化。
量化,模型优化
学习如何使用DeviceMesh
分布式训练
如何使用ZeroRedundancyOptimizer减少内存消耗。
如何使用RPC进行直接GPU到GPU通信。
如何为分布式优化器启用TorchScript支持。
分布式训练,TorchScript
学习如何使用分布式检查点包对分布式模型进行检查点操作。
学习如何为 DTensors 使用 CommDebugMode
学习如何使用TorchServe在Vertex AI中部署模型
为了分析流量并优化您的体验,我们在本网站上使用cookies。通过点击或浏览,您同意我们使用cookies。作为本网站的当前维护者,Facebook的Cookies政策适用。了解更多信息,包括可用的控制选项:Cookies Policy。