MLops博客

kb88凯时开户平台实验跟踪机器学习模型管理

6分钟
10月4日2023

需要相当多步骤 机器学习模型 从思想到制作这些步骤可能太复杂,太快

文章集中解析模型部署三大方面

它们是:

文章结尾处,你将知道三相之差 和相片之差

下潜

MLOPS是什么

部署机器学习模型需要一套工具、原则和实践与DevOps相似,唯一目标就是优化软件开发项目启动方式

机器学习世界使用MLOPS通常MLOps应用DevOps原理学习机器

MLOPSMLDEVOPS

MLOps部件

单项MLOps实践可能各异,但过程需要实现几个基本部分:

  • 开发管理模型
  • 部署模型
  • 监控

现在,我们将探索MLOPs的不同部分如何协同工作以确保所有这些方面的成功本节将聚焦于它们

特征存储

中心存储器提供访问特征培训服务之所以重要,是因为

  • 帮助重用特征而不是创建新特征
  • 避免使用相似特征和不同定义
  • 允许服务特征值更新
  • 确保在模型服务期间使用培训特征

数据版化

机器学习模型总可当新数据可用时重新培训等新培训方法出现时,他们也可以接受再培训

重训练模型新数据有可能导致性能不良出现这种情况时,版本化令你回归前一模型,你就会知道哪个版本数据导致阴暗性能版本对守规和数据审核也至关重要

ML元数据存储

信息模型执行记录 帮助复制比较这有助于检测异常和调试部分资料记录包括:

  • 参数运行管道
  • 开始结束时间进程
  • 连接管道中各种文物链路
  • 指针最后训练模型
  • 模型评价测试集,以便能够与以前的模型比较
  • 造型者
  • 模型创建时
  • 特征变换应用
  • 数据集创建模型

存储模型元数据提供模型可搜索性举例说,您可以查找基于特征模型、模型类型和培训日期模型可搜索性使管理、分析、实验和跟踪多模型成为可能

模型元数据允许比较不同的模型并判定投放哪个确定团队进度 并识别可能需要更多努力的领域 也至关紧要人工跟踪所有元数据可快速变成恶梦幸运的是,你可以使用ML工具自动提取ML管道元数据并登录

ML模型管理

实践方法可以加速实验开发机器学习模型取段后,让我们研究一下它如何运作

模型服务

活动模型版可用RESTAPI目标应用mLops系统允许你下载目标设备模型其优点是模型将自动更新目标设备,只要新版本可用所以,你不需要发新版应用

也可以提供不同版本的模型,监控模型并解决最优表现者问题

模型编译

回归模式状态的能力至关重要要想实现这一点,你需要能够编译模型开发的各个方面例举 :

  • 笔记本
  • 数据集使用
  • 超参数集
  • 代码详解
  • 手工艺品

返回前模式时,需要能够独辨每个模式实例模型制作期间不能修改每种模型应不可变

改变模型同时制作可能导致意想不到行为,所以很少做版本模型比较常用, 因为它提供各种模型版本间按需切换电源

可能需要新模型版本,原因如下:

  • 模型结构变换,例如从神经网向Scikit-learn线性回归
  • 超参数修改
  • 特征添加/清除
  • 重训练模型

模型监控

机器学习模型使用后,必须监控有两个主要项目需要监控:模型流生产斜率.

模型漂移假想 预测项统计属性变化 无法预测如果训练数据和预测数据统计性能变不可测 模型性能会下降即时监控 即能捕捉并快速解决

生产斜率发生时离线模型性能与服务模型性能大相径庭这可能出自:

  • 训练中的漏洞
  • 服务执行中的错误
  • 训练数据与传递模型相矛盾

检测模型漂移和生成斜率将确保模型在生产环境实现预期效果

模型再培训

关键是要在需要时对模型重新培训, 并参考模型评价模型在新数据可用时也可以重新培训

后半部分提到,生产模型容易模型漂移和生成斜率程序发现时,模型可用新数据重训练生成系统应自动检测模型流出并发送触发模型再培训警示

AG凯时手机版说到此,有些模型可能无法改进,应放弃而不是再培训,以节省计算资源,而计算资源本会发展成无法改进模型。

系统应自动检测这些假想,拆分模型并培训新数据新模型预设模型应保留在服务器上直到使用这些模型的所有系统迁移到新模型

重新训练模型时,应使用规则系统举例说,新模型只当其平均绝对误差低于前一差差差时使用在这种情况下,新模型应自动取出并部署规则也可以设置,以便检验误差和/或精度的临界值

规则在生产环境实施前需要审查Git基础系统通过同级评审可以实现这一点这一点至关重要,因为生成错误规则可能导致系统故障

kb88凯时开户平台实验跟踪

开发性能机学习往往需要迭代数项实验需要跟踪这些实验的可比性和可复制性

实现此目标需要登录实验元数据举例说代码版本、数据版本等如前所述,模型管理是模型移动制作时发生的事情。并非所有模型都毕业生产,

获取最佳模型转编译 跟踪所有实验都至关紧要无法复制最优性能实验实战实战实战实战实战实战实战实战实战实战实战实战实战实战实战实战怀着这一思想,让我们看下多段kb88凯时开户平台.

Metadata_dashboard

模型培训

现阶段开发训练管道管道负责:

  • 摄取数据
  • 工程新特征
  • 监控训练过程

期间特征验证与特征存储器相同使用不同特征可引出问题 当管道使用实战数据管道还保证数据以正确质量和格式传递给管道

培训可以通过数项实验完成每一项实验都用实验工具详细登录进程完成后,你可复制实验结果最优性能此外,通过日志模型本身,你可立即选择最优性能模型

模型评价

现阶段模型测试数据前所未见,准备部署测试数据特征应类似于培训使用特征否则评价失败性能暗淡后再培训模型可在调整特征和/或数据后完成

模型寄存器

使用实验工具时,您可将最佳模型保存到5凯时app 获取最佳模型后,它准备服务取决于实验工具使用, 但这些功能应该从盒子中提供

也有必要指出模型寄存器可用于模型管理再培训阶段等有新模型后 需要更新模型寄存器

模型寄存器很重要 因为它包含模型元数据元数据之所以重要有几个原因:

  • 管理模型
  • 遵守区域规范框架
  • 了解模型是否在生产中运行并端点

至今我们已经覆盖了很多土地花点时间简单归纳一下 比较技巧

kb88凯时开户平台MLOPS实验跟踪

开发机器学习模型时需要尝试多特征、参数和数据集产生许多模型

虽然大多数模型会丢弃, 跟踪每个实验都很重要无法复制出性能良好的模型将是非常不幸的,因为你不了解它为何性能良好。这一过程-运行数项实验并比较-即kb88凯时开户平台全局性等有最优模型后 转生产后 MLOPs步入

可能有用

如何获取ML模型复制

MLops vsML模型管理

MLOPs指成功部署和提供机器学习模型简言之,所有MLOPs步骤确保您的模型总可用确定模型本身总可用时,则需要管理模型本身

kb88凯时开户平台ML模型管理比实验跟踪

模型管理目标 跟踪各种模型并服务于寄存器模型需要监控,以便在性能下降时可采取必要措施

模型输入模型寄存器的方式 首先是通过实验阶段运行各种模型实验 并发最佳性能寄寄送模型寄存器等它出现后 随时可以启动再训练 并重构条件kb88凯时开户平台光线下实验跟踪和模型管理是相互依存的两个过程

结束语

文章中你已经看到MLOPS 整个生态圈都关心带机器学习模型制作kb88凯时开户平台并观察MLOPs方方面面的差异,如模型管理实验跟踪.具体说来,我们已经覆盖

  • MLOPS是什么
  • MLOPS部件
  • 模式管理
  • 模型管理的各个部分
  • kb88凯时开户平台实验跟踪
  • kb88凯时开户平台实验跟踪部分

我希望这些信息帮助你同时开发下一个模型

欢乐楼

文章有用吗

感谢回馈