MLops博客

MLOps合理尺度

九分
2023年9月5日

几年来MLOPS系统可能是ML行业使用量最大词越多模型人想部署制作, 越多想如何组织Ops部分进程

自然方式mLops由大玩家构型上市-Google公司、Netflix公司和Uber公司他们为社区所做的是巨大的,但他们解决了MLOPs问题

多数公司没有问题上头多数ML团队小范围操作并有不同的挑战AG凯时手机版但他们最大部分ML行业, 并想知道什么是最优方法 做MLOps规模, 他们的资源和有限性

上头合理比例MLOPS正解决这一需求合理尺度词名去年由Jacopotaliabue生成并指公司

  • ml模型每年生成数亿至数亿美元
  • 数十名工程师(比数以百计或千计)
  • 兆字节交易
  • 有限计算预算

指南中,你将深入了解合理规模MLOPs, 并了解最佳做法、模板和实例, 帮助理解如何在工作中实现MLOPs

在此之前,让我们回几步看为什么我们甚至谈论合理的尺度

mLops对smLops合理尺度

解决正确问题并创建工作模型虽然仍然关键,但仍不够用越来越多的公司需要部署ML制作以显示“实值企业”。

管理者或管理者将开始查询“AI投资ROI”。意思是麻烦

好消息是多队大小都超越了这一点, 他们的模型正为企业做有价值的事。问题在于

如何实际部署、维护并操作模型制作

答案似乎是MLOPS

2021年多队寻找ML操作工具和最佳做法数十件工具创建2021年连名MLOPSCool.

可MLOPs搭建意味着什么

AG凯时手机版网络资源读取方式

  • 可复制编程管道
  • 报警监控
  • 编译可追踪模型
  • 可自缩模型服务端点
  • 数据编译和数据线程
  • 特征商店
  • 多多多

但它非得全部化为乌有吗

你真的需要所有这些东西吗? 还是它只是标准行业最佳实践标准行业最佳实践从何而来

多数好博客文章、白纸、会议商谈和工具均由超先进超大型公司创建Google公司、UBER公司和Airbnb公司数以百计处理ML问题,

表示大部分最佳实践自然偏向超尺度但是99 %的公司不生产ML超标.

多数公司或未生产ML或a合理尺度合理规模像5ML人 10模型 数以百万计请求合理、高要求,但没有疯狂和超尺度

最优实践偏向超标度,

问题在于合理规模团队使用“标准行业最佳实践”, 并尝试搭建或购买全容量超尺度MLOps系统

AG凯时手机版使用合理规模ML团队资源构建超尺度MLOPs根本无法工作

超规模公司需要一切合理规模公司需要解决当前最重要的挑战需要智能实用 即刻需求

难点部分是说明你的实际需求是什么 以及未来需求是什么多博客文章和会议讲义难解了解现实后 半路到

但也有一些例子实用公司接受合理规模MLOPS限制实现丰收:

  • 柠檬水单从ML模型产生100M+年复用收入,只有2ML工程师为20名数据科学家服务
  • 科维欧市使用工具向数千个没有ML基础建设者的公司提供推荐系统
  • 外波因子运行NLP/CV数据浓缩管道全社会媒体全景

菲律宾凯时国际官网开户或Google白纸标签中打开的Netflix博客日志或Google白纸

读更多

检验更多合理规模公司故事关于如何解决ML工作流的不同部分

MLOps柱

Ok, So say you want to do mLops right, what do you do? 好,表示你想做MLOPs正确,你做什么?即便MLOPs仍在开发中,但有些事物是清晰的(sh),例如MLOps柱石可用作指导 如何开始思考这个题目

MLOps-栈组件柱

第一种方法基于四五主柱MLOPS需要以某种方式实现

  • 数据摄取(和可选特征存储器)
  • 管道和管弦
  • kb88凯时开户平台模型寄存和实验跟踪
  • 模型部署和服务
  • 模型监控

四五分表示数据摄取部分并非总指为界碑但我相信这是一个关键元素 不应该跳过

MLOps柱

每一个可使用简单脚本或全开求解视您的需要而定

端对端工具库

决策归结为

  • 菲律宾凯时国际官网开户端对端平台对堆最佳点解决方案
  • 购买vs构建vs维护开源MLOPs工具或买建维护ss

答案同往常一样,是“它取决于”。

部分团队拥有相当标准ML使用案例并决定购买端对端ML平台

通过这样做,他们把所有MLOPS从盒子里取出,并关注ML

问题在于离标准使用案例越远越难调整平台与工作流并事物看起来都简单标准起始企业需要改变 需求改变 并不再简单

并有定价讨论开工端对端解决时,你真正需要的只是10分之3分之3时,你能否证明开工端对端解决有理?有时你可以,有时你无法

合理规模MLOPs-组件柱

正因如此菲律宾凯时国际官网开户多队远离端对端并决定从点解决方案搭建卡通式MLOPS栈解决点很好

MLOps支柱的潜在实施

菲律宾凯时国际官网开户其中一些解决办法为内部工具,有些为开源工具,有些为第三方SaaS或预置工具

视使用案例而定,他们可能拥有像bash脚本等基本内容,供ML操作大都使用,并获取比它更先进的东西供需要区域使用

例举 :

  • 移植模型本地移动应用可能不需要模型监控,但可能需要高级模型打包和部署
  • 复杂管道多模型并发可能你需要高级管线和管弦
  • 需要大量实验各种模型架构和参数kb88凯时开户平台估计你需要固态实验跟踪工具

菲律宾凯时国际官网开户实事求是地集中解决你现在实际面临的问题, 并不会为未来设计超强解决方案AG凯时手机版运用有限资源(团队以合理规模做ML)

合理尺度MLOPS-原则

MLOPS柱子还有另一种方法值得一提由CiroGreco、Andrea Polanioli和Jacopotaliabue在文章中提出Hagakure面向MLOps:ML四大柱.他们写的原则如下:

  • 数据优于建模通过重迭数据而非模型常增益多益多益多益多益多益多益多益多益多益多益多益广数据中心AI
  • 日志变换:你应该从数据处理中分离数据摄取(获取原始数据),以便复制和重播性举个例子,你可以得到雪花+dbt
  • PaaS&FaaS优于IaSAG凯时手机版资源有限聚焦于你正在改变的地方避免构建并维护栈的每一个组件,使用完全托管服务球队时间实战成本 而不是订阅
  • 垂直割深度比分布式在大多数情况下,你并不真正需要分布式计算架构可使用容器化云化缩放

建立合理尺度MLOps的最佳做法和技巧

好,我们讨论过柱MLOps和原则如何接近.时间更多实用部分可能你想知道

合理规模公司如何实际搭建(以及你应如何建建)

AG凯时手机版资源将帮助你构建实用MLOps栈

先从小费开始

最近我们数位ML实践者访问建立MLops.

里面有很多好东西, 但有一个想法 我只需要分享

一号提示MLOPS不是工具这不是产品描述尝试自动化并简化构建AI相关产品和服务过程

正因如此花时间定义过程后查找工具和技巧匹配进程

举例说 银行流程与技术创业大相径庭MLOps实践和栈最终也大相径庭

事前实事求是地思考用法案例 工作流 需求非行业最佳实践

一直回想Jacopo塔利亚布,科维欧AI主管事实却是 没有他 ML讨论不完全归根结底,他创建术语,对吗?中枢轴博客文章Jacopo建议思维变换我们认为关键(特别是在MLops行程初期):

以合理规模生产ML投入时间解决核心问题并购买一切

你可以看着他深入题目斯坦福Sys研讨会视频.

第三个提示来自Or Shilon ML工程队

进此事件mlops社区播客.....平台思维

表示他们的尽可能侧重于自动化实用工具关键高效MLOPS

以这种方法,他的两个ML工程师团队 成功支持全数据科学团队 20+基础设施拉力

更多地方高超洞察力建立MLOPS是MLOPS社区与Andy McMahon相遇建吧ML工程和MLops实现技巧.Andy谈:

  • 运行ML模型时从何处开始
  • 优先-进程或工具化
  • 如何构建并组织ML团队
  • 并远更多

高超概述他在现实生活中做所有这些事时所学多点宝贵教程

举MLOPS栈为例

MLOps工具栈

多工具打多MLOPs类,尽管有时很难理解谁做什么

dape-MLOPS
MLOps工具全景

从我们对合理规模团队搭建栈的研究中发现

实用团队不做一切注意力集中在实际需要上

康斯坦丁工业团队 需要深入测试评价套件 优化算法

连通Neptune带GitHub动作CICD可视化并比较各种测试运行.

康斯坦丁产业MLOPS工具栈
Continuum工业工具栈

GreenSteam需要的东西 将在混合单片微服务环境工作

因为他们定制部署需求并部署快速API

他们的栈 :

GreenSteam工具栈

团队没有深入解决所有问题,而是锁定需求并做得很好

客户中更多合理规模团队,

  • 柔化可缩放ML工作流只与少数数据科学家和ML工程师
  • 外波因子讨论如何管理过程并用多变数ML实验
  • 深思台谈寻道跟踪超过100k模型
  • 脑力与SageMaker管道合作时谈论管理实验
  • 内监听谈搭建研究友好团队进程栈

更多例子说明 合理规模团队 建立MLOps

并,如果你想深入, 有一个松散通道 人民分享讨论MLOps栈

以下是你如何加入它:

  • 加入mlops社区松懈
  • 查找Pancake堆通道
  • 时边来打声招呼Neptune-ai频道并询问我们 关于文章MLOPS或别的东西

栈不错,但你可能也想要模板

MLOps模板

最合理规模MLOPs模板出自Jacopotaliabue

开源GitHub仓库组合端对端执行意向预测和会议建议

MLOps模板
mLops模板不需要大船

显示连接方式MLOps主柱并拥有端对端工作MLOPs系统极佳起始点允许使用默认或选择工具

另一大资源值得一提MLOps基础设施堆栈文章

文章解释:

MLOPS必须是语言-框架-平台-基础设施-不可知性实践MLOPS应执行“规范配置”。

带上一流图形模板瓦洛海.

MLOps模板
mLops模板瓦洛海

工具解释常见因素、工具类别和示例工具选择整体读法非常好

MyMLOps向您提供浏览器工具栈构建程序 简单讲解工具的用法和类型也可以与其他人分享栈

mLops模板MyMLOps

从Jacopotaliabue多出一个模板专为推荐者系统-合理比例反射.创建它是为了努力发布开源码实战数据 ML管道

mLops模板推荐系统
mLops推荐系统模板源码

AG凯时手机版并查找部分资源选择工具

下一步你应该做什么

好,现在使用知识 去搭建MLOPS栈

AG凯时手机版我们聚集了大量资源 来帮助你但如果你路上有特定问题或只是想深入探讨题目,这里甚至更有用

文章有用吗

感谢回馈