文章原创MLOPS直播ML实践者解答其他ML实践者问题
每一集都聚焦于单列ML题材, 期间我们与MichalTadestesiak商谈计算机视觉项目管理问题
你可以在YouTube上看
或监听播客
但如果你偏爱写字版,就到此
你会学习:
- 一号阶梯和里程碑计算机视觉项目
- 2非技术方面管理计算机视觉项目
- 3最大故障和所得教益
- 4结构化CV项目团队
- 5.....
赛宾尼霍尔姆:欢迎重回另一集MLOPS直播.我是Sabine,主机与我并发的Stephen 今天和我们一起MichalTadeusiak回答问题管理计算机视觉项目.
Michal是AI主管深思台.理工学院和Warwick大学二大系统科学硕士数项数据科学项目遍历多产业,如制造、零售、保健、保险、安全等并围绕技术科学项目,如预测建模、计算机视觉、NLP和数大简介,如概念商业证明和竞赛讲习班
Michal 容我列举你没有做的事会容易得多欢迎需要加点什么吗
MichalTadestesiak:感谢介绍原因可能是我已经工作近7年 公司为客户做项目不控制项目流 由谁来接 和什么样的挑战因此清单相当宽广
管理计算机视觉项目一分钟
萨宾:完全正确Michal, 热你解答所有问题, 如何向我们解释 管理计算机视觉项目一分钟
米哈尔:管理计算机视觉项目,我想说有 东西相关 管理项目泛泛特别是从我的角度讲,我忙于外部客户项目这是一个大方面管理人最重要
- 一号一方面,这是一个客户,我们必须一起管理,目标,它必须理解范围、时间线和期望这些都是非常关键和重要的方面
- 2另一端管理团队开发项目我们看到,比方说,人的动机, 感觉打到一个目标 团队精神这可能是最重要的部分
斯蒂芬:绝对听起来像典型项目管理难题非常感谢分享 米哈尔
计算机视觉项目典型步骤
斯蒂芬:注意力集中计算机视觉现在,你能带我走 通过您的典型步骤搭建香草计算机视觉项目从你开始商事方面 并想出业务需求 与利害相关者你能告诉我这个概念吗
米哈尔:计算机视觉部分 通常无关紧要
开工您想从头开始
- 理解目标
- 理解整个公司的商业目的
- 客户需要什么
不必一开始就太技术性讨论讨论比较理解主要的疼痛点 并随后如何总体工作 企业在那里工作
并讨论更多技术细节视客户端成熟度和技术程度而定,你可深入或非深入技术知识
总体说来,第一件事是把商业问题转换成技术术语, 特别是机器学习术语
二叉通常在定义目标后第一件事 范围就是查看数据我的意思是确定有足够的数据标签解决任务特别在计算机视觉项目中, i'd说与不同的ML项目相比很容易实现
计算机视觉中,一旦你访问 甚至图像样本, 它已经相当清晰 问题可能有多难说起像NLP问题或经典ML问题列表数据,当数据可传播到大型数据库时得多打扫合并之类难得多计算机视觉比较容易
3级开发项目总生命周期继续最关键的方面之一是,你必须同客户密切合作,让他们回路并让他们进入决策过程中。并评价解决方案,像它进化的原因和它变换的原因
斯蒂芬:if you can, of course, I knew you do a lot things in Deepsense可不可以举计算机视觉项目例子 向利害相关者讲解, 与客户或非客户协议很多事, 并实际交付实用软件?
米哈尔:容我举一例说它美美, 我想说我们为轮胎制造厂做了一个严肃项目问题或问题人工轮胎质量保证.
客户第一次问我们时,我们能否想出模型来检测不同的缺陷,评估严重程度和类型,然后可能还将它们分类为需要干预者与刚通过者比较并很好者当然,我们想,我们可以,但有很多需求, 很多事必须到位 才能实现
归根结底模型与数据科学家忙或关键部分相似,但还有很多事需要优先保密。发现它不会太容易 因为它是一个相当初步概念标识他们没有标签等建整设备收集资料
帮助他们构建端对端解决之道归根结底,我们不单制作模型, 之后我制作了ML解决方案设计开发标签工具 专门标注轮胎 并不只是像普通图像
问题一是轮胎拥有相关区块, 但也有一些我们正处理的缺陷可以在图像中识别, 象视觉方面是关键方面,像抓块或泡泡等还有一些更像变形 很难发现,像一块黑橡皮因此,我们也有一些三维图像
整体解决方案是将2D和3D信息完全合并完成标签工具后 完成标签进程后 即有建模部分 也花点时间解决他们的正常工作流质量保证问题的方法,这里有许多方面很重要。what to do the expective of the 模型,比如如何搭建整个管道的更多部件 设施 做什么等等
一旦我们知道什么缺陷期望 和哪种回归后, 他们就可以设计下一步端对端比原想广得多
斯蒂芬:从这里我能得到的是它超越技术方面建模只是部署中的一小部分一定有商业对话 和所有那些事非常感谢分享知识
斯蒂芬:假设你受雇清理计算机视觉模型 计算机视觉项目曾经, 也许团队曾研究过它, 现在它有点乱有像90天,你先做什么加入团队后,他们开始研究CV项目, 并开始或多或少当然,他们雇你来清理项目前90天你做什么
米哈尔:90天不算太少当我们处理项目时 常常,我们喜欢拆分3个月周期 大约90天如你所提到,这个遗留项目
可能我会先尝试理解 问题在哪里维护问题或性能问题 或数据流问题视问题何在 以完全不同方式解决
- 一号如果性能问题,那么第一件事就是看结果,看网络产生什么或解决方案产生什么
- 2并尝试回溯回看架构 和它如何搭建 看问题可能在哪里问题在于维护,因为你看它像意大利语代码, 很难引入修改
- 3可能90天后,我们能够构建新解决方案,清洁解决方案,并努力恢复现有解决方案。
90天是相当多时间 计算机视觉项目我习惯
非技术方面管理计算机视觉项目
斯蒂芬:刚从技术方面移开点某些内部知识或技能可能是一个组织或团队在考虑搭建计算机视觉项目前应拥有或应拥有是什么我该如何想?我会花相当合理的时间 非技术方面管理CV项目时我该想到什么?
米哈尔:再说一遍,我将从咨询公司的角度来谈论它,当我们想与客户尽可能广泛接触时,在这个业务方面,我们不单技术方面。客户端需要的东西 取决于客户成熟度说不定我会从比较容易开始
- 一号比较容易的是那些已经有一些数据科学团队, 和他们的伙伴 关于他们的事物每天工作ML或计算机视觉能力不足解决所有挑战然后我们在那里帮助
- 2更有趣的是那些没有数据科学团队或有时甚至没有软件开发者,IT显然有很多系统,等等, 但他们甚至可能没有软件开发者 接掌或也许他们可以 重新认证或改变账号技巧 成为初级数据科学家,比方说最有趣的那些我们喜欢同这些客户合作,因为从他们的作业和从我们作业中可以获取很多知识。
发生这种情况时需要的绝对是这样一种认识,即通过开放,我们可能无法说明某件事情将如何一劳永逸地产生效果。数据科学仍然非常接近, 介于工程研究之间, 后往往很难判断 最先将获取的非常精确性能开放共解问题是关键部分
通常无关公司技术人才问题, 而是与利害相关者, 然后我不知道,企业所有者 将致力于共同解决问题, 以两种方式向知识信息传输开放
商业方面与技术方面项目
斯蒂芬:商业界人士不同意技术界人士的看法吗?有这样的场景吗当然,你提到知识转移万一桥梁常有商业利害相关者不同意技术利害相关者呢?曾遇过这种情况吗? 技术团队如何引导?
米哈尔:通常技术方法不是这样 无法接受有几例企业主似乎也相当技术化,
通常你不会期望企业主对实现开发解决方案计划产生太大影响
当然,你所期望的是引导你渡过优先级,比如回答问题细节,但不一定建议哪个架构或模型使用
因此,我们有一些问题归根结底,我能说什么归根结底,两部分都比较费时求对齐, 并实际涉及研究客户的想法并推动我们思想时 其它思想并不够真难搞
我不确定能否给你更好的答案 直接和客户展开对话 并准备if you're fine with this, let's do this
计算机视觉项目自转架构
萨宾:完全说得通 任务的不同需求下一个问题是,多年来你是否拥有 最强计算机视觉项目架构你有这种东西吗
米哈尔:开诚布公地说,当我更接近技术方面时,我可能曾经拥有过这些技术方面,当时我比起技术领头角色比起我更接近构建解决方案那时,当我们做选择时, 依某些需求而定, 我的意思是如果我们有计算限制, 那么有件大事需要考虑
AG凯时手机版或mask R-CNN或eastR-CNN使用量不多者使用YOLO,通常比较精准,但显然使用量较大者使用上段时间前, 但他们仍然相当受欢迎新一代YOLO仍在更新快速R-CNN或maskR-CNN仍然用作框架,但有不同的骨架仍然在那里,但有时, 两者均不工作良好或适合我们
实验各种架构也很好试用不同的架构别害羞 如果问题不是那么常见并举例子其中一个项目,当我们必须开发自己的架构时, 也是前段时间,像四年多前
处理化学设施图象 有很多泵 阀门 管道等平面图通常看上去像--你会有一张带百字表,比方说200个不同的符号其中一些类相似性 因为你可以有五类不同的阀门, 但作为一个符号,它们不会大相径庭取符号测量设备之类网络并不好屏蔽R-CNN或快速R-CNN
我们不得不想出专用架构, 我想说,如果我们比对一些现有架构, 将是一种未来的金字塔网络,加完全传统式, 我不想太深入细节, 但是是的,有时唯一的方法就是实验并有创意
萨宾:一定令你印象深刻
米哈尔:菲律宾凯时国际官网开户然然,我宁可说,值得先从某些现有解决方案入手, 只为基准线, 绝对快速和可靠
计算机视觉项目里程碑
萨宾:我们想多了解点你项目进程通常在这样一个过程里你有多少个标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性标志性
米哈尔:里程碑是全图的一部分我的意思是,当讨论如何处理计算机视觉项目时, 泛泛地讲,机器学习项目个人喜欢很多CrispDM工作流或方法 最受欢迎中位位位位居前位 后来部分事物 并没有充分记录于此方法并不存在金沟,多金沟, 异金沟,目前已经有数种不同方法归根结底,它们不会产生太大差异
核心学习项目 即交互进程 解决问题并回归里程碑
开工最先实现的里程碑之一,我表示,如果我们在启动项目前没有数据, 数据集就位,数据集就位。核心事物之一数据集启动前优先有时不可能有时数据收集方式上, 或只有一次我们多谈 客户我们理解更好他们理解需要什么, 并会给我们更多数据
首个里程碑就是拥有 比方说运维数据集东西你可以从头开始通常,这应该相当早项目
二叉后进路由我称它骨架求解.当管理ML项目同时计算机视觉时,我认为最重要的是首先有一个最小但工作端对端解决办法
我的意思是使用数据的东西 即使是小数据集 或数据集的一部分可加载它做最小化预处理 或任何需要的东西 来运行模型并训练第一批模型你甚至不必先有模型或常数模型东西你甚至不需要训练 第一个端对端解决方案
3级验证过程计算度量排序评价步骤.
4级一旦你拥有它, 并可能部分可实现性.可能你需要返回你发现 以某种格式, 一些JSON或可视化和这个片段
等端对端解决方案到位后, 即使它真正基础化,你早就有东西可以发扬光大服务多重目的
- 一是现在问题可以拆分,人们可以并行工作方方面面
- 人可以工作数据, 提供更多数据
- 另一种程序可以从更精细验证程序或模型开始
比方说,它得到更多 并行你正在深入开发
- 另一点就是你启动主监控结果, 并有第一个基准比对很难说,比方说,你在某些点 90%性能或东西F1比方说连判断是好或坏都说不出来 万一你不知道 随机猜测或启发性测算的基线分数
拥有后,只有到那时才能评估性能并实现里程碑,第二个里程碑就是拥有骨架
5级剩余里程碑即项目专用取决于它是否接近用户, 你会期望部分用户反馈上点点
6级另外一个里程碑就是拥有MVP可显示给用户玩更多点为网络应用的一部分, 哪里有它的方式,你可以建后端 过后端并服务 通过点API到前端取舍
前两位当然是主两位 最重要的是
萨宾:一定有一些良好的里程碑 细节,就在那里Stephen 接通电话回电
计算机视觉项目最大故障
斯蒂芬:很明显我想知道 塞宾稍早读你简介时 以及你做过无数作品 都相当启发人心我想知道,你是否拥有我们称之为最大故障 长期工作计算机视觉相关项目可能你应该知道的事情 也许你甚至克服了
米哈尔:失败肯定有很多失败其中一个是当我们甚至不启动项目时 失败一开始 我们无法与客户达成相同的条件
开工客户与IT区相距甚远他们制造了一些塑料桶, 我什至不确定他们想拥有什么使用AI监控解决方案观察人们是否进入因重力机器工作或其它案例而不宜进入的地区仿佛专业垃圾箱 类似塑料或一些金属剩余之后,他们可以排空它们 和方方面面相似
一般而言,从ML角度讲,那些事情不会太难做处理公司重构职场, 装墙多墙或安装器多照明等仿佛他们请求非常僵硬的时段 无法缓冲严格定义性能 需求等几星期前我们和他们讨论 甚至到过这里
归根结底,你无法启动差别在于语言使用 期望太大 甚至无法启动失败者之一花了很多时间投入项目, 但归根结底,我们甚至没有启动
二叉也有另一个失败 但也在一定程度上成功我的意思是,这是一个非常复杂项目, 我们已经做了10个月或某事, 归根结底结果不那么成功我的意思是它是一个大团队 工作项目内含ML方方面面 并存许多不同事物,如前端UXUI 和构建全解析后端
归根结底,它证明这一点, 但我相信,如今技术无法解决这个特殊任务我们总是近距离达标,但从未达标最终失败,我们没有真正解决它, 和很多钱去那里, 所以,相当失败
虽然,好的事物是 我们仍然与客户工作他们发现不可能用现有技术解决它他们仍然相信我们 并尽我们所能做几年前我们仍合作归根结底成功
斯蒂芬:我们绝对爱战争故事在这个播客这些都是从战壕中学到的教益, 我们认为团队绝对可以取回教益
管理计算机视觉项目对管理其他ML项目
斯蒂芬:计算机视觉项目稍早易管理我想知道,在你看来 管理计算机视觉项目 和,比如, 任何其他ML项目,NLP 或所有那些项目有什么区别哪些差异你爱分享
米哈尔:每一个计算机视觉NLP 和,比方说,表格数据库项目两者不同,自难自解开工从表式机开始,当我们谈论超经典机学习时, 任务中的一部分就是建构特征难点部分通常是少有案例 你有一个存储数据的地方 并状况良好
通常情况下, 特别是当你处理 不太成熟技术客户时, 他们只是在获取AI, 他们希望看到AI帮助可能不够成熟 甚至没有数据湖或数据源难点是能访问多源数据,并发数据并发,学习所有可能有用的数据,并学习如何合并数据通常很难估计需要多少时间,这是困难之一。无法评估数据中的信息量除非这是一个简单化问题, 当您使用单表和所有东西都在那里时, 这就是那些项目中难处理的部分
二叉带NLP问题通常是数据我的意思是,当比较计算机视觉时, 你通常会有一些开源数据集 与你的工作至少相似我的意思是,你可能想对轮胎进行缺陷检测, 可能没有这个特殊数据集, 但在C表或碳纤维板上可能有一些缺陷检测归根结底会相当相似可重用大量现有神经网或刻画现有数据数据需求小得多, 无需太多制作对客户有用的东西
NLP也常使用转移学习并使用某些通用模型满足客户的具体需求开源中不会发现 如此实用非常相似NLP数据集这是一回事
另一点是,如果想生成数据集,这并不容易自动生成。有OCR问题,有大量人工生成图像供OCR培训使用NLP并不容易可使用GPT等现有传教模型归根结底,你要做的是训练模型不处理实数据,启发式数据, 反向工程师GPT或你能得到的东西, 归根结底对客户和实生数据效果不好数据通常是问题在其他部分中
管理计算计算机视觉成本
斯蒂芬:深入解析数据方面我想知道,你是否遇到这样的情况, 因为,计算机视觉项目中,我想其中一件事 是可以计算密集性可能你处理高分辨率数据集, 之后你不得不使用分布式架构, 软过程整件事情, 或或模型你正在训练
是否遇到问题管理此项目 计算费用免入预算这不是你预算所要的与团队相遇并引导路径
米哈尔:i'd说,这是一个事 你可以评估 已经在项目初级阶段现在,当与客户讨论时, 需要计算能力处理尺度通常我们会说,如果这是一个小小项目,像数万图象处理, 我们有自己的服务器农场, 这样我们可以使用它, 或者我们可以在云中做,
通常情况下,你若发现需要计算性强项目, 我们已如我所保证的那样处于交易状态通常,我们宁可客户端或客户云内或客户账号上完成不必复发或处理客户端已经存在通常我们都是这么解决的
i 只是记得,我们有一些项目 计算预算, 特别是如果你工作云, 而这不是 特别可能计算机视觉案例假设你与未来工程师合作使用大Query或基础设施,如果设计不周全,费用会很高。时局相当昂贵
计算机视觉更容易控制 因为我们没有 复杂交互 不同的计算重操作一旦知道使用哪种模型并乘以数据量,你就可以很好地评估成本
从管理计算机视觉项目中学到的教益
斯蒂芬:开始最后打包时间教益, 教益你所学之类随时间推移你从项目中学到的教益, 你认为小可见规模团队可以通过计算机视觉项目获取并整合, 管理端对端进程?
米哈尔:如果我回想早期我如何接近项目, 就有这种热切性需要快速求解或结果 黑客求解 使用最爱或最花哨网络这一点我们现在绝对会避免的 在场或任由多项目
问题你只要处理一下 可能第一周后会有一些非常好的结果解决之道非非重建不可 无法建构只需放进垃圾桶并认真启动
另一点是当与客户合作时, 第一周后你有一些非常好的结果后一种感觉项目停顿 因为它很容易 获得一些初步好结果通常有种感觉它静止
绝对,我宁可搭建最基本解决方案并观察交互进程改善场景 并不容易直截了当
有时间思考过程 数据科学家深入理解问题 并构建稳定解决方案客户可不易操作
过程性并不只是你 取人工智能破解放在那里 并会神奇地工作没有什么魔术努力工作 时间 工程
并检查
如何构建计算机视觉项目团队
斯蒂芬:这将是很好的结束人管理注解, 这是最后注解您有特殊方式构建 特殊团队在这些项目上工作举例说,你有一个基于研究的计算机视觉工程师 研究模型开发需要单列声明吗 军官工程师部署侧面 或通常如何构建团队 计算机视觉项目
米哈尔:归根结底,它取决于交付对象如果它只是一个POC,那么仅仅数据科学家可能就足够了
虽然,值得记住的是,应该有球员菲律宾凯时国际官网开户目标也是提供部署的某些解决方案并实现化我们经常或平时所做的事 和我喜欢的事情 都尽快组成跨学科团队
数据科学家与软件工程师或MLOPS工程师并发工作时,通常情况是,你没有时间点 MLOPs部分完成并实现化
通常,它平滑 当已经改进小可能已经部署, 但仍有工作进展阶段等这些人并发工作后,他们知道这两个项目两端的挑战和需求何在。这样做非常有益
人喜欢它 因为他们也接触 一些挑战或问题这件事情我们喜欢做
萨宾:万一结束前能快速回答观众问题Gabriel想知道计算机视觉数据管理方面的任何思想似乎比正规表单数据复杂有闭合思想吗
米哈尔:正如我在某点向我解释的那样,我不会说它复杂得多方法不同 方法不同 方法可能更容易 人性化,我们可以评估模型工作方式更容易调试,我想说 更容易看到问题在哪里我会说它们更容易很明显 不同的技术使用 大部分时间深学习 技能如此之大否则 至少对我来说 更容易管理
米哈尔:我没听清问题数据管理Sorry非项目管理现在,我看到了
可能更多 难点是大小 重得多最先或采样中可以做解析, 则肯定有值得做的东西诚实地说,我们通常有问题 过小数据集,不太大
但是,在那些数据多的地方, 通常你不需要处理所有数据更多指取数据、主动学习或知道数据出自何方并知道元数据聚焦最相关数据
其他问题
萨宾:过一秒再回想技术题观众对基线建模方法有问题你对分类检测和分割的不同模式采取什么方法
米哈尔:计算机视觉项目最常用领域是最常用问题解答关于全方位计算机视觉项目,我不表示这三个项目之间有重大差异我的意思是,归根结底 所有那些非ML相关事物都相似
- 与客户部分聊天
- 协同团队
- 确信他们团队合作良好
- 后可交付部分等
何为难或何为差 这三个可能
- 一号预处理需求
- 2模型使用
- 3并验证程序
数据科学家必须处理的主要差异
相异之处在于数据属性之多及其含意不同。有图像后任务分类, 则给定图像中的信息量不太多 。表示一图一图一图一图一图一图一图一图一图一图一图一图一图一图一图一图一图一图一图一图一图一图一像素提供信息信息密度大得多通常你需要更少数据来解决问题
有趣的是,即使客户有时表示有检测问题需要解决或分割问题需要解决,但不必解决
说不定我会说一例 我们处理一些面部特征问题.不得不评估面部特征 诸如皮肤多悬殊可尝试用不同方式解决它
- 一号或提供许多面部图像 显示面部特征异像 分布式皮肤或皮肤等
- 2也可以有小得多的数据集 当你只是贴分片掩码 区域你有更多的,比方说, 分布式事物像皱纹或一些不同...异型非分布式皮肤
归根结底,你解决了差不多相同问题归根结底,你将得到相同的评估工具可以不同方式接近它, 并因此,你对数据的要求 和标签过程 将完全不同三种不同类型的产品之间可能有一些翻译
萨宾:Julian有问题聊天他说:"你好,我很好奇角色何在自动ML模型计算机视觉咨询能力游戏发现有用吗通常性能良好吗?"
米哈尔:说实话,我们不常使用AutoML计算机视觉学几乎从来就没有, 主要原因是你需要为此建立基础设施, 基础设施用自动化方式测试不同模型, 而这仅仅是建构费用非常昂贵的事情。自动ML任务,如果你想试用, 特别是在计算机视觉领域 数以百计的不同配置,
咨询区使用自动ML, 通常情况下,当你不得不玩ML时,它会放入经典ML表单数据用自动化方式测试数以百计的不同配置模型非常廉价
AG凯时手机版计算机视觉中,我要说,像大名一样, 他们拥有所有的资源和钱做这个身为温和咨询公司,我们没有这笔钱烧如我所说,它更像 教育方向从头开始喜欢理解手头问题,像看到理解哪些架构最先尝试,然后显然与结构中不同方法环游比自动ML小得多
萨宾:对绝对重复话题 和圈子理解尺度适合 你和你的团队做这些事
萨宾:更多社区问题来自LinkedInLiveManish想了解推荐库或模块提取Weba有想法吗
米哈尔:如前所述,我不太接近技术方面泛泛地说,我们通常会或团队内人员会做的是,当有解决像这种问题或像那样的问题时,他们会先做研究。最优试例之一是带代码论文启动
通常会有一个整子页 定期问题检查, 并会有不同的基准 和不同的模型尝试可能我不能再给你更多
萨宾:我仍然会用你的方式 提出另一个技术或实用问题maish还想了解你是否有方法把模型或模块拆分成块以便快速装入浏览器他说,“我们把大JaavaScript文件分解成多块并并行下载。”
米哈尔:这不仅面向技术问题 也接近网络应用最有挑战性的项目之一 建网程序的一部分, 可能有点不同挑战 我们在那里,像嵌入Unity显示3D, 大规模3D点云 web浏览器这个问题我帮不上忙 非常抱歉
萨宾:无忧无虑都很好,是的人,当然,有燃烧实用问题 他们的脑海中, 你总能得到幸运
萨宾:是时候整理今天的事情时速快速流转非常感谢 Michal与我们分享广博经验项目管理知识,甚至是那些多汁故障故事虽然,它有点作弊 因为它在伪装上很成功,对吗?
米哈尔:我不知道项目结束时 客户会回来那时时间流汗