寄存视觉
寄存视觉计算机视觉学习机体育数据分析提取单视相机体育视频3D数据向球员、球探、管理者、俱乐部和协联提供无法比拟的知识深度公司集中关注足球赛事并面向体育俱乐部、联赛、图书制作商和媒体
跟踪和管理大规模培训管道
ML团队从方方面面学习机器收集原始数据贴标签 并增加新数据集 训练评价管道迭代期间若有改善 便会把新模型推入生产系统
Kedro管道对技术栈至关重要,因为它们通过管道管理工作流程团队定义管道数具体模型和算法处理管道法让他们很容易为多项作业设置参数,创建可控可复制工作流
ReSpo.Vision团队持续提高核心管道模型质量,提高输出数据质量寄送客户Kedro管道多运行
一开始效果很好接二连三地提升匹配处理数,结果管道量增加以构建不同模型极难管理工作流程并大规模调试管道故障
最大挑战之一是管管管道和流程本身,视精确使用案例或我们想输出的数据类型而定,我们可使用不同的组合运行数据以获取不同的输出基本说来,全系统不简单, 并说Wojtek Rosiński,ReSpo.Vision技术主管
团队注意到多级问题
- 调试实验结果问题难度大 因为它们大规模运行多条管道 管道结果大都依赖上流管道输出
- 很难判断输油管是否都成功完工 和结果如何运算比较向上运行
- 接后,可复制性侧面问题在于知道每个实验运行使用数据集或参数每当实验产生丰硕结果时 都需多加努力 弄清楚参数组合Optuna软件并产生最优效果
AG凯时手机版需要更好的方式管理管道运行并最佳利用资源,所以团队开始寻找解决这些问题的办法最重要的是,他们关心:
团队使用海王星项目 并发现它满足了那些需求
一流之道25个其他海王星集成ML库中部分已用入回文Vision栈kaszGrad首席数据科学家补充道,“我对Neptune整合多框架和ML工具感到惊讶举个例子,我们使用Pytark Lightning,Neptune集成此框架, 于是Kedro外添加日志也无济于事。”
Neptune融入ReSpo.Vision工作流仅仅是第一步完成后团队开始实际使用工具
海王星控制过程
调试实验需要的所有信息都存放在一个地方运行十条并行管道时, 或有故障时, 或以分离过程或委托程序运行时, 跟踪机器本身将变得相当困难海王星在这些情形中非常有帮助 因为它让我整理出那些流水流 并轻而易举用错误执行并调试管道 说Wojtek Rosiński
团队很容易比较管道,评估输出性能和质量并自信地决定哪些模型最优Wojtek补充道,“当我们用Neptune和Kedro时,我们很容易追踪管道多机运行的进展,因为我们常常同时运行多条管道,因此很容易跟踪每条管道几乎都不可能实现。Neptune使用多条管道使用不同的参数并随后通过UI比较结果。”
并不容易看到推理过程的良好结果像什么(因为他们有几条管道依赖上流管道提供有价值的输出)时,他们利用Neptune提供汇总统计
因难查看每一场足球比赛及其输出物(绑框等)并判断它们是好的还是坏的,团队使用Neptune计算一些统计或汇总运行量并知道根据前运行输出应运行的管道和是否与上运行有问题
所有这些都对企业有巨大影响wojtekCTO表示,“如果我们选择最优性能模型,那么我们可以节省时间,因为我们需要更少集成以确保高数据质量。客户更快乐, 因为他们接收高品质数据, 使他们能够执行更详细匹配解析
向客户和非技术利益攸关方报告管道结果质量
说到客户.ReSpo.Vision业务当有价值的分析输出(处理数据)发送客户应用和下游管道时直接受到影响流程缩放时,向客户和其他非技术性利益攸关方传递管道结果本身就是挑战
szGrad表示, 团队希望“即使是非技术人也以友好方法查看几块块子、分数或类似数据, 并决定是否想发送处理数据(寄送客户)或更多知识者调查它。”
利用海王星直觉UI他们裁剪运行表加入自定义列保存视图很容易从流水线流传图表和其他可视化中看到洞察力。 但证明最值钱的是,在本案中最值钱的是那些仪表板.
快速辨识出何为兴趣或引人注意,技术用户和非技术用户都发现报告和仪表板交互直观性我喜欢那些仪表板 因为我们需要数度量图, 所以你编码仪表板一次, 拥有那些样式, 并很容易看到它单屏幕上其他人都能看到同样东西,
监控计算管道使用
AG凯时手机版除输油管规模外,团队运行的另一个使用案例突出的方面是管道运行的复杂程度和计算资源耗用量
模型管道使用数据集数以万计图像训练因为大多数模型也需要高分辨率数据集,训练这些数据集所需的计算量巨大。多数时间,他们在云中运行Kedro管道通常搭建大型机器,例如100GPUs,然后在GPUs中划分管道任务
优化流程是最小化成本的密钥系统监控数据预处理、预测和数据后处理等工作流阶段的参数例如,他们可以定义处理每个阶段的工人数目,以尽可能优化性能,并确保GPU拥有尽可能高的吞吐量
海王星计算监控能力向团队提供所需信息,以最充分地计算管道使用量内普图斯帮助我们看到GPUs使用仪表板上使用图完全能替代性能中的阻塞点,
通过记录功能性(模型评价)和操作性(系统和资源使用)度量,团队可实时跟踪结果和GPU耗用率所以,他们可以使用所学用法提高实验并保证运行中的工作使用所有可用的GPU
关键点是机器学习实验期间, 你希望GPU 在整个实验中达到100%, 当你看它时不那么明显海王星特征非常好, 因为计算使用默认跟踪, 方便性极强, 并加进数据科学家长ZUKASSZGRAD
感谢Wojtek Rosiński和QuakaszGrad与我们合作创建案例研究