EP33b: Machine learning is not a magic box that takes data and gives magic findings — An Interview with Drew Conway of Alluvium

播客 > Technology > Ep. 33b: Machine learning is not a magic box that takes data and gives magic findings — An Interview with Drew Conway of Alluvium -

Download MP3

Ep. 33b: Machine learning is not a magic box that takes data and gives magic findings — An Interview with Drew Conway of Alluvium

Thursday, May 24, 2018

在工业公司的运营链中，插入软件的最佳位置是什么？总线系统只是一堆在轮子上移动的大型计算机吗？机器学习能否解决人机交互价值最大化的问题？不管我们的名片上写着什么，我们都是数据工程师吗？

Drew 解释了如何获取异构数据流并将其提炼成作为运营指标的稳定性分数并产生高价值警报。我们还探索了人机交互，以比完全无监督的方法更有效地构建模型。

音频文字.

欢迎来到工业物联网聚焦，工业物联网思想领袖与您的主持人 Erik Walenza 一起正在改变企业，这是您获得洞察力的第一站。

Erik：Drew 是 Alluvium 的创始人兼首席执行官。他也是一个非常活跃的人，参与了许多其他公司。我们将首先重点介绍 Drew 的背景，以及他参与的其他一些项目，然后从业务角度更深入地了解 Alluvium。

对于播客的第二部分，我们将更深入地研究技术，包括 Alluvium 技术和更普遍的技术，因此看看它们如何与市场上的其他公司区分开来。然后我们将在第三部分结束对具体案例研究的深入探讨。德鲁，非常感谢您今天抽出时间与我们交谈。

德鲁：埃里克，很高兴来到这里。感谢您的款待。

Erik：我喜欢你的价值主张如此专注。我认为你说得很清楚，如果你能在屏幕上显示某人的 10 分钟时间，你必须把这段时间计算在内。然后你的工作就是确保这 10 分钟的时间是合理的。让我们过渡到播客的第二部分，看看您如何确保这 10 分钟得到了充分利用，您在正确的上下文中呈现了正确的信息。我们可以在这里进行一些技术性的研究。也许我们可以从更高的层次开始。产品有哪些？我想你们有两种产品，我现在在市场上吗？

德鲁：对。所以我们有底层技术，然后是我们基于它构建的第一个旗舰产品。所以我会先谈谈技术，然后谈谈我们的产品。所以当我创办这家公司时，我真的很专注于找出其中的位置，比如工业公司的运营链是插入软件的最佳位置，该软件从根本上设计用于接收这些异构数据流，将它们提炼出来进入这个稳定性分数的想法，这个操作指标并产生这些高价值的警报。

因此，如果您考虑组织中这些不同的组成部分或不同层，核心层就是运营技术方面，或者通常被称为运营的边缘。那是在生产这些数据和那些位的地方旁边的设施内。

这些相同的位最终会飞到第二层，我们认为它是控制室。所以他们不是那些真正在工厂车间走动的人，而是那些经理，所以那些不需要做每分钟、每小时的分析，但也许每天都在做的人逐日、逐周分析。所以这是相同的数据，但他们使用数据的方式略有不同。

其外层是公司级别或总部级别。因此，这些人根本不在运营方面，但正在查看可能跨越许多不同生产设施的大量数据，并且再次面临不同的背景和不同的问题。因此，有了我们脑海中的总图，我想做的，正如我所说，嗯，我们认为我们可以产生最直接影响的地方是，如果我们直接找到数据的来源并直接进入设施并开始建立我们的运营。

因此，我们构建的第一项技术是，如果我们想从这些资产中进行分布式实时、无监督学习，我们将如何将所有这些实际联系在一起，以便我们可以构建这个顶级视图？所以我们开始构建现在的核心库核心技术，我们称之为洪泛区。而 Floodplain 并没有深入探讨这项技术是什么，它实际上只是一种从流中进行广义无监督学习并在任何给定场景中将软件实际分布在多个计算节点上的方法。

所以这个想法是，如果你想在位于中西部的风力涡轮机上安装一个软件，你可以使用洪泛区将它放在任何一个风力涡轮机上，它会学习那个风力涡轮机的稳定性分数然后可以向上传输，我们可以一次获得所有风力涡轮机的整体稳定性。或者同样，对于制造设施内的单个资产，我们可以对所有资产执行此操作并构建这个自上而下的视图。

在公司成立初期，我们有一些非常有趣的机会来尝试这个。可能我们谈论最多的一个实际上是我们最终没有决定追求商业产品的一个是我们正在与新奥尔良警察局合作，并使用我们的洪泛区技术来建立警车的稳定性分数； MDT 被称为移动调度终端，它们是警察在车上的小笔记本电脑。我们可以在那里安装软件，并实际从汽车的车载诊断传感器传输数据，我相信你知道，现代车辆实际上就像带有轮子的大型计算机。因此，任何给定的汽车都会产生大量数据。

但是我们可以将这些数据流式传输并为车辆建立一个内部稳定性分数，然后如果我们愿意的话，实际上可以将这些数据汇总并为整个单元或整个部门建立它。我们从中学到了很多。最终，我们决定不想将这种车辆作为商业主张。但当我们将注意力转向工业领域时，我们发现有两件事是正确的。一是制造业的人们真的很感兴趣，我想说当然渴望能够从来自他们平台的数据流中进行实时学习。

不幸的是，我们了解到的另一件事是进入该行业的障碍，因此仅从技术角度来看，在制造设施内实际部署软件非常具有挑战性，而且非常具有挑战性，事实上，如果您是早期的没有深入的跟踪记录，也没有系统集成商走进门的阶段启动。因此，我们发现即使在早期试点开始时，我们甚至要在我们想要合作的客户的洪泛区技术之上构建一个定制工具，实际上也是非常具有挑战性的。

但是我们通过这个过程从客户那里学到的一件事是，他们实际上仍然对使用该技术非常感兴趣，但不是以实时的方式使用它，而是以我们所谓的即时方式使用它方法。因此，与其在平台外获取数据流，如果他们可以定期将昨天或上个月的数据放入使用技术生成稳定性分数的工具中，那么他们可以利用它来进行调查或进行资源分配。

所以我们最终从当时与我们合作的人那里听到了足够多的消息，基本上是 2017 年初，我说，你知道吗，我不想永远建立这种概念证明。我认为这是一个我们可以继续开发的产品。所以这个想法最终成为了 Alluvium 的入门产品，这是我们基于洪泛区技术的旗舰产品，其设计不是针对实时用例，而是针对客户可以将数据放入的即时用例，无论是单个数据集，他们正在进行取证分析，或者来自同一设施的每日数据集都被捕获以进行长期分析，并获得稳定性分析并利用它来进行数据发现和推理。

Erik：那么架构是什么？我猜你没有把东西从PLC上拿走？您是从 MES 或 ERP 获取的，还是更多的是手动上传？

德鲁：答案是肯定的。目前，Primer 是一款云托管的 SaaS 产品。因此，数据进入其中，拖放，但是，客户能够导出该数据。通常，客户要么在传统的历史平台上工作；要么这些有很多不同的供应商。或者他们可能拥有更多更现代的数据湖基础设施，他们在大型云基础设施中收集数据，然后将这些数据导出到 Primer。我们将在今年晚些时候推出更集成的 Primer 版本。

但正如今天一样，客户可以放入他们从生产系统中获得的任何数据集，这些数据将由 Primer 进行分析，然后它作为顶级分析工具运行，客户可以在该工具中探索该数据.

Erik：制造业以及许多其他行业面临的一大问题是，来自不同供应商的协议和系统激增，可能会使用不同的元数据标记数据。当您部署其中的一个并说，我们正在使用这套设备并且这些数据意味着这一点，它来自系统等等并训练它的系统时，是否有一些定制的工作需要您进行？或者，它真的能够在没有任何教育背景的情况下接收任何数据源，并从这些不同的不同数据源以及它们如何相互交互中理解吗？

Drew：同样，在我们开发的早期阶段，我真正热衷于关注的一件事是不要求我们的客户在特定模型的培训方面有很大的前期成本。您考虑进行机器学习的传统方式是在这种受监督的环境中。所以，好吧，我是制造商，也许我是一个特别老练的人。所以我已经在技术上进行了大笔投资，我已经存储了一堆历史数据，我实际上可以指出特定资产如何失败的不同示例，然后我可以将其交给供应商，然后供应商可以在此基础上建立模型。然后我可以将该模型付诸实践，然后希望现在我能够防止将来出现这些类型的故障，因为我有一些识别它们的能力。

这种方法绝对没有错。实际上，这是您甚至会考虑解决此问题的典型方式。但我们真的专注于以不同的方式思考它，因为我们觉得这样做有两个问题。一种明显的统计问题是，在实践中，工业运营商实际上非常擅长防止其资产发生灾难性故障。他们已经这样做了很长时间。他们明白，即使它只是一般的启发式方法，或一组决策树和最佳实践，如果资产开始看起来像这样，那么我们可能需要对其进行维修。他们也有定期检查，所以他们预测了很多这样的事情。

当事情确实发生横向变化时，通常是不常见或罕见的事件。因此，仅从基本的统计思维方式来看，您不会希望根据本身很少见的失败示例来构建模型。我们将这种选择称为因变量，这是我们不想做的事情。我们不想建立一个罕见事件的模型然后将其付诸实践，并且只能检测不经常发生的事情，但实际上对我们从未见过的新场景完全视而不见，这就是这些事情通常的发展方式，然后该模型就不会成功。

我们不想担心的另一件事是只与已经完成数据收集和存储练习的客户合作。同样，工业领域的大多数客户在技术上都相当复杂，但可能才刚刚开始他们的数字化转型之旅。所以也许他们还没有投入大量资源来收集这些数据。

因此，当我们建造洪泛区时，我们说我们想要建立一个系统，可以以无监督的方式从异构流中进行这种分析。我们允许系统自行从数据中学习。我们已经付出了巨大的努力来构建一种既通用又快速学习的底层算法方法。但正如我们对客户所说，我们的系统从第一天就开始向他们学习。它带有一套非常强大的工具来理解数据。但如果没有人工操作员的交互，它永远不会变得更聪明。

因此，我们希望移动我们的系统，并从完全无监督的方法对进入的第一个数据集移动我们的系统如何工作的范式。但是对于每个后续数据集，以及每次后续交互，用户实际上都在从中学习并转向半监督方法。正如我之前所说，我们希望每次交互对客户来说都具有很高的价值，而且对系统来说也具有超高的价值。

因此，为了稍微更具技术性，我们不一定要与客户讨论这个问题，因为上下文可能不存在。但是，如果您是使用 Primer 的工业工程师，那么您实际上也是一名数据工程师。我的意思是，对于系统中的每一次交互，你实际上是在帮助底层算法进行特征选择和模型的超参数化。

因为每次您评估警报并提供反馈时，系统都会查看它并说，好吧，稍微，这个潜在的未来交互和神经网络的无限搜索空间会变得更小，因为我对什么是重要的和什么了解更多一些对于这个特定的用例可能并不重要。我们对此有更多了解。

再说一次，所以，并不是说有什么神奇之处在说，哦，我们可以从任何特定的用例中学习，你只需给我们数据，这台机器就会自动生成这些神奇的发现。不，它的作用是获取数据，考虑到我们拥有的方法，它将其提炼成稳定性分数并生成警报。当这些警报具有高价值时，操作员会采取适当的行动，系统会从中学习。但是，当这些警报的价值不高时，无论是误报还是操作员拥有的算法可能缺少某些上下文，它就不会再犯这个错误。因此，我们通过该迭代获得了这种积极的反馈。

Erik：很明显，您这里的主要客户是运营商。但是OEM厂商呢？我的兄弟刚刚结束了他的博士学位，他现在在英特尔工作，他是那些在实验室里管理 1000 万美元机器的人之一。这就像运行一点点魔法：机器现在不工作，为什么不工作？没人知道。很明显，英特尔，他们正在收集这方面的数据。他们在维持这些机器的正常运行时间和利用率方面有着巨大的利害关系。

但是，机器制造商也需要了解我们的机器实际上是如何运行的，它们为什么会发生故障等等？因此，他们也会对这些数据非常感兴趣，并了解在什么情况下他们的设备不是最理想的，以及他们如何在产品开发或制造中进行改进。你是在工作还是你有兴趣？我知道，这显然是在运营商和 OEM 之间移动数据，这是一个长期的业务挑战，而不是真正的技术挑战。但是您是否遇到过这种情况，无论是对原始设备制造商的请求，还是数据实际上对制造商而不是运营商更有价值的情况？

德鲁：当然。而在这个领域的 OEM，他们既有巨大的影响力，也有我们认为与我们这样的公司以及为他们的数据构建特定应用程序的人们合作的很大动力。原始设备制造商，他们是制造价值数百万美元的设备的人，他们在那里试图出售这些拥有更多仪器的更复杂的资产，正在生成更多的数据。

从客户的角度来看，现在你购买了数百万美元的资产，你对自己说，嗯，好吧，它要复杂得多，它会生成所有这些数据，但我该怎么处理呢？而您作为 OEM，您将如何帮助我理解这些数据，因为我是制造商，我是精炼商，这不是我的核心竞争力，我该怎么办？所以我们看到的是有不同类型的 OEM，我认为他们在这里采取了不同的方法。但他们都在行业内坚持说，我们希望进行分析，构建软件平台和云平台，让我们的客户能够利用这些数据。

我想说的也许最引人注目的例子是 GE Digital 及其 Predix 平台。我认为 GE 采取了一种真正垂直整合的方法，如果你从 GE 购买涡轮机，他们可以带你从部署该资产到数据生成，再到他们可以作为客户提供给客户的整个应用程序和工具生态系统附加到购买该设备。我认为部分原因在于技术的进步以及软件如何成为这些 OEM 业务的核心部分。

而且，作为他们商业模式的演变，这些高资本支出业务，如果你要销售数百万美元的设备，你可能每隔几年只向客户销售一两个。一段时间以来，这对这些公司来说是一项伟大的业务。但是，拥有从软件服务协议中获得的那种经常性收入模式也更具吸引力。它的成本要低得多。而且，如果您在客户与您的互动方面已经拥有显着的结构优势，那么这似乎是一件非常明智的事情。 GE就是一个很好的例子。

但是西门子有自己的，我认为它叫做Mindsphere。那是他们的云分析平台。霍尼韦尔也有他们的 Sentience 平台。日立，所有这些公司都有这些大的云平台。因此，对于我们作为一家初创公司来说，当然，在可预见的未来，在这些大型跨国 OEM 中的任何一家中，我们之间总会存在大量的不对称。我们拥有的优势是我们没有被锁定在特定的资产线或 OEM 规范中。

所以，对于说，听着，我们有一个混合机队的客户，也许我们有一个 GE 涡轮机和霍尼韦尔过程控制，我们还与一些西门子的 SI 合作，我们可以进来说，听着，所有这些数据都是完美的与我们的系统兼容，事实上，我们的系统旨在能够接受所有这些不同的输入，并为您提供所有这些东西如何一起运行的顶级视图。

因此，我们已经开始与其中一些 OEM 进行对话。我认为我们有很多机会与他们合作，并提供在他们的生态系统中存在的 Alluvium 底漆或不同的应用程序。但这还为时过早。坦率地说，我认为许多大型原始设备制造商仍在试图找出最适合他们的方法。是通用电气采取的那种完全垂直整合的方法，还是更像是一种基于社区的方法，OEM 会说，倾听，我们可以构建云基础设施，我们可以将所有数据集中到一个地方。但我们不是软件设计师和开发人员。我们没有将其作为核心竞争力。因此，让我们出去尝试与 Alluvium 或其他公司等公司合作。因此，显然，我们更倾向于采用后一种方法的公司。

Erik：我认为即使是通用电气在向 Predix 投入了 10 亿美元之后，现在也在更加仔细地研究这种社区驱动的方法，并且可能决定他们确实需要更加开放一些。但作为潜在的解决方案合作伙伴，您是否与这些人合作？您会将 GE 视为潜在的部署合作伙伴吗？或者你认为他们至少在今天的现状中更像是一个竞争对手？

德鲁：嗯，回答第一个问题，我们不直接与 GE 合作，虽然我们亲自会面，而且我们作为一个组织与 GE Digital 有很好的关系，实际上，去年秋天，我有机会在工业机器上发表主题演讲GE 在旧金山举办的学习研讨会，我认识那里的团队，他们做了一些出色的工作，我们还没有找到合适的项目来合作。

正如我所提到的，不仅仅是通用电气，还有其他 OEM，我们正在与他们建立关系。这些组织很大，你必须能够驾驭它们。但就我个人而言，我根本不认为他们是竞争对手。我的意思是，在某种意义上，将他们视为竞争对手几乎是愚蠢的，只是考虑到那里的不对称性。如果是这些组织，你真的不需要与像我们这样的公司竞争，因为我们根本不做同样的事情。

我们在同一个市场中运营，并且在我们希望如何为客户服务方面具有某种精神上的一致性。但是 Alluvium 永远不会制造涡轮机，永远无法做到这一点，就像我不希望大型 OEM 能够考虑构建深度技术深度学习模型和实时软件基础架构一样我可以和我们在 Alluvium 的团队考虑过这样做。

所以从某种意义上说，它更像是一种自然的互补关系。并非每家公司都以这种方式接近它。但我的观点是对于那些在市场上考虑与补充其方法的公司合作的原始设备制造商，这对我来说完全有意义。实际上，我认为即使在 OEM 之外也是如此，因为您还有其他系统集成商和基础设施提供商，他们本身并不特别适合构建应用程序，并且可能正在寻找像我们这样的公司进来并提供特定的解决方案他们的客户已经遇到的具体问题。

Erik：感谢您收看另一个版本的工业物联网聚光灯。不要忘记在 IotoneHQ 的 Twitter 上关注我们，并查看我们在 IoTONE.com 上的案例研究数据库。如果您有独特的见解或项目部署故事要分享，我们很乐意在未来的版本中介绍您。写信给我们 erik.walenza@IoTone.com。

还未创建账户?

音频文字.

联系我们