EP 141 - How to seamlessly integrate real time IoT data streams - Brian Gilmore, Director of IoT & Emerging Technology, InfluxData

播客 > Ep. 141 - How to seamlessly integrate real time IoT data streams

Ep. 141

How to seamlessly integrate real time IoT data streams

Brian Gilmore, Director of IoT & Emerging Technology, InfluxData

Monday, August 15, 2022

在这一集中，我们采访了InfluxData的物联网和新兴技术总监Brian Gilmore 。 InfluxData 是InfluxDB的创建者，这是一个开创性的时间序列平台，允许开发人员使用时间戳数据构建实时物联网、分析和云应用程序。它们处理随时间变化的传感器、应用程序和系统产生的大量数据。

今天，我们将讨论下一代数据库如何通过使组织能够将实时物联网数据流与云数据库无缝集成来创造新机会。我们还深入研究了数据库技术与 AI、AR 和区块链中的相邻创新之间的关系。

关键问题：

从用户的角度思考“实时”的正确方法是什么？
时间序列数据的独特用途是什么，它带来了哪些挑战？
人工智能、增强现实和区块链如何集成到物联网系统中？
最近的哪些数据库开发正在改善复杂物联网系统的管理？

音频文字.

欢迎来到工业物联网聚焦，与您的主持人 Erik Walenza 一起，您将获得当今正在改变企业的工业物联网思想领袖的洞察力。

Erik：Brian，感谢您今天加入我们的播客。

布赖恩：嘿，埃里克。谢谢。谢谢你有我们。欣赏它。

埃里克：太好了。从广义上讲，我们今天要深入探讨的主题是数据主题以及我们如何看待它，以及我们如何决定我们可以用它做什么。但在我们开始讨论之前，我有兴趣了解您最初是如何接触 IoT 主题的。显然，在加入 InfluxData 之前，您已经在 Splunk 工作了大约七到八年。这是一家真正深入研究物联网的伟大公司。但我想你甚至在那之前就第一次接触到这个话题。您能否简要介绍一下您第一次接触物联网主题的地方，以及您现在如何进入更前沿的领域？

布赖恩：是的，当然。当然。当然，我认为人们使用计算机和物理设备工作的时间要长得多。然后它被称为物联网。我只是发现自己有点工作。它始于我的时候——我在音乐学校度过了一段时间。正是在录音棚数字化到来之际，才开始使用这些设备和那些应用程序。这对我来说真的很有趣。最终，我以一种非常迂回的方式，找到了通往海洋生物学领域的道路。我在公共水族馆工作了几年，在那里看到了数字化，计算机与许多运行鱼缸的工业设备的连接。这些是非常大的坦克。他们有PLC和所有相同的东西。每次，我都在想，好吧，好吧，如果我们把这些物理设备连接到这些计算机上，即使我们不看，我们还能了解这些机器的操作吗？所以，我非常热衷于收集数据并存储它。早期，我只从 Excel 和数据透视表开始，真正想弄清楚如何报告这些机器的常规行为，然后识别异常或异常值。我做到了。我在一家机械承包商工作。实际上是机械承包商建造了我工作的最后一个水族馆。作为他们智能建筑实践的一部分，我在那里构建了一个类似的应用程序。同样，这早于物联网一词。

正是在那个时候，我在那个承包商处将我们的上一代产品与 Splunk 集成在一起，我才真正开始听到物联网这个词的出现。我认为主要来自 Splunk 的团队。这个词在硅谷比在世界其他任何地方都流行得多。正如你所说，我很幸运能加入他们八年。我在业务的所有领域工作，从不到 1,000 名员工到超过 7,000 名员工，并帮助他们在那里建立了物联网业务。然后我接到一个朋友 Rick Balada 的电话，他提到 InfluxData 正在寻找人来做一个类似的项目。我之所以选择它，是因为我在 Splunk 的最后几年一直在关注 InfluxData。很棒的技术，很棒的人。我觉得这是一个真正的机会，可以彻底破坏物联网及其他领域的一些关键空间。所以，我很高兴来到这里。

Erik：这是一个很棒的背景故事。听到人们第一次接触这个话题的地方总是很有趣。早在 80 年代，我们这里就有一些人在军用火箭上工作。他们会去的，我们正在处理这个物联网，但这是非常专有且非常受控的环境。显然，每个行业在开始理解数据时都有自己的观点。我猜录音室，当然还有水族馆——就像其他任何东西一样——他们必须优化设备。他们必须找出改善人们工作方式的新方法。理解那个接触点总是很有趣的。

我们想要讨论的话题——我们可以从几个不同的角度来探讨。也许我们可以从您对数据集的看法开始。所以，我们总是谈论数据，然后我们抛出实时数据、时间序列数据等词。我想我们可以根据我们的能力，在某种程度上，我们如何使用它，它的格式，延迟或我们可以访问它的时间段，以不同的方式对它进行分类。您如何看待数据集？例如，当我们说时间序列数据时，您如何定义它？那么您将定义为与此分开的其他类别是什么？

布赖恩：当然。我认为一个好的起点就是真正考虑实时数据。我认为每个人都认为，实时数据是特定时间点的条件或位置或任何值的指标。人们假设那个特定的时间点正好是现在。从来都不是这样。我的意思是，这有延迟。确实，数据绝对实时的唯一地方，尤其是在物联网或工业物联网领域，实际上是在传感器的接口处。因为在此过程中的每个阶段都会产生延迟。您已经完成了模数转换。你已经完成了协议翻译。在此过程中，您有各种不同的步骤。

我认为要做的重要事情是找出最早可以在哪里截获该数据，以便最大程度地消除延迟。这有时需要将计算降低到尽可能靠近传感器接口的边缘。有时，它只需要暂停怀疑你真正认为实时应该是什么，并进入我认为像我们和其他人这样的许多供应商所说的“近实时”，这就是它刚刚发生的事情。就人类的反应或解决情况的能力而言，实时数据中的延迟并不是能够立即做出反应的最大问题。现在，您已经弄清楚了所有这些。你有实时数据。您成功地将其从生成点转移到消费点。您这样做的延迟水平是您和其他所有人都可以接受的。现在，一旦你有了这些，问题就变成了，你想以多快的速度记录所有实时信息？

那时我开始考虑时间序列数据，或者我们开始考虑时间序列数据。如果你有这堵数据墙，你需要开始想出一个关于如何对数据进行采样的策略，并将时间戳从你的样本中删除。例如，如果您每秒钟、每毫秒甚至每纳秒都抓取数据切片，您必须能够立即为该信息加上时间戳，以便以后可以用来组织该数据。将其串联起来或对其运行其他基于时间的查询。因此，您可以通过一种或两种方式做到这一点。您可以在常规样本上执行此操作（就像我说的，每秒执行一次），或者您可以在有条件的情况下执行此操作，我们称之为 event-base。当它改变一定数量或超过一定阈值时，读取一个读数，将该读数的时间戳与数据放在一起，然后将其放入数据库中，该数据库将允许您进行所有存储。如果你回到 20 年或 30 年前，人们正在这样做。他们把它们放在文本文件中。然后我们实际上可能比现在更多，40 年。然后你让那些工业过程历史学家在 80 年代初和 90 年代进入。他们在处理来自这些工业过程的大量数据方面做得很好，无论是在制造业还是在石油和天然气能源类型的事物中。

但最终，现在，因为一切都是数字化的，一切都是集中的，你拥有的信息量会更大。从字面上看，它就像高清电视。就您收集的数据点数量而言，您的分辨率要高得多。然后你有更高的样本评级。因此，您可以采样到纳秒级。需要一个非常专业的数据库才能不仅能够处理这些数据，而且还能够很好地组织它。因为有时数据是乱序的。然后让那些真正需要使用这些数据来完成工作的人真正可以访问和使用它。将海量实时数据（如潮汐波）转换为以后可以使用的数据，用于故障排除或其他目的，确实具有挑战性。我的意思是，老实说，这真的很有挑战性。

即使你看看我们多年来在 InfluxDB 所做的事情，我们也已经改进了我们的方法。我们从每个人都喜欢的堆栈开始，称为 TICK。随着世界的发展，我们不得不开始考虑针对现代数据量优化后端。我们在 2.x 中这样做了。然后我们看到越来越多的数据在云中生成，我们构建了我们数据库的云原生软件即服务版本，该版本在后台以我认为很多人没有的方式重新架构。不知道。这是非常令人印象深刻的东西。现在我们还有更多。我们最近推出了一些非常酷的技术，围绕在边缘运行时间序列数据库，然后也在云端运行。

这就是实时数据与时间序列数据的对比。我认为有一大堆其他数据源或其他数据存储机制，我会说，我们用于我们所谓的丰富。你有关系数据库，你有文档数据库，你有图形数据库。这些，就其性质而言，不是时间序列。有时人们试图将它们变成时间序列数据库。传统上，它并没有很好地工作。但这些是更多静态信息的绝佳存储，可用于丰富时间序列数据，为您通过时间序列数据讲述或正在阅读的故事增加另一层深度和细节，我猜，通过您的时间序列数据。

Erik：就像这种化学物质的公式是这样的，或者当温度达到这个阈值时，就会发生这种反应。这些类型的事实可能会影响，是吗？

布赖恩：是的，当然。如果您考虑一下——由于时间序列数据量很大，您希望以一种使写入效率超高的方式优化您的时间序列存储。因为您可能在谈论每秒数千万或数亿个时间序列事件。所以，你真的想让写作更有效率。有很多信息是您不想在每个时间序列记录中放入的。

例如，您可能有——例如，您正在从制造机器中捕获数据。那台机器有名字。它是由特定供应商构建的。它有一个序列号。它有安装日期。它具有所有这些其他功能，这些功能在您以后处理时间序列数据时非常有用——无论是通过可视化还是人工智能，或者您正在使用它做什么。您不想将所有详细信息与时间序列数据一起存储。您可能会做的是为机器 ID 放置一个简短的唯一 ID。然后在其他地方的关系数据库中，您可能拥有该机器 ID。然后，您的数据库表中可能还有一大堆与所有这些字段和功能相关的其他列。然后，当您编写时间序列查询并将数千万或数亿个事件限制在更合理的数量时，您可以将有限数量的时间序列事件中的机器 ID 引用到关系数据库中，将这些信息拉回并以某种方式装饰您的数据。如果你想让它映射关系，你可以用图形数据库做同样的事情。如果您希望它将日志和其他基于事件的数据联系在一起，您可以通过附加第二个时间序列数据库来实现。这完全取决于用户，但现在的技术非常强大，以至于你真的可以用它做任何你想做的事情。

Erik：让我们谈谈今天的挑战。比方说，现在正在出现或开始得到更广泛采用的物联网用例中内置的许多价值正在被释放，因为我们可以更好地访问不同的数据集，并且能够以以前没有的方式合并它们以前可能。我们有来自边缘的实时数据。我们有大型数据集、历史数据集或从不同来源集成的数据，这些数据可能存储在云中。我们能够合并这些并从中创建用例。我猜这里有些东西或多或少是商品——这意味着它们已经解决了大多数公司都知道如何做好的问题。从技术上讲，还有其他一些具有挑战性的事情。如果我们想在边缘进行机器学习，并且我们想要访问来自云数据库或其他东西的可能仍然更新的数据，我们拥有庞大的数据集和有限的计算能力等等，我们就会遇到这些具有挑战性的边缘案例。你今天在哪里定义什么——也许不是最前沿。哪些问题难以解决，只有少数公司已经解决，或者人们真的是围绕物联网数据管理或数据管理的下一个创新前沿？一般来说，你今天在哪里看到这些边界？

布赖恩：我认为从技术的角度来看，我认为你做到了。我认为这真的很有效，我会说，编排数据，了解在哪里采样，在哪里保存，在哪里移动。我认为数据既有原点，也有重力。大量存储数据的地方通常会吸引应用程序。由于将数据从边缘移动到云端或从云端移动到边缘的成本很高，如果您在云端拥有大量数据，您将在云端构建您的应用程序。如果您在边缘拥有大量数据，您将希望在边缘构建您的应用程序。那是一种重力。

能够有效地获取该数据，以您需要的采样率对其进行采样，在何处创建，将其存储在那里。然后针对不同的应用程序做出关于您移动哪些数据以及何时移动的明智决策。您需要将部分数据从边缘移动到云端。因为正如你所说，某些技术——尤其是当你开始进入 ML 和 AI 领域时——你只是没有马力。您没有大规模的并行 GPU 来像在云中那样处理数据。

我们和其他供应商现在正在合作的是，您如何在边缘和云之间实现这种双重性，在边缘应用程序和云中的应用程序之间实现紧密耦合，然后这些应用程序正在实现这一点为你做决定？我们从最近推出的一项功能开始了这条路线，称为边缘数据复制——它在任何方式、形状或形式上都不是自主的。但它确实允许你给我们一套规则，说，好吧，这是数据。我想在边缘离开。也许它被总结到毫秒或秒。但是随后，我想将这些数据汇总到最新，或者丰富它，或者装饰它，或者其他什么，然后将其中的一个子集移动到云端，这样我就可以在那里训练那些机器学习模型。也许如果你有一个架构，你可能有数百、数千或数万个边缘数据库，你不想集中所有这些。您希望在所有这些边缘设备上复制它。因此，您可以将其汇总到云端，将其聚合在一起，然后使用它来训练您的主要机器学习模型。然后，您可以将这些模型推回边缘以供应用。

技术就在那里。这是可能的。我认为只有人们真正了解它是如何工作并有效地做到这一点，无论是从运营角度还是从成本角度。因为如果您犯了错误，尤其是在与一些较大的云供应商合作时，您可能会很快用完巨额账单，因为您不小心将 50 TB 的数据从百万边缘设备移动到了云中。没有人愿意处于那种境地。

除了技术方面的东西，我喜欢考虑——这不是我的理论，但这是我一路上学到的东西。我真的相信任何新兴技术都有一段旅程。我认为我们现在在物联网中达到了非常积极的地步，因为大多数障碍与人或流程有关，而不是与技术有关。我认为可能仍然有很多公司对物联网有预算。每当我与公司交谈时，我都会说，“如果你有物联网预算，那你才刚刚开始。”

物联网是一种达到目的的手段，与一整套其他新兴技术（如云和人工智能、机器学习、增强现实、区块链）并驾齐驱。你给它命名。它使用这些技术并投资于这些技术来解决问题。我认为公司需要做些什么来缩小最后一个差距——物联网变得无处不在，它的名声下降，它只是成为我们网络的一部分，再次成为互联网的一部分——让人们真正开始问什么是业务中的大问题。技术可以解决哪些问题？其中，物联网在哪些方面产生影响？然后与被这些问题熬夜的利益相关者合作，并使用物联网等技术解决它们。如果它不需要物联网，那很好。但如果它确实需要物联网，技术就在那里等着你。否则，你只是不断地将传感器、平台和其他东西扔给每一个小问题。对于锤子来说，每一个问题都是钉子。我认为物联网也有同样的问题。人们被困在这个试点炼狱中，他们正在做一大堆试点项目。但是因为他们背后没有痛苦的利益相关者，也没有就对业务的实际影响进行研究，没有预期的结果等等，他们注定要失败。我认为这是它真正成为主流的最后一个障碍。人们需要开始将其视为与任何其他技术一样，除非您需要它，否则您不会使用它。

Erik：这是一个很好的观点。我的意思是，我几乎不再将物联网本身视为一项技术。如果你把它想得有点像互联网，没有人说我在购买互联网。互联网是一堆不同技术相互作用的平台。物联网，在我看来，只是台式计算机之外的延伸到世界其他地方，具有不同的界面等等。

布赖恩：没错。

Erik：我认为这是一个非常有见地的观点，围绕我们在开发中的位置，就更多来自人员和流程的挑战而言。真正将物联网与互联网区分开来的一件事是，用例的尾巴如此之长。这意味着 Facebook 就像你的几个朋友一样证明了这一点。你说，好吧，够了。我会试试看。突然之间，你有十亿人在使用同一个平台。但是对于物联网，就像——我在中国上海。你有这些产业集群，世界上 70% 的指甲刀是在中国南方的某个城市制造的。这就像一个工厂将开始采用一种技术，然后他们就会取得一些成功。他们的一些工程师将被其他工厂雇用。他们说，“嘿，那个用例真的对我们有用。”他们投资于它。突然之间，你有一群企业都在采用这个用例，因为有人证明了这一点，人才四处走动并带来了它。但这会逐个集群、逐个用例地发生在这些不同的生态系统中。只是需要时间。它以人类经验的速度传播。而消费者则更快地说，“好吧，我要建立一个 Facebook 帐户，然后我会在下周让我妈妈使用它。”

布赖恩：我认为你在那里提出了一个非常有趣的观点。对于彼此的技术，总是有那个杀手级的应用程序。有一个应用程序将特定技术提升为主流。它确实发生在消费者身上比在 B2B 世界中发生得更多，但我认为有一些很好的例子。它还没有达到它在消费者领域的水平。如果你看看 10 年前工业界对移动技术的采用，就像，“哦，天哪。不，不要把它带到那里。它会带着病毒进来。你无法连接它到我的网络，无论如何。”现在，运营商正带着他们的 iPhone 到处走走。他们正在通过云连接的数据管道向他们正站在面前的机器进行检查。这太酷了。我认为还有许多其他例子可以证明这是正确的。

我认为对于软件供应商，我认为，当然，每个人都希望他们的平台能够病毒式传播，对吧？他们希望有这样的体验，就像你说的，一个人在他们的工厂里使用它，然后在世界上最大的会议上发表演讲，吸引世界上最多的观众，最后每个人都站起来欢呼。我认为从企业对企业的角度来看，它不会像那样发生，因为企业的惯性以及出于一大堆非常好的原因（例如安全和您承诺的事情）进行更改的困难现有客户，所有这些。它只是倾向于慢一点。我认为很多公司——包括 InfluxData——开始采取以产品为导向的增长视角，就像我之前所说的那样，我们拥有云服务。我们从那里开始的准入门槛为零。我们有一个完全免费的云托管版本，任何人都可以注册并以较小的规模进行原型制作。我们用它来获得对产品的反馈。所以，我们有一个非常大的数字。我认为现在该系统上有 50,000 个帐户。然后我们也有一个开源给那些不能在云上运行的，这很相似。我们那里有 600,000 个。拥有这些数据库，然后监控与我们软件的这些免费版本交互的社区并与之合作，这有助于我们构建这些功能，从而提高其对大型工业公司或大型消费物联网公司的适用性明天的。

PLG是一个真实的东西。这是一个好方法。我认为你总是会有一个销售人员。您将始终拥有一个产品管理团队，他们将在那里与您的企业客户交谈。但是你可以通过拥有成千上万人可以使用的产品来获得很多价值，然后只是寻找他们的反馈。有时，以最奇怪的方式，比如关于它的推文。我开始为 InfluxDB 监控 Google Scholar。在过去的 10 年里，我们的数据库和各种学术论文大约有 3,000 或 4,000 条参考文献。可以是硕士论文。我们发现，我们几乎遍及 CERN 的大型强子对撞机，因为他们发表的这些论文只是引用了 InfluxDB 以及他们如何使用它。看到它很令人兴奋。

Erik：嗯，我只是想问你，用户资料是什么样的？因为当我查看您的客户列表时，您拥有从科技初创公司到拥有数百亿收入的大型企业的一切。您是否被产品开发团队使用？您是否被操作员使用，例如在工厂的 IT 部门？它通常是更多公司范围的基础设施，还是更有针对性的应用程序？是以上所有的一点吗？我想，可能没有一个典型的配置文件，但是有哪些不同类型的配置文件？

布赖恩：我认为答案是肯定的。它非常多样化——我们的受众和客户群。任何一家公司，你都必须专注于一个领域，然后很高兴其他领域也随之而来。我认为我们和其他公司看到的是，即使是在金融、银行和重工业等更传统的业务中，也正在发生转变，无论是雇佣更年轻、更数字化的劳动力或者它是否只是来自人们技术的长尾，就像那些快速追随者一样。现在，我们已经让那些落后者采用了其他人已经试验过的技术。但是你开始看到这些金融服务公司。你开始看到这些石油和天然气公司真正积极地投资于新技术和新人才。

我认为这真的会带来 - 我会犹豫称他们为真正的开发人员，我是一名软件工程师类型的开发人员。但是在那些非常擅长系统集成、非常擅长将技术连接起来、非常擅长编写脚本或编写简单的应用程序之类的人之间。这些类型的用户现在是更多类型的组织。我们以此为目标。它不是 100% 抛光的。这不是交钥匙工程。您不能为特定的分析和石油和天然气购买 InfluxDB。我们的一些竞争对手走上了这条路；我不确定这对他们是否有效。我们将其保持开放，因为我们首先是 API。我们有一组非常强大且文档齐全的 API。一切都是可编写脚本的。一切都是可组合的。我们有一个用户界面，因此根本不会编写任何代码的人可以点击。我们的分析语言，我们称之为 Flux。我会说它更像 JavaScript 而不是 SQL。我们的目标是那些技术含量高的人。不一定要告诉他们你必须是 C# 超级英雄，而是可以编写一点代码的人，以及可以构建一些东西、集成一些东西并根据他们针对痛点的特定用例定制我们提供的平台的人是。

这就是为什么你会看到这种多样性。因为我们在区块链中有大客户。我们在石油和天然气领域拥有大客户。基本上，我们在你能想象到的每一个行业都有大客户。这是因为那些数字原住民。我们与特斯拉的关系就是一个很好的例子。我的意思是，地球上的每个供应商都会死去谈论他们如何与特斯拉合作。我们很幸运能够说我们甚至不这样做。他们谈论它。当然，我们确实会谈论它。谁不会？但我刚刚阅读了一篇关于特斯拉正在整合的虚拟发电厂计划的非常有趣的文章。他们现在已经意识到，他们在客户家中安装了所有这些连接的 Powerwall 和太阳能电池板。所有这些数据都在 InfluxDB 中存储和分析。即使在客户方面，当您查看您的 Tesla 移动应用程序并看到一个折线图时，您所看到的数据正在由 InfluxDB 传送到该应用程序。他们终于说，好吧，我们可以将所有这些联系在一起。我们可以将客户聚集在一起，实际上将他们的产能过剩视为虚拟发电厂。我们可以将数十、数百或数千个家庭作为实际发电厂卖回电网。这是一个了解技术的人提出的想法，他们知道他们拥有真正实现它的工具。所以，他们做到了。他们一直非常公开并谈论它。你可以谷歌特斯拉的虚拟发电厂。在过去的几个月里，有大量关于它的文章。只要任何行业都有像这样的聪明人，他们知道如何利用技术来发挥自己的优势，我们就会看到这些行业的采用。这就是为什么我们关注一个很可能会在所有这些行业工作的人，而不是非常专注于中游石油和天然气以及他们在那里遇到的特定问题的人，如果这是有道理的话。

埃里克：是的，我知道。那很有意思。我认为数据库是技术栈的隐形冠军，对吧？他们没有得到太多的信任，但他们可以制定或破坏解决方案。我正要问你。我想你已经戳到答案了。也许如果我可以再问一次，这有什么不同？你的解决方案是什么让其他人无法找到解决方案的功能？我总是倾向于我的无知。我想我和很多其他人，我们都听说过数据库。我们认为好吧，您需要一个数据库。选中该框，您会找到一个。它会起作用的。显然，事实并非如此。那里有很多错综复杂的地方。那么，究竟是什么让您能够提供这种级别的能力呢？

Brian：我们的创始人 Paul Dix 是一位出色的开发人员。他和他的团队实际上构建了一种技术，就数据的存储、组织和复制方式以及所有这些而言，该技术非常难以复制。技术本身真的很好。任何想要使用该技术的人都可以免费使用，因为它都是开源的。这是第一件事。第二件事是，我们的数据库本身真的很容易消费和使用。没有人愿意说，“哦，我的上帝。我有这个紧急项目。让我出去给 IBM 或其他任何人打电话，让他们与他们的销售团队交谈，这样我就可以了解更多关于他们的数据库的信息。”总的来说，今天的人们想要即时性，不仅在他们的日常生活中，而且在业务中。他们希望能够走出去，获得一项技术，快速设置，使用它，并立即从中获得一些价值。因此，我们已尽最大努力消除采用的所有障碍，这样，从字面上看，您可以在几分钟甚至几小时内启动并运行您的第一批数据流。您可以开始看到仪表、图表和其他东西像那样移动。我们称之为“精彩的时刻”。就价值实现时间而言，这是一场文字游戏。但我认为价值时间是一个更长的过程，你开始考虑像，我在这个平台上的投资真的从财务或其他角度得到回报吗？

Time to Awesome 就像那一刻，你有问题，你知道你有一些传感器坐在某个地方，你上网，你下载我们的开源或你建立一个免费帐户。你会说，“我如何从这里到那里获取我的数据？哦，等等。他们有另一种免费的开源技术，叫做‘Telegraf’，它是一个代理。我可以把它安装在机器上生成数据。我可以只更改配置文件中的这几行，或者我可以从发布在互联网各处的数千个配置文件中复制并粘贴一个节 - Stack Overflow、Slack、GitHub，无处不在。我有数据现在正在流式传输，从我需要了解的内容传输到真正让我了解它的平台。”因为你可以如此迅速地做到这一点，并且几乎没有障碍，所以人们很快就会觉得他们以某种方式依附于它。然后他们意识到它的可扩展性以及与所有这些外部应用程序集成是多么容易，因为我们的 API 和我们的客户端库以及所有这些。他们到了那种地步，我为什么还要继续寻找？这可以满足我的需要。您从一个小型开源单节点或一个小型免费云帐户开始。对于如何快速将其扩展到每分钟数百万或数十亿个事件的大规模事件，我们在各个方面都非常开放。进行这种转变不像是翻录和替换。正如我们所说，您只是随心所欲地扩展和成长。你真的不需要去别处看看。

我认为这确实是我们成功的关键。因为我们同时也在倾听使用我们的客户的意见。我们不断为他们提供新功能和新特性。所以，它正是他们想做的事情。它以比他们预期的更容易的方式做到这一点。从资源的角度来看，它以一种更实惠的方式来实现，无论是时间还是金钱，都超出了他们的预期。我在 Splunk 的经验和我在系统集成领域的经验告诉我，就发展您的平台、产品增长或像我们之前所说的病毒式传播而言，这是一个成功的策略。把这些东西放在一起，你就会做得很好。

埃里克：明白了。专有协议的话题，这一直是工业领域创新者的痛点。那是你要处理的事情，还是低于你将要运营的水平？

布赖恩：是的，我的意思是，我们稍微处理一下。我们有用于 OPC UA 和 MTT 的连接器。但是开源就是开源。因此，这并不妨碍任何人为任何其他工业协议或应用程序创建 Telegraf 输入，只要他们通过 API、文件或任何可能的方式公开数据。大多数时候，尤其是在生产级别的东西方面，我们会与合作伙伴合作，或者客户将与我们甚至不知道的合作伙伴合作——像 Kepware 或 HighBite 这样的人，他们在这种方式也有很棒的时间，很棒的时间。然后只是堆叠平台是完全不费吹灰之力的，因为您只会更快地找到您的解决方案。最终，它会很好地扩展。我们与很多中间件公司合作。

我认为我们看到的另一件事也很有趣，因为我们具有开源性质，并且我们的产品与许多工业硬件和软件供应商自己的平台集成在一起，比如博世、西门子和 Rockwell——他们都采用 InfluxDB 并将其打包为工业物联网容器管理系统的一部分。西门子，就像当您在该平台中获得 WinCC OA 外部数据库连接器时，它将连接到 InfluxDB。 ThingWorx，当您购买 ThingWorx 云并配置时间序列数据库时，如果您为自己的前提用例购买 ThingWorx，并且您希望以非常可扩展的方式这样做，那么您就是在幕后配置 InfluxDB。甚至 ThingWorx 的文档也建议您使用 InfluxDB 作为时间序列数据库。

这些是有机的伙伴关系，我真的很喜欢。因为它只是表明该技术是有效的，并且它对这些供应商也很有吸引力。这也让我们有机会与更多的社区成员合作。我们不称所有这些人为客户。有时他们最终会向我们购买，因为他们需要获得我们的企业能力之一。但是我们可以作为社区的一部分与他们合作，更多地了解他们的用例，并可能专门为他们构建新功能或其他任何东西。这只是另一条非常有趣的途径和进入市场的渠道，我认为并不是每个供应商都能做到这一点。只是说嘿，另一家跨国大型工业技术公司刚刚选择了我们的软件并将其打包为他们自己平台的一部分。这就像一个非常好的解决问题的设计。拥有这真是一件好事。

Erik：那太好了，你能很好地使用专有技术。从数据库的角度来看，还有一些其他有趣的事情。在边缘有诸如机器学习之类的主题，以及围绕设计芯片组、算法等方面的许多创新，使之更加可行。显然，数据管理是一个关键话题。显然，还有区块链和许多创新。我想你可能会争论到目前为止这对现实世界的影响有多大。但至少，围绕该主题进行了很多创新。就这些其他并行技术而言，您对什么感兴趣？

Brian：我认为它们都是——例如，我认为区块链非常有趣。因为我觉得它的轨迹有点类似于物联网的轨迹，就像“拿着我的啤酒”一样。我认为技术本身不成熟，而且还很年轻。我认为炒作完全不成比例。它很早就与用例、去中心化金融相关联，当然，每个人都想赚钱。他们想通过赚钱来做到这一点，因为这似乎是最简单的方法。

我认为在供应链来源方面还有很多其他非常引人注目的用例，使用数据完整性在区块链方面非常有趣。例如，您可以使用我们的平台。我们在 Splunk 做到了这一点，事件数据的完整性也是如此。您可以在 AWS 或其他任何地方获取数据库存储桶或 S3 存储桶。你可以散列那个桶。然后你可以拿那个哈希，你可以把它放在区块链上。那时，由于该区块链是公共的并且是不可变的，理想情况下，您始终可以验证该存储桶中的数据从未更改过。它只是为您的策略添加了一个非常有趣的数据完整性层。对于某些行业，我认为，特别是当涉及到受监管的行业和存储数据时，他们保留它并且没有人对其进行任何更改，无论是做掩盖还是其他什么，这将是一个用例最终会出现。人们会说，“哦，那是区块链。太棒了。为什么我们 10 年前不这样做？”这是区块链前沿的一件事。

我认为增强现实也很有趣，我不得不承认。我只是屈服了，给家人买了一个 Oculus，或者 Meta Rift，或者任何所谓的 Meta Quest 2。我不知道。我在贸易展上看到过。我用它更像是，“哦，这是一个花哨的游戏显示器。”但现在我真的开始探索那里的一些更身临其境的体验——你可以用它做的训练、安全性、你可以用它做的模拟——我觉得这真的会开始发挥作用，尤其是在工业物联网领域。因为它是身临其境的，而且感觉比我想象的要真实得多。

机器学习和人工智能将永远存在。它一直都在那里。我认为我们可能正处于实用机器学习的第 30 个年头。我认为在过去的 5 到 10 年里，因为金钱就是金钱，它有很多媒体。人们已经对此非常了解。部分原因是技术也得到了改进。但就你的观点而言，我认为这很讽刺。因为，实际上，随着我们使机器学习变得越来越高效，我们实际上是在将事物从软件领域移出并将它们移回硬件领域。我想你开始看到，过去 10 年这些人一直在说，“哦，物联网网关只是......它是一个小型、嵌入式、工业化、通用计算机。”我认为这将会改变。我认为将会发生的事情是，边缘网关甚至边缘设备本身将变得更加基于高度专业化的硬件，无论是通过 DSP 还是其他一些处理器模型，硬件本身被设计为专门完成它应该做的事情工作条款。无论是处理数据、聚合数据、通过网络移动数据——现在都可以放在芯片上。它可以以软件尚无法实现的方式发挥功能和可靠性。所以，我认为这也很酷。我想在不久的将来，您将能够购买一个网关，该网关将为您可以弹出的芯片提供开放插槽，这将为您提供异常检测或其他一些行业用例特定价值，只需通过与必须安装和配置应用程序相比，将硬件插入电路板。

Erik：这是一个有趣的概念。我知道有几家公司至少在开发机器视觉专用芯片。我的意思是，这显然是一个计算量很大的用例。伟大的。我想我们已经在这里覆盖了很多领域，Brian。你还有什么想谈的吗？

Brian：不，我的意思是，我会鼓励你的听众看看我们的开源。你可以在 GitHub 上找到我们。我们得到了大约 23,000 颗星。因此，如果您只是输入“influx”或其他内容，它很可能会出现在搜索框的顶部。试试看。但我认为，当你拥有如此广泛的受众时，尤其是在物联网方面，参与也是如此。使用开源软件。用它做任何你想做的事，扩展它，定制它。但随后也与社区分享。提交您的意见。创建您的连接器，无论如何。如果你把它作为开源分享回来，每个人都会从中受益。

也请随时与我联系。你可以在 LinkedIn 上找到我。只需查看我们的网站 influxdata.com。我们真的希望能够继续与物联网和工业物联网受众深入互动。我认为，随着事情的发展，这种情况会越来越多，越来越深刻，越来越深刻。因为，就像我说的那样，我们看到良好产品市场的早期指标适合我认为很多供应商都在苦苦挣扎的那些领域，而客户也因此而苦苦挣扎。我并不是说我们要拯救世界，但我认为帮助肯定会到来。所以，我们期待与大家合作。

埃里克：太好了。好吧，我喜欢你作为一家公司的心态，布赖恩。我当然鼓励每个人伸出援手，参与并了解更多。我会把节目说明或链接放在节目说明中。布赖恩，感谢您加入我们。

布赖恩：是的，谢谢，埃里克。那很有趣。让我们再来一次。

还未创建账户?

音频文字.

联系我们