EP 091 - Manage your IoT cybersecurity landscape - Gabe Gumbs, Chief Innovation Officer, Spirion

播客 > Technology > Ep. 091 - Manage your IoT cybersecurity landscape

Download MP3

Ep. 091

Manage your IoT cybersecurity landscape

Gabe Gumbs, Chief Innovation Officer, Spirion

Tuesday, June 08, 2021

在本集中，我们将讨论网络安全威胁因素格局以及物联网设备生成的数据的日益增长的安全风险。尽可能多地花费在问题空间和从黑客的角度思考的重要性。

Gabe 是 Spirion 的首席创新官。 Spirion 是迈向数据隐私和安全的关键第一步。我们构建并提供地球上最准确的数据发现和分类解决方案，为我们的客户提供无与伦比的数据隐私、安全和法规遵从性。自 2006 年以来，Spirion 已为全球数千家组织和多个行业的数据隐私、安全和合规战略提供支持。 spirion.com

Gabe 的播客：请注意隐私

音频文字.

Erik：欢迎来到工业 IoT Spotlight，这是您从工业 IoT 思想领袖那里获得洞察力的第一站，他们正在与您的主持人 Erik Walenza 一起改变当今的业务。

欢迎回到工业物联网聚焦播客。我是您的主持人，IoT ONE 的首席执行官 Erik Walenza。我们今天的嘉宾是 Spirion 的首席创新官 Gabe Gumbs。 Spirion 构建、提供数据发现和分类解决方案，以消除数据隐私泄露。在本次演讲中，我们讨论了网络安全威胁向量前景，以及物联网设备生成的数据面临的日益增长的风险。我们还探讨了在问题空间中花费尽可能多的时间以及从黑客的角度进行思考的重要性。

如果您发现这些对话很有价值，请给我们留下评论和五星级评价。如果您想分享您公司的故事或推荐一位演讲者，请发送电子邮件至 team@IoTone.com。谢谢你。

Gabe，非常感谢你今天加入我们。

Gabe：当然，很高兴有我。很高兴与你交谈，埃里克。

Erik：所以，Gabe，我们将在这里讨论如何保护您的数据足迹的话题。但在我们深入了解贵公司之前，我真的很想了解您最初是如何进入这个话题的，因为看起来您基本上是从大学毕业并一头扎进网络安全话题的。 20 多年前，究竟是什么让你想到了这个话题？

Gabe：看起来像一条直线的道路实际上在大学之前就开始了，我在美国东北部度过了我的成长岁月，这是一个非常有活力的技术和一个正在酝酿的黑客社区。在那种环境中，有很多业余爱好者在交换信息，只是享受着黑客的技艺。我使用黑客这个词，更多地使用传统意义上的操纵你周围世界的乐趣和/或利润。所以在那个年代，用 P 来做鬼怪仍然是一门艺术。

因此，我的安全职业之旅真正开始于 IT 方面，就像我这一代的许多人一样。那时，我的专业工作之外的兴趣已经包括许多安全主题，并且 IT 受到威胁参与者的猛烈攻击。威胁模型正在从黑客活动主义者（当时有很多人）和许多恶作剧的人（尽管是非法的）转移到更多的专业和重点攻击中。

Erik：它变得非常专业，犯罪组织以及政府或企业间谍活动在过去都已成为一个真正的行业。您是什么时候开始看到这种从黑客行为向更专业的方法转变的？

Gabe：这取决于我们在哪里划定专业界线。攻击者开始组织的方式发生了变化，即非国家行为者。但是当我们看到其他人以将一群人聚集在一起的方式进行组织时，我认为我们在 2000 年代初期开始看到很多这样的情况。到 2000 年代中期，它肯定就在那里。大约在同一时间，我们开始看到更多有组织犯罪也进入黑客现场。然后你甚至有一些我称之为恶意爱好者的人，他们能够从论坛中获取一两个工具包，并为随机的消防栓和恶作剧自行创建一些恶意软件。但现在它进一步升级为勒索软件威胁，任何人都可以获取其中一个工具包并劫持某人的敏感数据以换取金钱。

Erik：现在我们有了物联网话题，所以提到了新的一天。所以当然，这里是一个不断发展的战场。您已经与六七家围绕网络安全主题的不同公司合作过。但是您早在 2017 年就加入了 Spirion，当时您在 White Hat Security。在此之前，是什么让你在这支球队中打动你，让你和他们一起投篮？

Gabe：我也会向你们的听众讲述我在个人生活中讲述的故事。我原本对加入这个组织并没有那么感兴趣。事实上，我刚加入时公司的名称是Identity Finder。我记得听到我自己想的那个名字，这听起来像是某种身份和访问管理，但它并不仅仅基于公司名称。我心想，这听起来不像是我可能感兴趣的问题空间。

但后来我坐下来，与创始人 Todd Feynman 交谈，他非常热衷于保护敏感信息，更重要的是保护个人的个人信息，我真正开始坐起来关注。当我从那次谈话中站起来时，我记得自己在想，哦，是的，不，这不仅仅是一个让我感兴趣的问题空间；这当然是我相当热衷的事情。这就是把我带到现在的 Spirion 的原因。几年前，我们从旧的 Identity Finder 更名为 Spirion。

Erik：品牌重塑，是与并购活动或业务转变相关，还是纯粹是品牌决策？

Gabe：纯粹是品牌决策。我认为那个决定的一部分也是基于我自己的偏见，就像你听到这个名字一样，你立即认为我们解决了我们实际上并没有解决的问题，或者我们处于完全不同的空间。所以这是其中的一部分。虽然讽刺的是你快进到今天，2021 年，当我们坐在这里时，世界上大约有 80 多个国家和美国 30 多个州都有隐私法，突然之间，身份识别器这个名字似乎完全合适。但这在很大程度上是一个品牌决定。

Erik：我认为年轻公司倾向于尝试选择描述性名称，因为这会有所帮助。我们选择了 IoT ONE 这个名字，然后你发现你最终做了很多超出你名字直接范围的事情。实际上，只要有一个没有任何特殊含义的有趣名称就会很有用。这是很多公司都会涉足的事情。

所以我一直在查看你的公司概况，但看起来你作为一家公司拥有的价值主张大量数据存储在很多不同的地方，你不知道自己拥有什么，你不知道自己拥有什么这可能与某些国家安全法相冲突，或者仅仅是不安全的敏感数据。如果我是对的，您实际上帮助追踪了这些数据，以便人们了解并保护它。

我认为这很有趣，因为通常当我与安全专家交谈时，几乎感觉你的数据位于已知位置的某个地方，而这只是为了保护该位置。但是当我阅读 Spirion 的命题时，看起来更多的是你不知道你有什么数据，你不知道它存储在哪里，所以首先你实际上必须将它绘制出来并理解它，然后你可以担保。我在这里是否走在正确的轨道上，或者您将如何构建价值主张？

Gabe：你在轨道上，不仅仅是正确的轨道，你在轨道上。让我先提升一个层次，然后稍微谈谈 Spirion 的原因。所以我们为什么，我们存在的原因，我们所有人每天早上起床的原因是为了保护最重要的东西。最重要的是每个人的敏感数据，你的，我的，我们的父母，我们的朋友，我们的家人，我们的同事。

当你从那个为什么开始时，你刚才提到的他们有这样的想法，当你谈论类似的事情时，数据就在这个位置或这些已知位置并且它受到保护，它确实掩盖了如果所有这些数据不仅仅是数据，如果它是你自己一切的数字表示，让你在现实世界中变得完整，但在数字意义上呢？

当您收到补偿、薪水、金钱等任何东西时，我们大多数人都不再以实际美元获得报酬，而不再是实物。现在我们大多数人甚至不再获得实际的薪水。正确的？有随机的 1 和 0 进入您的银行帐户。那些随机的 1 和 0 代表数据。然后还有其他关于你可能有抵押贷款的数据。所以你的抵押贷款公司今天也有大量关于你的敏感数据。他们有你所有交易的历史和你的信用评分，然后是其他一切。因此，所有这些公司都拥有您的所有这些敏感数据。

因此，如果我含蓄地告诉你，比如忘记他们所说的他们认为自己知道并已保护的所有数据，如果你去找他们问他们，你知道我所有的数据在哪里吗？你会希望这个答案是肯定的。但事实是，对于大多数组织来说，这是一个非常艰巨的挑战。这主要是因为我们创建了大量的数据。参加节目源于物联网，尤其是物联网负责生成大量数据，包括敏感数据。

我想到了可穿戴设备，以及了解我的实际位置和活动的最敏感数据，甚至是关于我的健康信息，这些都是需要定期创建的大量信息。然后我们分享这些信息。我们获取了这些信息，我们说我希望能够进一步研究这些信息，甚至可能找到其他人，比如我想向他们出售更多东西或成为任何团体的一部分，所以我分析该数据。然后我与其他人分享这些数据，他们分析它，等等。在不知不觉中，我的数据现在无处不在。它不再只是在那个地方。它在多个地方。

想想正在数字化的数据。当我给你发一份文件时，我真正在做的是复制它。我实际上还没有把文件发给你。我已向您发送了该文件的数字副本。这是该文件的另外两份副本。如果该文档中包含敏感数据，那么现在有两个副本。因此，我们要解决的挑战是找到所有这些数据，因为您必须知道所有这些数据在哪里。如果你不知道它在哪里，你就无法保护它。这只是事实的陈述。

然后因为我们拥有如此多的数据，如此多的数据，我再次认为物联网世界是我们所看到的数据爆炸的一个很好的例子。并且相信我之前听说过它引用我们作为物种创建的大部分数据是在过去的 5 年或 10 年或其他任何时候创建的。因此，您必须能够自动化所有这些，因为您无法跟上能够找到所有数据、识别、分类数据的速度，甚至无法确保贴上标签这样当它移动时，其他人就知道它是什么，技术知道它是什么，等等。你必须开始这样做，不是现在，而是现在。

因为，再一次，如果人类历史上的所有大量数据都是在过去 5 到 10 年创造的，而我们预计会呈指数级增长，如果我们现在不开始，问题就不会只是一点点更糟糕的是，它会成倍地恶化。

Erik：所以这里的过程是一个白帽数据抓取练习，你将蜘蛛发送到网络中，你只是根据这将是什么来根除数据？这是否会搜索关键字搜索类别的元数据，然后您说您然后将标签附加到数据，以便如果它被复制，您可以在它移动到不同系统时跟踪或识别它？您能否解释一下您将在此处应用以执行此操作的过程？

Gabe：是的，就是这些。因此，以一种过于简单的方式，它只是出去爬取所有数据并查看它。更具体地说，我们所做的是进入云端和端点上的所有结构化和非结构化环境。我们触及数据飞跃的所有位置。我们进入这些位置，并开始识别敏感数据。这将因客户而异。这在很大程度上取决于什么类型的业务将决定你拥有什么类型的敏感数据。

每个公司都有一些非常相似的数据类型。我们都有一些财务数据。我们肯定都有员工数据。我们当然甚至可能拥有一些知识产权。但是如果你碰巧是一个医疗设备，你里面可能也有一些临床试验数据。因此，根据您从事的业务，您可能拥有许多不同类型的数据。但我们进去后发现所有这些位置。

但是，无论您是将其保存在某处的 NAS 驱动器上，还是笔记本电脑或 AWS 中的 S3 存储桶上，对我们来说都无所谓，我们会去寻找它。我们实际上使用了不同的技术和技术来找到它。数据的问题在于它在每个环境中看起来都不一样，事实上甚至一点也不相同。这是经典的过拟合、欠拟合问题之一，如果我们试图过于狭隘地看待这个问题，我们将错过所有数据。正如我之前提到的，您必须找到所有数据。但是如果我们把它看得太宽泛，那么我们最终也只是试图从人类的角度分析每一件事，然后我们就可以自动化。请记住，我说过我们必须做的另一件事是自动化它。

因此，我们结合使用机器学习中的工具和技术，以及回归模型以不同的方式查找数据，因为不同的数据类型甚至具有不同的结构。一些数据的定义非常明确，并且在它们的模式中形成了良好的格式，例如信用卡号。仅使用基本规则系统就可以很容易地找到它们。我广泛使用规则系统，因为它们可以是基于机器学习规则的系统。它们可以是非 ml 规则基础。但它们非常适合基于规则的系统。

然后你有名字之类的东西，这对于基于规则的系统来说不是很好。尤其是在美国，我们有许多不同的文化，它们都在美国本土存在，并且每天都在这里传播。所以名字看起来就像这个星球上的每一个名字。那么人名是什么样子的呢？有时它看起来只是一个名词。因此，查找名称之类的东西是我们要解决的非常困难的数据查找挑战类型。查找信用卡号码，查找网络数据，海量数据是我们真正擅长的。

然后是的，然后我们把这些控件放在它周围，然后在它上面贴上那个标签，然后说，嘿，把它戴在你的脖子上，这样每个人都知道你是什么，并确保你不会离开大楼例如，让数据丢失预防技术阻止他们退出，但随后也允许开发人员能够获取该数据集，去识别，然后他们可以使用它来测试他们的新系统，因此他们不会在测试系统中加载生产数据。

同样，当您处理敏感数据，尤其是人员敏感数据时，这会变得非常非常非常有问题，如果那是我的健康信息，并且正在新系统上进行测试，并且该系统出现故障，或者它受到攻击，被攻击等，这是有问题的。但是你有一个隐私问题。我真的希望开发人员看到我的健康数据吗？就像，她不是医学专家。我真的不希望那个人有权访问它。他们甚至在法律上都不允许在美国居住。

因此，找到数据并以不同的方式进行修复，不同的方式可能会对其进行加密，但可能会对其进行去识别化。它可能只是将其移动到基础架构的更安全的角落。任何试图用任何一把锤子解决数据安全问题的人都会发现自己破坏了很多东西，因为我们没有被邮件包围。这是一个有点神秘的类比。我们必须对数据本身应用不同的补救措施。我们不仅要尝试对我们的入口和出口流应用控制，因为这不是我们在现实世界中的运作方式。

我们对这些控制越严格，如果他们只是想做好自己的工作，就越有可能试图绕过它们。因此，我们的目标是在保护敏感数据的同时减少摩擦。找到它，到处找到它，确保我们正在自动化这个过程，以从混合中去除尽可能多的人为因素，既要确保我们可以扩展，又要消除任何人类的弱点，几乎我们所有人都在关注以同样的方式处理数据，然后确保我们保护它，修复它。如果您需要共享该数据，如果您需要分析该数据，如果您需要简单地保留它一段时间，因为您有一些法律规定，那么您可能需要以不同的方式这样做，我们支持并授权企业做这些事情。

Erik：当我们考虑你想要保护的数据时，至少从我外行的角度来看，有两个大集群向我扑来。一是个人身份数据。因此，出于隐私原因，任何与人类有关的东西都应该受到某种方式的保护。第二个是与知识产权有关的东西，无论是研究还是制造过程的运作方式。

再一次，从外行的角度来看，这背后有非常不同的线索。因此，当您处理个人数据时，有很多法规在推动，如果您丢失人们的数据，也会造成很多品牌损害。然后，如果您从另一个角度来看，从知识产权的角度来看，这可能不是一个受监管的环境，而是更多的环境，公司只是自然地想要保护这些数据，因为它与他们的相关竞争定位。

作为一家公司，您是否主要关注个人数据？你涵盖这两个？如果是这样，您在这两种情况下应用的工具集主要是相同的吗？或者在如何保护这两个不同的数据桶方面存在重要差异？

Gabe：如果这有助于你思考问题，我认为这不是一个糟糕的集群。然而，我们应该讨论其他集群。因此，对于可能将您识别为个人的所有不同数据类型，个人身份数据是一个非常好的标签。尤其是 GDPR 中的一些法规，甚至将这些数据描述为“直接或间接可识别”，我认为这也是一个很好的区别。因为有时我们不会考虑您的电话的 IMEI 号码可能会被您识别，因为您不使用它。就像您不使用该号码一样，您不会将该号码提供给您的朋友，但该号码在您的电信公司拥有的数据集中与您相关联。

所以这是一个可直接识别的数字。但是还有其他间接可识别的数据。就像我刚刚给你的一群人一样，他们都住在同一个地区，有着相似的属性，但非常具体的属性，比如他们都是邮政编码中年龄在 22 到 23 岁之间的西班牙裔女性，那确实变成了非常有辨识度。您可以开始重新识别这些人是谁。所以一般来说，你的桶是坏的。但是，还有许多其他不同的存储桶。您还提到了知识产权，而这可能受到的监管较少。

好吧，知识产权，如果你是一个制药组织，那将会受到严格的管理，至少在美国这里也是如此，我敢肯定还有很多其他国家。如果您创建加密技术，您肯定拥有一些您想要保护的知识产权。但同样，在美国本土，我们有国际贸易武器条例 ITAR，这限制了我们可以使用这些数据做什么，我们可以与其他国家、其他个人分享这些数据。

因此，我们碰巧生活在一个日益受到监管的世界中。而且我会在很大程度上避免那里的政治评论，无论你认为我们在那里是好是坏，而且它正在增加。 GDPR、CCPA 和全球其他 78 项隐私驱动法规都非常清楚地表明，我们就在那里。那些桶是广泛而多样的。而且几乎可以肯定的是，如果您是一家承包企业，即使只是在州和地方一级，您也将受到约束。

为了非常直接地回答您的问题，我们涉足了所有领域，我们专注于所有领域，我们在 16 多年的大部分时间里一直在研究这些数据。所以我们非常了解这一点。大约 16 年前，当我们最初开始时，我们当时有点专注于个人身份数据。但是今天，Spirion 生活在数据隐私和数据安全的交叉点。为此，我们检查了所有这些数据。

Erik：然后你有一组你之前提到的新数据，它来自设备。当然，几十年来，我们的设备一直在生产数据。但是它们的数量和它们产生的数据量确实呈爆炸式增长。因此，这产生了两个挑战。一个是你提到的音量。第二个是，与我们说来自银行或保险公司的数据相反，这些数据主要以某种方式在数据库中构建，或者至少在具有相当不错的 CPU 的笔记本电脑中，现在，数据可能在一些相当愚蠢的设备中，可能一直没有连接，可能有三年没有更新的固件等等。所以我想这方面存在一定的挑战。您能否分享一些关于物联网设备的扩散现在如何塑造所产生数据的格局以及您如何保护这些数据的想法？

Gabe：嗯，它肯定会塑造公众在这方面的看法。在过去的几十年里，大多数非专业人士几乎都感到麻木，因为他们听到一个又一个关于数据泄露和无处不在的数据泄露以及类似性质的事情的故事。因此，我认为公众对物联网数据和隐私数据的看法正在慢慢开始转变，也有收回我们的数据并控制属于我们的数据的概念。我对我们的数据有一些代理权，继续朝着这个方向发展。

物联网世界将面临挑战，因为解决方案有自己的解决方案，不仅考虑数据安全，还考虑数据隐私。如果我可以暂时选择这个行业，那么可以公平地说，数据安全在物联网世界中只是事后才想到的。数据隐私甚至更远，目前，我认为最大的影响已经并将继续是感知。还会有很多其他的物质影响。您将有更多的攻击者将他们的模型转向物联网方向，而这只是经济学的副产品。

攻击者效率极高。他们也非常善于从他们的努力中找到最大的回报。如果这意味着攻击物联网设备的医疗保健数据宝库，因为它比黑市获得的每条记录 25 美元，而银行记录为 0.25 美元，他们将直接在该领域转变模式。再一次，这将改变人们的看法。感知将成为推动许多变革性变化的因素。

像我这样的技术专家，虽然我们正试图通过技术以及技术与技术的结合来解决这个问题，但公众的看法确实会推动我们如何将该技术应用于这些问题。

Erik：你提到公众的看法正在开始转变，我们看到一些至少看起来是积极的事情，也许它们只是营销努力，没有太大影响。也许你可以在这里分享一些观点。但我们看到，例如，Apple 在没有用户明确支持的情况下收集数据变得更具挑战性。我们看到一些关于使用 cookie 和浏览器的控制措施。我认为在物联网中，我们看到了更多的努力来实际构建不安全性。我的意思是，这当然不是我们想要的那样。

但至少人们现在似乎正在做出一些努力，或者当它只是让你的飞行员尽快推向市场时，甚至可能是几年前，情况并非如此。您认为我们正朝着积极的方向发展吗？我想有些事情正在改善，有些事情没有改善，这可能是一团糟。但是，您认为我们现在在仅来自基础设施的数据方面处于什么轨道，以允许人们控制他们的数据？我们是否正朝着积极的方向前进？

加布：我们是。我们正朝着一个非常积极的方向前进。因此，我主持了一个名为 Privacy Please 的播客，我们在其中毫不奇怪地谈论安全和隐私问题。在最近的节目中，我们有来自两个不同组织的两位嘉宾。这两个组织都允许任何人，你自己，我自己，只是个人对他们的数据进行财务控制，对他们的数据采取更多的财务代理，这使他们能够控制谁可以出售他们的数据，谁可以共享他们的数据等，并且将部分经济机构返还给个人。这是一个非常积极的方向。每天都有更多这样的组织上线。

Facebook 不应该被允许从你的数据中赚取数十亿美元，而你不分享这些财富，这是公众的看法正在转向的认识。为了回答你的问题，途径中的工具是什么，那些东西在那里吗？他们正在发展到那里吗？然后我提到的两个组织，他们只是在现场做这些事情的一些参与者。

Erik：好的，很有趣。不，我今天早些时候刚刚参加了一个会议，那里有一家化学公司，该公司也生产大量消费品。他们现在正在构建一些物联网产品。所以像消费品这样的东西可以分析你的头发，然后他们可以根据化学成分专门为你定制洗发水。

然后我提出了这个问题，我说，好吧，那太好了。您的一台设备拥有一个数据集，并且您正在为此生产一种产品。但也许另一家公司在你的头发或你身上的某物周围有另一组数据，他们有另一组产品。如果您能够组合来自多个点的数据，您可能会为客户提供更有价值的东西。但是您遇到了这种非常具有挑战性的情况，然后决定我们如何以合法和道德的方式在组织之间实际共享数据？

一方面，那里有很多潜在价值：对业务的价值，也对客户的潜在价值。因为可能很多客户会说，如果你想用我的数据给我提供更好的产品，请你去做，或者最好先给我一点钱，然后在某些情况下继续使用我的数据。方法。所以可能会有很多人对此持开放态度，对于公司来说，显然很有价值。

但仍然存在大量技术障碍，可能还有法律障碍和实际障碍。人们如何实际签署您可以以特定方式使用我的数据，以及如果您只从每个人那里赚一点钱，那么您如何在技术上扩展它，所以它必须是一个完全自动化的过程？也许你提到的公司在这个领域工作。

但是您是否看到了解决如何通过数据获利的问题的努力？我的意思是，很明显，Facebook 在这方面做得很好，但他们控制着所有的数据。因此，如果您是一家物联网公司，拥有一个数据流，并且您希望将其与其他数据集相结合，您如何通过数据获利，但以合乎道德的方式进行，并正确跟踪数据使用情况？你现在看到这个方向有什么有趣的事情吗？

加布：是的。因此，让我首先带您回到您在此处分析的设备示例。你开了一个节目，谈论我作为道德黑客的背景以及在安全领域长大的经历。当您向我描述他们正在构建的产品时，我的攻击者心态立即转向如果威权政府使用这些数据在这里分析毒品的存在会发生什么？就像他们看你头发成分的分子结构，看看你是否在使用药物？我会选择一个只是因为它浮现在脑海中。

但是就像菲律宾总统一样，例如，他以非常反毒品而闻名，我们都同意毒品是不好的。如果他掌握了那个数据集然后只是到处打扫房间怎么办？这是一种非常无情的说法，只是因为他认为他们不应该使用毒品而杀人。并使用极端攻击者的心态示例来回答我如何以合乎道德的方式使用这些数据的问题？

您必须做的第一件事是您必须考虑数据可能带来的危险。你必须在脑海中制定出那些不同的场景，如果这些数据掌握在我刚才描述的那个人的手中，后果会是什么？因此，了解了数据的攻击面后，谁会发现这些数据有用？谁来攻击这个？谁会来处理这些数据？而且，谁会简单地错误处理这些数据？谁会将笔记本电脑留在车内解锁？谁会以纯文本的形式通过电子邮件将某些内容发送给自己？谁来做所有这些事情？谁会用这些数据做所有会导致问题的事情？

那么你说，好吧，也许一种方法可以做到这一点，如果我需要共享数据，我可以将它紧密打包。我可以对其进行加密，然后将其发送给其他人。但是一旦它到达另一个位置，我仍然遇到同样的问题。我所做的只是拿了一个非常脆弱的东西，然后把它放在一辆装甲车里，然后把它送到另一个脆弱的地方。所以这并不能解决所有问题。所以你还是想在那辆车里运输。

为了非常直接地回答您的问题，在差分隐私空间中正在进行大量工作。差分隐私作为一个研究领域已经存在了 20 年，甚至更久。但它现在已经在很多技术中得到实践，并且已经取得了很大的进步。我想到旧金山地区的 Tonic AI 之类的公司有一个平台，可以让您获取您刚才描述的数据集，从中删除可能识别个人的元素，并允许这两家公司共享该数据，允许他们共享该数据，以便他们可以探索这些新的可能性，而不会损害该数据所属个人的完整性和隐私。

Snowflake 有一个类似的数据平面，允许客户共享这些数据平面。我认为微软也在开发一个类似的平台，允许公司共享此类数据并获得这些结果。作为一个消费者，作为一个购买东西的人是存在于我们这个物质世界的人，我很欣赏广告的针对性。

我碰巧是一家特定公司及其产品之一的客户。我已经两次通过广告离开了他们的品牌，我找到了回来的路。几年前，我在 Twitter 上坐了一个晚上，就好像，哦，看那个，这实际上看起来像是我想要和需要的东西。所以当你为我量身定做时，我很感激。我不想要针对我的产品广告，我什至不会考虑，因为这样广告就真正侵入了我的空间。但如果它真的可以丰富我的生活，那么我想要那个。但我不愿意为此交换我的隐私。

所以我们必须首先考虑数据集的含义。这就是为什么在节目的顶部，我想让关于数据的对话变得非常人性化。在某些情况下，它不仅仅是随机无定形的知识产权。这些数据对你我都有非常真实的影响，你刚才提到的检查毛囊的技术，我敢肯定，知识产权对那家公司来说价值数十亿美元。但它将产生的数据，就是我，就是你。

埃里克：是的。这就是让这个讨论如此具有挑战性的原因，你正在处理你正在处理的两种不同的情况，一些可能非常抽象的事情，然后你正在处理一些对所涉及的个人来说非常具体和有意义的事情，这是这里只是同一枚硬币的两个方面，这使得处理这种具有挑战性的问题。

为了让我自己和我们的听众在实践中看起来更具体一些，是否有 1、2、3 个案例，你可以从不同的角度、不同的环境来引导我们，不同的挑战，并非常实际地研究您面临的问题是什么，以及您如何开发解决方案，使公司仍然能够运营和利用他们的数据，但这样做的方式也尊重那些拥有该数据？

加布：我得到了很多非常好的现实世界的例子，当我没有从哲学上对独裁者掌握我的头发成分的危险进行打蜡时，我整天都在度过。我花了很多时间与现实世界的从业者在一起。也就是说，商业世界中的人们正在过着他们日常忙碌的生活，但这样做时需要使用数据并需要保护它。所以有几个故事很突出。

一个真正需要控制数据如何离开端点的组织特别接触了这一点，他们并不是想从端点阻止它，他们非常正确，我认为，也许在某些组织之前了解数据的自由流动是非常必要的。现在就他们而言，他们可能认识到这一点，因为他们自己开发了金融产品，并且要在竞争对手之前非常迅速地这样做，就像他们必须快速行动一样。但他们需要了解数据是如何离开端点的。更重要的是，离开端点的数据是什么？好像他们知道它在那里，甚至知道其中的一些是什么，但他们无法真正控制它。

因此，该组织面临的第一个挑战是了解他们的组织内部可能有什么？所以我们坐下来，我们把它画出来。我们明白那是什么。实际上，他们在识别和布置数据分类模式以及一些数据处理实践方面确实做了很多工作。所以我们接受了这个，我们谈到了……

Erik：所以听起来他们做了很多这样的事情。但是，如果一家公司还没有完成这种映射，那是什么类型的工作呢？我想这取决于公司的类型。但是，这是一个中型组织能够在几周内完成的事情吗，或者如果您以前没有这样做过，这是几个月的努力吗？

Gabe：我发现组织越大，这个过程可能越慢，因为它必须是一个团队的努力，也就是说，你必须让所有利益相关者参与进来，以了解谁是数据所有者，谁是数据创建者，数据管理员需要成为谁，然后让每个人都在同一页面上理解每个人都是数据处理者。

在更大的组织级别，如果您得到外部帮助，您可以在几周内完成创建数据分类模式的任务。例如，如果您与我们这样的组织签约，您可以在几周内完成。如果你自己做这件事，至少有人对数据分类模式的外观有基本的了解，或者做了一些研究并想出了它，你可以在 12 周内再次完成，比如 3个月。那将是合理的。

我当然是，他们隔离了许多可能影响某些企业比其他企业更灵活地行动的因素，而有些则陷入政治和官僚主义的泥潭。但是，如果我是在真空中做的，只有人来完成这项任务，这并不是那么艰巨，而是因为业务越大，您拥有的利益相关者越多，您拥有的数据创建者就越多；您拥有的数据所有者越多，您拥有的数据管理员就越多，等等。您需要确保从所有这些人那里获得输入，以了解他们的关注点在哪里，他们拥有哪些数据，以及进行交易和使用。你需要知道营销团队在做什么。

那么他们是否在收集仅包括电子邮件和电话号码的客户数据？或者还不止这些？你需要了解它是什么。 [听不清 39:33] 正在做什么，假设您从事运输业务，您需要了解您掌握的客户信息。你是否保留了他们旅行活动的非常详细的日志，他们去哪里，他们去哪里等？这也是非常重要的，因为这些是需要正常运行的不同数据类型，但也有需要区别对待的不同数据类型，以及需要以不同方式共享和保护的不同数据类型等。

所以我希望在这个最小的级别上，你可以很快地做到这一点。而在大尺度上，它会花费你几个月的时间，但应该不会超过你。如果它需要你更多，你可能还有其他需要解决的组织挑战。

Erik：所以你做了这个映射，然后下一步是什么？

Gabe：下一步是现在我们知道所有数据是什么，并且我们了解所有这些数据的敏感性，我们知道我们有一个开发部门，可以在这里创建测试人类的产品。所以他们有一堆试验患者，所以他们有关于这些人的非常具体的数据。我们有一个营销部门，他们收集大量其他数据：继续同一家公司，而不是在那里挑剔任何人。

然后我们说，好吧，这是该数据的处理策略。对于我们收集的客户试验数据，任何人都不允许在公司之外处理。那是公司机密和私人的受限信息。而且个人身份信息也是敏感数据，甚至我的一些健康信息肯定是生物信息。所以我们也将把它放在严格的锁定键下。

但是这里的另一组数据，所有这些新闻稿等，现在都是公开数据。因此，我们将继续将它们归类为公开的。对于所有公共文件，处理政策是任何人都可以共享，然后我们将澄清一些事情是受限制的，可能是内部备忘录，不是敏感数据，但公司以外的人确实不应该看到这一点，所以只是限制数据。然后我们将决定处理政策。

对于受限数据，您不得与公司外部的任何人共享此数据，但您可以在公司内部自由共享。因此，除了经典模式之外，您还必须制定数据处理策略。如何允许使用这些数据？再说一次，这就是为什么你必须让利益相关者参与进来。因为如果您说不允许与任何人共享临床试验数据之类的东西，那么桌旁的其他人会说，等一下，我们目前正在与合作伙伴合作，以提出另一个出色的产品因为我们无意中听到了一个播客，在那里我们有了一个好主意，如果我们两家公司合作，我们会创造出更好的产品。所以我们正在这样做。但现在你告诉我我的数据处理政策不允许这样做。因此，明年这将使企业再花费 1000 万美元，因为我们可以创造这种新产品。

这就是你必须让每个人都坐在桌旁的地方，因为你需要那种投入。您需要了解，好吧，您将需要能够共享该数据。因此，这里有一些用于共享该数据的额外处理策略。您将需要对该数据进行去标识化，以使其无法使用 X 个工具箱重新识别。因此，一旦您开始对数据的处理方式更加宽容，您就必须在这一点上变得非常规范。

因此，您必须制定此数据处理策略。所以我们坐下来帮助他们制定数据处理政策等。或者我们与他们一起审查，我应该说。同样，他们已经完成了大部分工作。而我们真正发挥作用的地方在于将其付诸实施的艰苦工作。

因此，现在有了一个数据分类方案，组织知道他们所有的数据是什么，他们在内部收集和生成，他们知道他们想要给它什么分类，其中一些是受限的，一些是内部等，然后他们已经确定了需要如何处理。现在我们进来帮助他们实施它。

我们采用了数据分类策略，我们说，好吧，这些是你拥有的 10 种不同的数据类型，等等。我们在他们的环境中搜索了这些数据。然后我们用与他们所说的机密、不敏感的东西相同的分类方案对其进行标记，我们在他们说我们做的公开的东西上标记和标记评论，因此受到限制。因此，我们开始实施，我们所有内部受限的愿景都不允许邮寄。所以我们确保他们的邮件拦截技术知道如何阅读和提取我们的受限标签，这样这些事情就不会发生。

然后他们也有政策。他们有相似的客户数据，但类型不同。他们 [听不清 44:04] 制造世界，但他们拥有类似的敏感客户数据。而且这些信息不允许与第三方共享。因此，我们自动限制了数据的存储位置，这样如果有人尝试将其保存到共享的位置，它将自动从那里移动，等等。

我们继续进行该练习，直到所有事情都准备就绪。经过几个月的调整和改进，我们能够让他们知道他们的数据是如何离开他们的端点的，但同样，知道好的，它正在离开，我们想要你能离开？但我们现在也知道它是什么，它在哪里，以及它是如何受到保护的。所以它自由地离开和移动不再是问题。现在，我们发现我们已经识别并正在操作上保护它。

Erik：所以你提到的一点我想回到组织一致性的问题上。所以我可以在这里想到两种不同的场景。一种是自上而下的公司场景，公司说，好吧，我们想在整个组织范围内映射数据，然后围绕它提出政策和框架，那里有很多对齐问题。另一个选择可能是产品经理，或者研发部门或营销部门，所以某个职能部门或者一个国家的总经理，比如中国说，好吧，我们想控制中国的数据。

因此，这也可以由组织内的某些业务部门或某些功能或某些产品组来完成。然后你会有一个更简单的情况，在对齐方面的复杂性更低。而且，您可能会遇到组织不同部分采取的不同方法的扩散。您可以分享一方面，是否有最佳实践？然后，实际上，您认为公司处理数据的更常见方式是什么？是自上而下，还是从组织内的不同部门自下而上？

Gabe：公司倾向于采取不同的方法。从最佳实践的角度来看，严格来说，您可以通过非常规范的方式来解决这个问题。所以 NIST，美国国家科学技术研究院，他们是美国的组织，但以美国为中心，所以他们有一个数据隐私框架，他们有一个网络安全框架。这些当然可以作为您如何解决此问题的非常好的最佳实践。

你是从上到下还是自下而上的问题，我认为最好留给你可能成为的组织类型。有些公司的运作比其他公司更灵活，在这种情况下，我认为采用自上而下的方法对那些灵活的组织来说效果很好，而自下而上的方法必须更具战术性。如果您可能不太灵活，那效果很好。如果你很灵活，那么你可以更快地完成这个练习。肯定有一个论点。

所以没有一种适合所有人的尺寸。但我肯定会首先将 NIST 隐私框架之类的东西视为解决此问题的一种方式，作为一个非常结构化的框架，无论您是从上到下还是自下而上。尽管我应该说 NIST 确实从分为多个不同部分的两个级别来处理它。其中一些非常注重政策。其中一些非常注重技术。所以它确实来自两端。

Erik：那么，Gabe，我们在这里缺少什么？我认为我们已经覆盖了相当多的领域。任何我们还没有触及的关键角度？

Gabe：临界角，我想我们已经谈到了它。但我想我要重申的是现在的表演。如果我们现在不做点什么，如果你现在不做点什么，如果每个人现在都不做点什么来处理他们的敏感数据，问题只会变得更糟。最好的时间是昨天。第二好的时间是现在。那句话就是这么说的。

所以我想说物联网世界也是如此。如果您正在设计产品并且没有考虑您拥有的个人数据的隐私和安全性，没有您正在生成的系统，那么最好的时间当然是昨天。而唯一比这更好的时间就是现在。那个数据在哪里？您能否跟上生成敏感数据的规模并找到它来保护它？如果没有，你为什么不现在行动？

Erik：几个月前我和一家公司谈过，他们开发了一些技术，我忘了具体是什么，但它就像用于匿名数据的密钥或设备上的东西。他们为他们的客户做了一项研究，即在产品中构建安全性的成本与在产品上市后增加安全性的成本。如果您在产品已经投放市场之后尝试这样做，而不是在设计过程中构建它，那么安全成本就会增加 12 倍。

所以当然，如果你认为你的产品可能会成功，那么从一开始就构建它。不要将其推向市场，然后在规模扩大后尝试处理这种情况，因为那将非常非常混乱。 Gabe，如果人们有兴趣跟进此对话，那么与您或整个组织联系的最佳方式是什么？

加布：是的，绝对的。所以你可以直接联系我。你可以在网上和 LinkedIn 上找到我，Gabriel Gumbs。我也在 Gabrielgumbs 的 Twitter 上。您也可以在所有这些地点在线找到 Spirion，LinkedIn 上的 Spirion。我们在 www.spirion.com，停下来，拿一些文献，看看我们为保护公司数据和保护世界各地人们的个人数据所做的所有伟大事情。

您也可以加入我们的播客。所以每周三，Cameron Ivey 和我自己，我们都会推出一集 Privacy Please，你可以在那里加入对话。您也可以给我们发电子邮件并在线与我们互动，也可以通过所有这些渠道与我们互动。

Erik：隐私请，非常酷，我会检查一下。加布，非常感谢你今天的时间。

加布：谢谢。快乐是我的。

Erik：感谢您收看另一个版本的工业物联网聚光灯。不要忘记在 IotoneHQ 的 Twitter 上关注我们，并查看我们在 IoTONE.com 上的案例研究数据库。如果您有独特的见解或项目部署故事要分享，我们很乐意在未来的版本中介绍您。写信给我们 erik.walenza@IoTone.com。

还未创建账户?

音频文字.

联系我们