联系我们

面试

奥普莱首席执行官兼创始人Pedro Alves– Interview Series

mm

更新

 on

佩德罗·阿尔维斯(Pedro Alves)是该公司的首席执行官和创始人 奥普莱,该平台可为分析人员和主题专家提供强大的预测分析功能。该平台配备了世界各地的知识和专长’领先的数据科学家,使用户可以专注于自己真正擅长的方面:创造业务影响。

最初吸引您的原因 数据科学?

早在2001年,我就看到了巨大的潜力 机器学习 和人工智能。在学习计算机科学作为本科生的同时,决定要进一步追求什么子领域时,我认为:好吧,AI / ML是我认为很有趣的计算机科学领域–您可以帮助预测任何领域的事件。无论您是生物学,医学还是金融领域的专家,如果您拥有机器学习和AI知识,都可以大大推动这些领域的发展。我一直以为它背后的数学很有趣。

当我进入研究生院时,我决定提高我在机器学习方面的专业知识的最好方法就是学习如何应用它。我总是很实际。我没有’不想仅仅为了理论而学习理论。我选择研究机器学习,因为它适用于基因组学和蛋白质组学领域。我所有的研究生工作都是计算生物学,但重点是机器学习。

不久之后,我进入了医疗保健行业,在那里我看到了AI / ML应用程序的巨大潜力。那’当我开始看到AI在学术界以外的实践中遇到的问题时。我体验了AI的现实,并了解了AI在现实世界中的应用效率如何,而不是因为其技术问题。因此,我变得着迷于解决问题。

您以前是的首席数据科学家 班卓,您在这里解决了社交网络领域的挑战。您能讨论其中一些挑战吗?

作为一家公司,我们将检测社交媒体上记录的事件,特别是需要突出显示为潜在危险的事件,例如附近的车祸或着火的建筑物。我们将帮助举报这些事件,以便我们进一步帮助动员急救人员。我们一直在使用社交媒体。

就社交媒体数据而言,许多此类事件很少见。例如,在任何给定的城市,每天都会发生无数次车祸,但是当您 ’重新查看社交媒体数据的数量,车祸的画面变得非常微妙。考虑几分钟内数以百万计的小狗图片,食物图片,另外一百万张自拍照图片以及一张车祸图片。本质上,在班卓(Banjo),我们正在大海捞针。

因此,将会出现的挑战之一是 计算机视觉。尽管当时的计算机视觉还不错,但是当您尝试找到百万分之一的图像时,即使很小的错误率概率也可以完全降低检测这些罕见事件的机会。

例如,有一个公共数据集,当用于训练神经网络时会导致它们无法识别颜色。即使数据集中的图片是彩色的,并且神经网络正在查看所有RGB,它也没有使用颜色作为指示符。乘坐传统警车和传统出租车–两者都是相同的基本汽车型号,顶部则是额外的机械部件(例如警车上的警笛声或出租车上的忙/闲信号)。但是,如果您查看颜色,则两者之间的区别显而易见。由于这种情况,我们能够理解创建适当的数据集至关重要。

在2017年,您接着推出了Ople。这家创业公司背后的起源故事是什么?

我希望公司从实施AI中获得可观的投资回报。根据Gartner的说法,大约80%至90%的AI项目从未实现过。这与技术方面无关,例如模型的准确性。通常是公司内部的公司文化或程序方面。

这可能是由于数据科学团队与业务用户之间缺乏足够的沟通,导致模型预测了业务团队不需要的东西,因为数据科学团队不了解需要构建什么。或者,如果他们建立了正确的模型,那么当数据科学团队完成工作后,业务团队将根本无法利用这些预测。在大多数公司中,销售,市场和物流等部门是真正应该利用AI的部门,但了解模型的是数据科学团队。当这些团队不了解为他们构建的模型时,他们往往不相信其预测,因此不要使用它们。

因此,如果AI不会改变公司的业务方式,那有什么意义呢?

我们想要创建一个解决这个问题的平台-我们想要帮助数据科学团队或业务分析师,数据分析师(无论在此过程中与公司有何关系)建立正确的项目,并帮助员工理解和信任模型。如果我们解决这个问题,那么我相信数据科学最终将对公司产生真正的价值。

您已经指出,数据科学家正在浪费宝贵的时间来执行可以通过AI自动化的任务。有哪些应自动执行的任务示例?

数据科学家通常需要几个月的时间来完成一个模型,一旦完成,该公司将实施所述模型,尽管它可能不会尽可能准确。在模型实施后的几个月中,数据科学家将继续致力于该模型,以使模型的准确性以少量增量增加。通常,这是许多数据科学家花费时间从事其他工作的地方,例如确保员工理解,信任并适当使用AI模型。通过AI可以轻松地自动完成花在功能设计,训练模型,参数调整和算法选择等任务上的所有时间,以提高模型的准确性。

你能描述一下 元学习 是,Ople如何应用?

在进行元学习之前,了解机器学习的第一层很重要。假设您有一个数据集,可以预测何时机器将在工厂车间损坏。机器会通知员工即将损坏,以便他们进行预防性维护。这被认为是学习的第一层。

元学习(通常称为“学习学习”)是对学习过程的进一步理解。因此,在训练模型以预测机器错误时,您需要观察另一个模型。例如,第二个模型可以帮助企业了解预测性维护模型可以很好地学习哪些参数,以及哪些参数不能很好地运行。当您进行元学习时,您会更好地更快地构建更有效的模型。

您对此有何看法 综合数据?

综合数据 如果执行不正确,可能会非常困难。

假设您有病历数据-您有20位患者,并且这些患者的年龄,性别,体重,身高,血压,药物清单等。可以通过基于机器学习的方法来创建综合数据在这些病历上。但是,如果仅依靠机器学习或统计数据,最终可能会得到无意义的合成数据。它可以创建值的随机组合和匹配项,例如3岁的六英尺高的人或4英尺高的人的体重达一千磅。尽管AI / ML在许多情况下是可靠的,但用于医疗记录的综合数据将需要医生的输入。

因此,您需要一名医疗专业人员来创建参数,例如“如果这个人是这个年龄,实际的身高范围和体重是多少”或“如果他们正在服用这种药物,那么他们不应该服用什么药物?”这个过程将不可避免地成为一项艰巨的工作,并且太复杂,以至于无法找出所有可能性,因为它们涉及每个患者的病历。

但是,在图像领域,合成数据更容易理解和创建。假设您有一辆汽车的图片,并且该汽车位于左上角。您无需成为专家即可知道同一辆车可能在左下角,右上角或中间。人们不仅可以通过多种方式指向相机,而且还可以重新对准图像。移动图片的焦点,使汽车位于各个不同的角落,正在创建合成数据–另一个简单的方法是使用旋转。

您能否举一些Ople如何帮助企业满足其数据需求的示例?

欧宝.AI使企业能够在组织的各个级别上利用深刻的数据分析,并给员工提供几次单击即可释放AI价值的机会。与依靠一小队数据科学家来阐明和实施AI的组织相反,Ople.AI平台为各个部门的员工提供了从数据中获取见解的工具,从而提高了他们的日常效率。

话虽如此,组织在实施AI时经常面临的最大障碍是模型的可解释性。对于企业而言,至关重要的是要提供员工可以理解,更重要的是信任的AI。模型的可解释性对此有所帮助。我们使用Ople.AI平台的目标是为可能不是AI或技术娴熟的员工提供机会,以轻松地了解模型如何做出预测以及原因。从长远来看,创建模型可解释性将为企业带来强大的结果。

另外,那里’除了做出预测之外,模型还可以为公司带来更多价值。人工智能可以发现潜在的问题或可以利用的领域。我们称其为数据可解释性–模型可以通过多种方式共享对公司有价值的数据的智能见解。这是AI可以帮助企业的重要方式,也是我们’就我们的竞争而言,继续前进。

感谢您的采访,希望了解更多信息的读者可以访问 奥普莱。

安东尼·塔迪夫(Antoine Tardif)是 Futurist 他对AI和机器人技术的未来充满热情。他是 BlockVentures.com并已投资了50多个AI和区块链项目。他是的联合创始人 Securities.io 一个专注于数字证券的新闻网站,是unite.AI的创始合伙人。他也是 福布斯技术委员会。