联系我们

面试

Pablo Pirjanian,Embodied首席执行官兼创始人– Interview Series

mm

更新

 on

保罗·皮尔詹尼安(Paolo Pirjanian)是亚美尼亚人,出生于伊朗,十几岁时就逃往丹麦。从他年轻的那年起,他就对计算机着迷,并开始在卧室里编码。在获得机器人学博士学位后,Paolo成为了消费机器人领域的早期领导者,他在开发和商业化尖端家用机器人方面拥有16年以上的经验。他曾在NASA JPL工作,并领导iRobot®,EvolutionRobotics®等公司的世界级团队和公司。保罗于2016年创立 体现公司。旨在建立社交和情感智能的数字伴侣,以改善护理和健康状况,并支持人们每天过上更好的生活。

是什么最初吸引您使用AI和机器人技术?

我对AI和机器人技术的迷恋可以追溯到我的童年时代。我一次又一次地流离失所,直到我们的家人移居丹麦。偶然地,我发现了一台电脑。我被它迷住了,以至于我将自己锁在房间里,并且整日不停地进行编码长达数月之久。我的父母以为我很沮丧或正在吸毒,但这不是全部。我只是完全被计算机迷住了!

在同一时期,我在皮克斯的电视上看过一部纪录片。皮克斯(Pixar)展示了他们的第一部动画短片《小卢克索(Luxo Jr.)》,短片短短两分钟,大约有两盏台灯跑来跑去和玩球。令我着迷的是,令我惊讶的是,我刚刚学习编码的计算机可以在电视上产生如此讨人喜欢的角色,这在我体内引起了极大的情感。因此,从那时起,我决定上学学习机器人技术,最终获得博士学位。

然后,我移居美国,在NASA从事火星探测车的工作,这是儿时的梦想工作。最终,我成为企业家,开发了SLAM导航技术,该技术现在支持iRobot的产品。

但是回想起来,我意识到我整个旅程的灵感实际上是将生命带给无生命物体的皮克斯动画短片。因此,这就是为什么我们创建了Embodied–将生命带给可以与人互动的机器人,重点是帮助儿童发展社交情感。

 

您是什么时候首次提出启动Evolution Robotics的概念的?

Evolution Robotics最初是由Idealab的Bill Gross在2001年创立的,后来成为了Microsoft of Robotics,这是一个大胆的愿景,但结果还为时过早,最终失败了。我曾是Evolution Robotics的CTO和GM,但在失败之后,我与Idealab进行了谈判,以分拆出我和我的团队开发并创立了一家新公司的一些核心技术。在2008年,新的实体(也称为Evolution Robotics)开始使用我们的核心导航技术(包括NorthStar和vSLAM)开发产品,这是突破性的空间映射和自动导航方法,类似于我们在无人驾驶汽车中看到的,但针对低成本的消费电子产品。

我们开发了一系列产品,用于自动清扫和擦拭硬地板(称为Mint),于2010年推出。到2011年,我们的销售额迅速增长至2500万美元,并于2012年被iRobot收购,其产品收入和导航技术vSLAM如今已为iRobot的Roomba和Braava产品线提供动力。

 

那时您已成为iRobot的CTO。您能否谈谈您在iRobot上的经验以及您从经验中学到的知识?

作为iRobot的首席技术官,我能够将vSLAM快速集成到Roomba产品线中,从而推出一种新模型,该模型能够系统地覆盖整个平面图,而不会遗漏任何位置。这帮助该公司保持领先于戴森(Dyson)等竞争对手的地位,后者推出了系统的清洁解决方案。现在,vSLAM已成为iRobot旗舰产品Roomba和Braava产品不可或缺的一部分。

我非常喜欢与iRobot首席执行官Colin Angel紧密合作,帮助制定战略方向,使Roomba成为互联家庭生态系统的核心,而Roomba的空间意识使其在理解平面图并成为所有互联设备之间的结缔组织方面具有独特的地位。自从我2015年离职以来,该策略似乎已立足。

此外,我们决定加倍扩大消费者机器人业务,以帮助iRobot保持其全球领导地位。这导致了对国防业务的剥离,并退出了其他外围业务,从而将重点和强度带给了消费者业务。

此外,我们必须重新架构组织,以便能够支持具有连接产品的软件繁重策略。这就需要改变公司文化,以包含更多的敏捷,迭代方法。

我在iRobot上学到的东西很长。突出的一件事是团队文化的力量。保持敏捷性和使命感是任何公司在专利组合和商业秘密之上所拥有的最重要的竞争优势。如果您拥有一支高效能的团队,他们感到有力量并朝着一个明确的目标鼓舞,那么他们将很难停止。

 

您’目前是创始人&首席执行官的体现。您能讨论一下创办这家公司背后的灵感是什么吗?

我真的很喜欢在iRobot担任CTO的时间,我们正在从事许多令人兴奋的项目,并推动了机器人技术的发展。将商业上成功的机器人推向市场是令人兴奋的,这些机器人执行了有益的物理任务,例如吸尘地板。

但是,在我的内心深处,我知道我仍然有一个终身的梦想去实现–建立具有社交和情感智能的机器人伴侣,从而改善护理和健康状况,并改善我们的日常生活。我知道我们正处于与技术交互的临界点。因此,我决定从iRobot辞职并开始Embodied。

当我们从一开始就开始Emboded时,我们就在重新思考和重新发明如何通过简单的口头命令来完成人机交互,以实现下一代计算,并为能够进行流畅的社会互动的新型机器提供动力。具体来说,第一个产品是专注于建立有生命的同伴,以帮助孩子通过基于游戏的学习来建立社交和情感技能。这个同伴将被称为Moxie。 Moxie是一种新型机器人,具有通过情感语音,令人信服的面部表情和肢体语言来理解和表达情感的能力,可以利用人类的心理学和神经病学来建立更深层次的联系。为此,我们召集了一支跨职能团队,由工程,技术,娱乐,游戏设计和儿童发展方面充满激情的领导者组成。在过去的四年中,Embodied一直不懈地努力,将所有最新技术融合在一起,使Moxie栩栩如生,团队很高兴最终将其交付给需要一名副驾驶员的家庭,以支持儿童健康成长。

 

机器人创业公司背后独特的创业挑战是什么?

做不可能的事情很有趣,但也可能有点吓人。我们知道,如果我们想改变人类与机器交互的方式,那么我们将不得不解决以前从未解决过的问题。一些问题包括:

  1. 平面屏幕位于设备上,我们希望使设备栩栩如生。那么,我们如何创建更逼真的,更圆滑的而非二维的面孔?
  2. 当前的对话引擎仅允许非常有限的对话,那么我们如何创建允许更自然对话的解决方案?
  3. 我们不希望声音听起来像机器人一样,那么我们如何使声音听起来自然,具有上下文相关的音调和音调呢?
  4. 我们知道眼神交流非常重要,所以我们必须弄清楚如何使用 计算机视觉 确保可靠的眼动追踪能力。

有关Moxie功能的所有这些问题导致了许多最先进的技术创新。

首先,突出和圆润的脸。统计数据开始堆积起来,向我们表明,太多的屏幕时间可能会对发展中的思维产生破坏性影响。更糟糕的是,大多数儿童的科技设备都具有数字屏幕显示功能。因此,我们决定投入额外的资金来使Moxie的脸部完全投影,从而使我们能够创建一个具有自然弯曲边缘的圆形人脸屏幕,而不是平面显示器。这使与Moxie的交互更加逼真,逼真和可信。实际上,仅通过脸部的这种3D外观,Moxie才可能与孩子进行实际的眼神交流。因此,Moxie的脸不仅可以保护儿童免受过多的上映时间,而且还使互动体验更加真实。

第二,对话引擎。到目前为止,智能扬声器和语音助手需要重复使用唤醒词来启动命令。 Moxie的对话引擎是不同的。它遵循自然的对话,无需使用唤醒词(例如“ Hey Siri”或“ Ok Google”)即可响应典型的通信流程。高级 自然语言处理  允许Moxie无缝地识别,理解和生成语言,从而使交互感觉更加个性化和自然。

第三,语音合成。 Moxie的语音与大多数机器人和语音助手中的机器人语音和单调声音不同。取而代之的是,Moxie使用自然和情感性的声音变化,这有助于传达更广泛的情感。这扩大了Moxie可以参加的社会情感课程的范围,同时还为交互带来了更多的逼真度和可信度。

第四,眼睛。 Moxie的动画大眼睛是最重要的功能之一。创新的眼动追踪技术使Moxie可以与孩子保持眼神交流,即使孩子在房间里四处走动。这种眼动追踪功能不仅可以创造出令人难以置信的逼真互动,还可以帮助孩子练习眼神交流。此外,大而生动的眼睛有助于夸大情感交流,因此孩子可以更轻松地识别某些情感。练习眼神交流和理解情感是社交情感课程中的两个关键发展目标。

最后,所有这些技术功能使与Moxie的交互具有逼真的自然感。 Moxie的多模式感官融合使Moxie意识到了环境及其用户。 Moxie的计算机视觉和眼动追踪技术有助于在孩子移动时保持眼神接触。 机器学习 帮助Moxie学习用户的喜好和需求,并识别人物,地点和事物。特殊位置的麦克风使Moxie能够听到声音的发出方向,并轻松转到声音源。触摸传感器使Moxie能够识别拥抱和握手。所有这些部分融合在一起,使体验非常逼真。

 

您能告诉我们一些使Moxie完美适合儿童的事情吗?

借助Moxie,儿童每天都可以进行有意义的游戏,其内容以儿童发展和幼儿教育的最佳实践为基础。每个礼拜都有不同的主题,例如善良,友谊,同情或尊重,并且孩子们的任务是帮助Moxie进行探索人类经验,思想和生活技能的任务。这些任务包括创造性的非结构化游戏,例如绘画,通过呼吸练习和冥想进行正念练习,与Moxie阅读以及探索对他人友善的方法。 Moxie鼓励好奇心,使孩子们发现周围的世界和周围的人。所有这些活动都可以帮助孩子学习并安全地练习一些基本的生活技能,例如转弯,眼神交流,积极聆听,情绪调节,同理心,关系管理和解决问题。

Embodied还与大英百科全书和Merriam-Webster合作,整合了Merriam-Webster的儿童词典,使Moxie能够提供适合年龄的定义和相关信息,以帮助儿童学习和理解新单词和新概念的含义。这是与Moxie进行的许多集成中的第一个,实现了Britannica和Merriam-Webster的共同使命,以激发好奇心和学习乐趣。

Embodied还开发了一个完整的生态系统,可以帮助父母支持孩子的Moxie旅程,并允许孩子以安全且得到父母批准的方式扩展对Moxie的使用:

  • 嵌入式Moxie父母应用程序提供了一个仪表板,可帮助父母了解孩子在Moxie方面的发展进度。该应用程序将通过与Moxie的活动提供对孩子的社交,情感和认知发展的关键见解。该应用程序还为父母提供了宝贵的建议和技巧,以增强孩子的Moxie体验和进步。
  • 在线儿童门户网站(称为全球机器人实验室,简称G.R.L.)提供了其他活动,游戏和故事,可增强Moxie的体验。
  • 每月Moxie任务包是旨在使儿童参与Moxie的新活动的邮件,还提供有趣的物品,如交易卡和贴纸。

随着时间的流逝,Moxie会更多地了解孩子,从而更好地个性化其内容,以帮助实现每个孩子的个人发展目标。英飞凌已采取了谨慎的步骤,以确保以高标准的隐私和安全性处理儿童和家庭提供的信息。我们希望Moxie完全通过COPPA(儿童在线隐私保护法)安全港认证,以便父母可以放心,因为Moxie采用了领先的数据完整性和安全性程序,并且对其系统进行了定期审核以确保完全合规。此外,个人可识别数据和敏感信息将以最高的安全级别进行加密,并且只能通过只有父母可以访问的唯一密钥才能解密。

 

Moxie面临哪些自然语言处理挑战?

在Embodied,我们努力重新定义人类与机器的交互方式,尤其是通过自然语言处理进行对话时。因此,我们决定创建SocialXTM,该平台使儿童能够通过自然互动(即面部表情,对话,肢体语言等),激发信任,同理心和动机以及更深入的参与来与Moxie互动发展能力。借助SocialXTM,Embodied引入了全新的机器人类别:动画同伴。 “动画”是指栩栩如生,SocialXTM允许Moxie以一种新的,先进的技术形式体现人类的最佳状态,从而可以激发新的学习方式。

自然语言处理是我们自然对话引擎的核心,我们不懈地努力创建的对话引擎具有许多独特功能。

我们研究的主要功能是Moxie能够集中与单个用户的对话,并分离出背景对话和声音,因此Moxie仅对用户做出响应。这允许更集中和更人性化的交互。这是许多人所说的“鸡尾酒会问题”的解决方案。当您参加鸡尾酒会时,当您试图与一个人保持对话时,周围有很多人在一个房间里聊天,这对人类来说并不困难。对于计算机,这是非常困难的。我们如何确保Moxie仅响应单个用户的讲话,而不会被背景噪音,对话,电视等吸引住。我们有很多方法可以解决此问题。

  1. 我们使用视觉系统来确定谁在看和面对Moxie。
  2. Moxie的前面有许多麦克风,可以告诉我们声音的来源。
  3. 然后,我们可以使用机器学习将声音与在Moxie面前讲话的人匹配。这使我们可以过滤掉其他对话,并专注于单个用户。

通常,市场上的会话代理通过使用诸如“嘿(设备,后面是问题)”之类的唤醒词来避免“鸡尾酒会问题”。此唤醒词允许会话代理侦听唤醒词,并且仅在说出该唤醒词时做出响应。但是,由于Moxie可以专注于单个用户,因此Moxie不需要唤醒字即可激活响应。

我们希望确保Moxie的对话引擎如此复杂,以至于能够根据上下文了解对话的响应。这样可以进行更细微的对话。例如,Moxie可以理解“我不知道”和“不”背后的不同含义。

 

关于Moxie或Embodied,您还有其他要分享的内容吗?

我们已经与一个敬业的团队一起为这个项目工作了四年,他们不懈地致力于实现使Moxie栩栩如生的惊人发明。现在,我们很高兴最终将Moxie带到家庭,以帮助他们的孩子发展社交情感。因此,我们期待旅途!

感谢您的采访,我很高兴听到您最初从皮克斯短片中获得的灵感,以及您如何’自从追求您的生活激情。希望了解更多信息或想要订购Moxie的读者,请访问 体现公司.

安东尼·塔迪夫(Antoine Tardif)是 Futurist 他对AI和机器人技术的未来充满热情。他是 BlockVentures.com并已投资了50多个AI和区块链项目。他是的联合创始人 Securities.io 一个专注于数字证券的新闻网站,是unite.AI的创始合伙人。他也是 福布斯技术委员会。