首页 > 科技 > 利用Google AI技术训练小狗,还真的做成了

利用Google AI技术训练小狗,还真的做成了

训狗通常需要一位人类训狗师,但如果没有训练师,又如何达到训练的目的呢?一家名为Companion Labs的企业,发明了首款靠人工智能AI驱动的训狗设备。其中,计算机视觉是这款机器展开运作的关键,它能实时检测狗狗的行为从而调整其对奖励的传递以此来强化所期望的行为。比如,利用其计算机视觉来探测狗狗什么时候正在做令人满意的事情并发出奖励。

这款名为CompanionPro的训练器看上去像是苏联时期的太空加热器,里边装有图像传感器、Google Edge TPU AI处理器、无线连接、灯光、扬声器和一个专有的“狗食发射器”。

在这篇文章中,TensorFlow团队将分享如何开发系统来了解狗的行为并通过训练来影响狗的行为,以及我们将计算机小型化以适应B2B产品的过程。

通过技术改善我们的宠物的生活

当今的技术具有改善我们宠物生活的潜力。作为一个私人例子,我是一只4岁大的救助猫阿黛尔的宠物爸爸。像其他许多宠物父母一样,我全职工作,每天只让我的猫独自呆在家里长达8个小时。当我在工作或出门在外时,我会为她担心,因为我从不希望她感到孤独或无聊,没水或没有食物或在我不在的情况下生病。

幸运的是,在我不在的情况下,可用的技术使我可以检查她并改善她的福利。例如,我有一个自动宠物食品分发器,每天为阿黛尔分配2顿饭,因此她总是按时按正确的份量喂食,我有一个自动清洁的垃圾箱,这样她就可以全天保持干净的垃圾,而且我使用了Whistle GPS追踪器来帮助确保她永远不会迷路。

尽管这些设备可以帮助我确保宠物的身体健康,但我始终很好奇,希望进一步采用技术来解决动物福利问题。如果我们可以使用技术与动物交流怎么办?当我们不在他们身边时,如何让他们保持开心?每天有数以百万计的狗独自一个人呆在家里几个小时,还有数以百万计的狗被安置在收容所中,他们很少受到个人照顾。我们可以利用这段时间来改善人与宠物相处的质量吗?这些是我们Companion团队有兴趣解决的问题。

在过去的两年中,我们小动物行为专家和工程师团队组成的专家团队一直在研究一种新的设备,该设备能够与狗互动,并在人们无法与狗在一起时自动进行训练。我们的首款产品CompanionPro通过灯光,声音和零食分配器与狗互动,以处理诸如坐下,坐下,停留和召回之类的基本服从行为。

我们的用户是狗收容所和企业,他们希望帮助他们改善狗的训练服务。尽管有证据表明,对基本服从命令有反应的狗更有可能在永久性的家中被收养,但庇护所通常资源匮乏,无法为所有的狗提供训练。小狗日托告诉我们,他们很难找到足够的训犬师来满足其设施中对训犬服务的需求。专门从事犬训练的机构告诉我们,他们希望教练能专注于教犬高级任务,但他们不得不花费大量时间重复相同的练习,以确保犬对基本的服从行为有所反应。幸运的是,机器擅长以完美的一致性和无限的耐心执行重复性任务,这使我们走上了创建自主训练设备的道路。

构建该产品提出了许多挑战。我们首先必须进行实验以证明我们可以在没有人为训练员的情况下训练狗,然后建立模型来了解狗的行为并确定如何对狗进行反应,最后将我们的技术微型化以使其适合产品化,并可以售给相关企业。

使用TensorFlow了解动物

正如良好的沟通始于人与人之间的良好聆听一样,良好的犬只训练也取决于对他们的信号和行为的良好理解。为了了解TPU帮助我们解决的那种感知问题,我们需要了解训练员认为哪种信息对理解狗很重要。以下是人类训练人员在训狗过程中可能会问自己的一些问题:

这只狗在吃零食吗?

这只狗是否表现出“坐着”行为?

这只狗是否已经知道“按下”命令?

这只狗以前接受过训练吗?

狗在哪里?

这只狗离我有多远?

这只狗在注意我吗?

我在和吃食物的狗一起工作吗?

狗在叫吗?

为了回答这些问题,我们选择使用机器学习,尤其是深度学习,它擅长解决与人类感知有关的问题,并随着时间的流逝寻找行为模式。因此,深度学习已广泛应用于计算机视觉和自然语言处理等领域。我们的第一步是绘制出我们有兴趣收集的所有信号。我们的动物行为小组列出了我们希望收集的所有身体姿势和发声信息,以便能够了解狗的训练准备情况。

为了训练我们强大的计算机视觉神经网络,我们选择使用TensorFlow作为我们的深度学习平台。与使用多个GPU来完成同一任务相比,使用Google的云TPU训练我们的网络既快捷又便宜。然后,可以使用我们的台式机在GPU上本地运行生成的模型,以确定狗的实时行为并最终训练狗。我们的模型会分析狗的肢体语言和发声,以了解它们的当前状态并使其参与。

图1:同伴识别不同狗姿势的示例。 上面是Indy,这是我们在幼犬日托中的测试犬之一。 在训练数周后,Indy的妈妈看到了他对“坐着”和“回忆”的反应能力得到了改善。图2是Boomer是我们CEO的狗

自主与动物互动

一旦我们对能够实时了解狗的行为的能力充满信心,我们便开始对该行为做出反应以建立互动。我们的设备配备了零食分配器,灯光和扬声器,可以通过声音和视觉信号与狗进行交流,并奖励他们。伴侣使用基于奖励的积极强化训练。这意味着我们的设备会为期望的行为提供奖励,以提高这种行为的频率。

这些步骤与训练师将采取的步骤相同。让我们想象一下,当我们告诉狗“坐下”时,我们正试图教它坐下并停留。我们的第一步是使狗适应CompanionPro。为了使狗习惯于该设备,它将首先无条件地给予狗零食。当监督狗的人确信狗对设备感到满意时,他们可以离开房间,让狗与它进行自动交互。到目前为止,我们与庇护所和日托设施中的数百只狗一起工作,使我们能够适应所有品种和年龄的95%以上的狗适应我们的CompanionPro设备。

在整个训练过程中,该设备将始终确保狗准备好工作,寻找狗舒适且渴望互动的迹象。然后,CompanionPro将等待狗自然坐下并立即奖励该行为。当狗开始坐更多时,设备将引入口头命令“ sit”。然后,使用自适应学习方法,CompanionPro可以增加狗需要坐下来才能开始进行停留的时间。通过多次训练,我们可以将“静坐”持续时间从几分之一秒增加到几分钟。当一只狗经历了多种行为的这一过程后,我们就可以开始与狗玩游戏,在同一会话中要求多种行为,因此狗会加深对口头命令的理解。例如,我们可以在“坐”,“趴下”和“回来”之间切换。

使用在大型台式机GPU上运行的该系统,我们已经能够让狗参与CompanionPro训练。我们测试人员的监护人都报告说,它们的狗对口头命令的反应更灵敏,通常在家训练时会更专心。

SF SPCA行为诊所治疗的最常见疾病之一是分离焦虑症。患有分离焦虑症的狗独自一人时会非常沮丧,当监护人离开家时,它们会发声,出现痛苦的胃肠道问题或破坏家具。这使治疗变得困难,因为狗只在独自一人时才表现出症状,即没有人在周围帮助抚慰它们。伴侣的小组与SF SPCA行为小组合作,测试了伴侣训练作为犬只监护人离开家时患有分离焦虑症并减少痛苦迹象的方法的效果。我们的早期结果表明,我们的自动训练方法可以缓解分离焦虑症的症状,从而改善狗的福利和监护人的生活质量。

经过成功的训练试验和早期迹象表明我们的技术可以帮助减轻分离焦虑症后,我们证实了自主训练的有效性,并且可以使狗及其监护人受益。下一步是将我们的技术包含在足以用于狗业的实用产品中。

小型犬的训练过程

我们使用的测试系统需要带有TensorFlow的大型台式机GPU,这给我们工作的庇护所和宠物狗行业带来了多重挑战。除了我们的开发设备的实际重量之外,它们还很昂贵,而且远远不能防狗。为了适合实际产品,我们必须寻找解决方案以使我们的系统小型化。

我们正在寻找一个移动平台,该平台仍具有运行我们的神经网络所需的计算能力,以便实时了解和响应狗的行为。在评估了多个移动平台之后,我们选择了Google EdgeTPU,这将使我们能够运行TensorFlow的轻量级框架TensorFlow Lite。我们发现Google的EdgeTPU特别允许我们采用移动计算机视觉模型,并将其运行速度比以前的系统快4倍。

自小型化以来,我们已经能够使用我们的移动平台训练更多的狗,并努力包装我们的产品。我们迫不及待地希望通过TensorFlowLite帮助成千上万的狗找到属于自己的家并与其监护人建立持久的纽带。

结论

在Companion,我们开发了一种使用Google的TensorFlowLite(和EdgeTPU)的设备,可以自动训练狗对多种行为的高级响应能力,包括坐下,趴下,停下等等。我们相信,这将通过降低成本为所有狗提供丰富的养育和训练,从而对全美国精简收容所的收养率和保留率产生非常大的积极影响。 Google的EdgeTPU使我们能够了解狗与设备互动时的行为。这种理解可以使CompanionPro设备通过在狗表现出期望的行为时给予食物奖励来使用精确的正强化。最终,它可以帮助我们了解和改善宠物的生活。

更多关于Google EdgeTPU与TensorFlow的现实示例

Gravitylink推出的Model Play与Tiorb AIX(钛灵AIX)也能完美支持Edge TPU。AIX是一款集计算机视觉与智能语音交互两大核心功能为一体的人工智能硬件,Model Play是面向全球开发者的AI模型资源平台,内置多样化AI模型,与Tiorb AIX结合,基于Google开源神经网络架构及算法,构建自主迁移学习功能,无需写代码,通过选择图片、定义模型和类别名称即可完成AI模型训练。

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/293197.html