

AI宠物翻译器PettiChat以800多元售价预售达2万单,具备猫狗叫声实时转译(延迟1.2秒)、情绪与需求推测、宠物音色克隆、位置追踪及安全警报功能,依托百万级声纹样本训练与大模型技术,虽准确性存疑,但开创人宠新型交互方式。
800多块钱。
买一个能听懂猫狗说话的AI翻译器,大家会掏钱不?
忘了说,这东西还是能实现人和小动物「双向对话」的那种:
△源自:YouTube“PettiChat”账号
说出来友友们可能不信,据了解这个叫PettiChat的宠物翻译器——
目前已经预售「2万单」了。(doge)
它能够将狗狗的吠叫和猫咪的喵喵声转换成完整的句子。
而且据说准确率还能高达95%……
其实,我猜。
大家心里跟我想的一样,这玩意儿,到底是不是鸡肋产品啊???
u1s1,宠物翻译器绝对算不上什么特别新鲜的东西。
我随手在淘宝一搜,就能跳出一堆「情感翻译」「宠物智能翻译」之类的小硬件。
主打的卖点也都差不多——
能识别猫狗情绪、判断宠物需求、帮铲屎官理解毛孩子的内心OS:

以至于刚看到这个产品的时候,我第一反应是:
哦?又一个铲屎官赛道小玩具。(不屑.jpg)
等我点进demo展示,我感觉我可能大E了……
因为这个名为PettiChat的宠物翻译器,特殊就特殊在,它想做的不只是识别宠物情绪——
而是直接把目标打到了「猫狗同声传译」上。
按照官方说法,这个800多块钱的小设备,可以挂在宠物项圈上,实时捕捉猫狗叫声。
然后通过配套App里的AI模型,就把宠物叫声转成一句人能看懂的话:

△
而且吧,翻译延迟号称只有1.2秒。
也就是说,你家猫刚冲你“喵”完,设备那头就会传来声音:我饿了!别碰我!快来陪我玩~
(听上去比一些人类的AI翻译工具反应还快):

然后,离谱的技能点又来了,当我以为它只能同声传译的时候,我发现——
这玩意儿,还自带宠物位置追踪和安全警报的功能???
就比如铲屎官可以在App里设置安全区域,如果家里宠物跑出范围了,手机会收到警报。

不仅如此,它还能直接在App里,通过语音模型来「克隆」宠物的音色。
从官方展示的demo看,不需要额外的设备,通过语音模型,这产品就能生成一段带有宠物声音特征的语音回复。
这下好了,AI翻译进军宠物赛道还没多久,声音克隆也跟着一起上车了:

说到这儿,感觉这产品多少有点魔幻的……
大家也都知道,以前铲屎官理解宠物,靠眼神、靠经验、靠玄学,最多再加一点「它是不是又骂我呢」的自我脑补。
emm…感觉PettiChat这个产品属于是是给猫狗配一个随身字幕组??
当然了,这里面最容易引发争议的,也正是这个「翻译」 本身。
毕竟宠物翻译这个东西听起来就蛮鸡肋…
翻译的对不对,翻译的准不准,小猫小狗也说不上来,人也说不上来,全凭产品说啥是啥了。
带着这点小怀疑,我顺藤摸瓜跑去官方寻摸了一圈,想看看人家所谓「让猫猫狗狗和人类丝滑交流」的科学原理:

简单说,PettiChat背后主要靠的是一套基于大模型的「声音识别」和「情绪推理」系统。
第一步,先把声音喂进去——
用超过几百万条宠物声音样本训练,识别猫狗叫声的频率、时长、声纹特征,这一步解决的是「听到了什么」。
第二步,再让模型识别——
通过「行为与语言双重建模」,试图把猫狗的叫声和动作,拼成一个动物行为世界模型,这一步解决的是宠物它想干嘛,本质上是AI根据叫声特征做出的情绪和需求推测。
第三步,把识别出的东西变得够快——
底层用Transformer架构跑大模型,再叠上各种算法,让模型能够做出快速实时翻译。

就是这么个能翻译、能克隆宠物音色、能追踪定位的AI宠物硬件产品。
据了解,单单预售就已经卖出2万台了…
问题又来了。
靠叫声的频率、时长、声纹特征,就能识别出宠物内心OS,这事儿真的靠谱吗?
你还真别说,这个方向不是PettiChat凭空想出来的。
早在2005年,匈牙利罗兰大学的Pongrácz团队就做过一项挺有意思的研究。
他们找来一种叫Mudi的匈牙利牧羊犬,录下它们在不同场景里的叫声——
比如陌生人靠近、独自在家、出门散步前、想要球、和人玩、进入攻击状态等等。
结果人家还真发现,不同情境下的狗叫声,在一些声学特征上确实有明显差异:

像谐噪比、基频、峰值频率、吠叫间隔这些听起来很硬核的指标,都会随着场景变化而变化。
更有意思的是,人类听众也能凭这些声音差别,把一部分狗叫和对应情境对上号~
所以猫狗的叫声里,确实携带一部分情绪和意图信号。
人类能听出一些区别,AI当然也可以去学这些区别,PettiChat这类产品的逻辑,肯定也是有依据在的。

但说实话,至于官方说的95%左右准确率到底有多准,对于铲屎官来说,可能反而没有那么关键了。
真正让人上头的,是PettiChat这类硬件给了人和宠物之间一个新的回应方式。
哪怕你明知道这里面有AI推测,也有人类包装,但那一瞬间,宠物好像真的离你更近了一点!!!

最后的最后,还是想说,AI宠物赛道还是太卷了。
卷到我压根想不到,在这个人和人之间沟通都费劲的时代,宠物和人能实时对话了。
甚至嘛,我已经能想到「AI翻译赛道」接下来的产品线了——
基础版:翻译猫狗。
Pro版:翻译鹦鹉、仓鼠、龟
当然也可以不局限于宠物翻译哈,再比如——
Max版:翻译甲方说的「再改一版」。
企业版:翻译领导说的「辛苦了大家先回去吧」。
究极版:翻译相亲对象那句「我觉得你挺好的」。
(我瞎说的)
参考链接:
[1]https://baike.baidu.com/item/Pettichat/67712810
[2]https://pettichat.com/
[3]https://www.sciencedirect.com/science/article/abs/pii/S016815910500420X
本文来自微信公众号“量子位”,作者:梦瑶