来源:新京报
当下,一场看似无序的AI硬件跨界潮正在上演:阿里做AI眼镜,影石做无人机,大疆做扫地机器人,字节与中兴推出AI手机,腾讯和影石推出AI麦克风……一系列动作背后,是为了争夺下一代智能硬件入口,打入新蓝海,还是基于自身技术栈的“顺势而为”?
近期,新京报贝壳财经记者对话了腾讯云副总裁、腾讯会议天籁实验室主任商世东,以及影石Insta360首席战略官袁跃、影石Insta360硬件产品经理郑进聪,通过双方合作研发的AI麦克风,透视“大厂”联合硬件公司跨界合作的逻辑。
运动相机公司卖起录音麦克风
作为一家以运动相机为主要产品的公司,影石今年下半年连续推出了全景无人机“影翎A1”和Wave AI录音全向麦克风。贝壳财经记者在影石总部看到,该“麦克风”造型奇特,外观看起来是一个可以随着说话人的声音而转向的摄像头。采访现场,该摄像头就随着商世东等人的发言而不断“扭头”。
事实上,相比全景相机,收音并非影石一贯擅长的领域。对于在这一领域“搞跨界”,袁跃告诉记者,虽然现在AI硬件的趋势火热,但影石并没有纯粹被趋势裹挟,“影石做产品规划的时候,不是按照‘追随’这个思路。我们讨论的是在技术栈的过程当中,可以将哪些能力产品化,音频能力的锻炼是必须积累的技术栈,最终我们和腾讯天籁一起合作积累了这样的能力,并选择了Speakerphone(带扬声器的会议麦克风)这一产品形态。”
郑进聪则认为,大语言生成式的产品在开会场景下有天然优势,会议内容转成文字并做成会议总结和会议纪要的处理能力,恰巧是大模型擅长的,“这方面落地的需求比较强,刚好这款产品不仅可以延伸影石本身影像方面的能力,与技术外溢相呼应,同时也可以打造我们从生活到工作的场景扩展。”
值得注意的是,与影石此前熟悉的C端市场不同,带有摄像头的“录音麦克风”对应了不少B端场景,这意味着影石不仅在领域上进行了“跨界”,还接触了与C端消费者们风格大相径庭的客户群体。
对此,郑进聪表示,影石并没有贸然进入B端,“第一代Link 2022年上市的时候,在中高端网络摄像头的价位段占了比较大的市场份额。在用户看来,并没有因为影石之前是做运动相机的,而不接受你进军会议领域。会议产品线不是卖一个独立的产品,跟零售自营模式会有较大的差异。我们选择跟合作伙伴一起出发,无论是代理商、集成商,还是腾讯会议,我们作为一个整体面向用户,而不仅仅是提供一个单品,用户只需要描述需求,我们提供的是一整套方案和服务。”
“大厂”+硬件独角兽,探索更多场景应用空间
商世东坦言,与影石的合作是其团队“打磨周期最长、挑战最大”的项目之一,“影石追求近场如耳机般清晰、远场如面对面交流的统一听感,这在声学上本是互相制约的目标。不过,最后验收通过,三年辛勤的汗水得到了认可。”
对于此类“大厂”+硬件独角兽的合作范式,商世东告诉贝壳财经记者,在大语言模型和深度学习时代,很多任务训练要求在环节上所有的模块之间共同定义一个训练目标,此时就会出现很多合作的案例。
“在满足用户体验的技术指标上,尤其是制约性的技术指标,比如设备延迟、设备功耗、芯片算力,怎么找到更好的平衡点,需要算法、软件和设备厂商,大家共创和紧密协作”。
面向更加广泛场景的智能终端,比如未来量产AI眼镜的“可能性”,商世东表示,在其他赛道,只要可以做到“连接”的场景,包括人与人的连接、人与大模型的连接,都是未来可以想象的场景和赛道,“我们也尝试过天籁技术和AI眼镜的结合,目前还在探索中”。
相比腾讯看重“连接”,影石的关键词则是“延展”。袁跃告诉记者,影石的产品不是真正跨越边界,更多的是延展疆域,“影石不会做出跟我们技术栈完全相悖的产品,目前看起来我们的产品品类更加丰富了,但是事实上从核心的技术角度来讲,都用了比较多的复用。”
这种能力复用的逻辑,正在改写行业对跨界的认知,也印证了“专业能力互补”的行业共识:软件大厂输出算法与生态能力,硬件公司贡献工程化与场景洞察,或将成为未来的跨界新范式。