
家庭的具⾝智能可拆分为感知、思考、执⾏三个关键层⾯,共同构建智能化、⾃动化的家庭服务体系
-
感知层
终端感知(视觉) -
思考层
智慧决策(语言) -
执行层
动作执行(动作)
感知层(Perception):多模态环境理解
依赖激光传感器、视觉传感器、微波传感器、环境探测器 持续收集家庭环境的全面数据
支持多模态输入(Multi-Modal Input),包括:
-
视觉
通过摄像头识别物体、空间布局和用户活动 -
语音
通过麦克风进行语音识别和自然语言交互 -
环境数据
检测空气质量、温度、湿度、CO浓度、人体活动等关键信息
这些多模态输入能够提供实时、全面的家庭环境理解,使系统精准适应用户需求,并动态调整任务执行策略。
思考层:AI 赋能的智能决策
采⽤多模态⼤模型进⾏推理分析
结合家庭边缘计算⽹关和云服务,⾼效处理数据并智能决策。
处理多模态数据(图像、语⾳、⽂本、传感器数据),精准理解⽤⼾需求,并优化任务执⾏。
执⾏层:智能机器⼈协同⼯作
多种智能家居设备 执⾏具体任务,包括:
特种机器⼈,如窗帘机器⼈、⻔锁机器⼈、扫地机器⼈等,实现特定家务的⾃动化。
核⼼家庭服务机器⼈,具备 “⼿、脚、脑”,能够执⾏更灵活、更复杂的家庭任务,如物品搬运、清洁、照护等。