专栏名称: 老刘说NLP
老刘,NLP开源爱好者与践行者。主页:https://liuhuanyong.github.io。老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
目录
相关文章推荐
九章算法  ·  Meta启动hiring ... ·  昨天  
今天看啥  ›  专栏  ›  老刘说NLP

也看大模型具身智能技术总结:从英伟达发布Cosmos模型说起

老刘说NLP  · 公众号  ·  · 2025-01-13 11:40
    

文章预览

今天是2025年01月13日,星期一,北京,天气晴。 我们来看看具身智能这个话题,昨天说到多模态模型做注视检测(凝视检测)受到关注,此功能可以跟踪人类的注意力,在无障碍领域‌里, 对于行动不便者,通过眼神操控电脑或智能手机,实现文字输入、网页浏览和游戏互动 。‌在虚拟现实(VR)和增强现实(AR)‌领域, 可以提升交互的真实感和沉浸度,用户可以通过视线选择屏幕上的元素,与虚拟环境互动‌ 。在‌教育‌场景里 自动分析学生在考试中的视线,帮助监考人员检测作弊行为‌ ;在医疗领域‌里帮助诊断某些神经系统疾病, 如帕金森病和多发性硬化症,通过分析患者的视线模式,医生可以获得更多关于患者病情的信息‌ 。 所以,我在想,具身人工智能 (Embodied AI) 是连接网络空间和物理世界的各种应用的基础,而多模态大模型 (M ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览