1. OpenAI发布AI驱动浏览器ChatGPT Atlas,基于Chromium引擎,提供实时内容总结、产品比较和数据分析功能,支持Agent模式。
2. 京东科技与Rokid乐奇达成战略合作,其购物智能体JoyGlance将首发登陆Rokid乐奇眼镜,支持语音交互和生物识别。
3. 字节跳动与高校合作推出Sa2VA模型,结合LLaVA和SAM-2技术,实现视频内容理解和角色/物体追踪分割。
4. 百度计划于2025年11月发布小度AI眼镜,并计划年内开售,功能包括第一视角拍摄、边走边问、卡路里识别与识物百科、视听翻译与智能备忘。
5. 上海人工智能实验室与浙江大学等机构推出IWR-Bench,评估大语言模型视频转交互式网页代码能力,要求模型从视频理解操作流程,重建网页动态交互行为。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

