5月23日,豆包APP正式推出实时视频通话服务。当用户在通话界面激活视频画面时,该应用可通过其先进的视觉理解模型与用户展开即时问答交互。在旅行场景中,用户只需打开视频对话窗口即可查询当前景点的历史渊源、文化特色及游览路线等实用信息。这项创新功能依托于豆包最新研发的视觉智能系统,在图像识别基础上实现了多维度语义解析与逻辑推演能力,并能将视觉元素与语言指令有机整合完成深度分析处理。
值得关注的是,该视觉模型不仅具备强大的图文交互能力,在复杂逻辑运算方面同样表现出色:可解答高等数学题目、解读学术论文图表数据、检测并修复真实编程代码中的技术问题等专业任务。为增强对话系统的实时响应效率与信息更新速度,此次升级特别引入了联网检索技术模块,使系统能够即时获取网络最新资讯数据流以支撑精准交互服务。