今日消息显示,豆包APP正式推出实时视频通话功能。当用户在通话界面激活视频模式时,该应用可结合实时画面与用户展开智能问答互动。例如在旅行途中,用户通过开启视频对话即可向系统询问当前景点的历史渊源、特色亮点或游览路线规划等实用信息。
这一创新依托于全新升级的豆包视觉理解模型,在图像识别基础上进一步实现了内容推理与描述能力的突破。该模型不仅能精准识别图像内容并生成自然语言解释,更能将视觉信息与语言指令深度融合,在跨模态交互中完成解微积分题、分析学术图表、诊断程序代码等复杂逻辑计算任务。
据官方透露为优化对话质量与时效性保障,在原有技术架构基础上特别引入了联网搜索模块。通过动态连接互联网数据资源库的方式可即时调取网络最新资讯,并据此提供时效性强的知识服务支持。