5月23日最新消息显示,社交平台豆包正式推出实时视频通话服务。当用户在通话界面激活视频画面后,该应用可通过智能视觉系统与使用者展开场景化交互问答。在旅行场景中,用户在旅行途中开启视频通话后,可随时向豆包咨询所在景点的历史渊源、特色亮点及游览路线规划等信息。这一创新功能依托于全新升级的豆包视觉理解模型构建而成——该模型具备出色的内容识别、逻辑推理及语义描述能力,能够整合视觉信息与自然语言输入进行深度分析与内容创作。
值得关注的是,在图像处理方面该模型展现出强大的跨领域应用能力:既可解析微积分方程式并提供解题思路,又能解读学术论文中的复杂图表结构;还能针对真实代码片段进行错误诊断和优化建议等高阶操作。据官方透露为持续优化对话系统的精准度与响应速度,此次更新特别新增联网检索功能模块,可即时抓取互联网最新动态数据以增强交互内容的时效性和参考价值。