2025年5月23日,字节跳动旗下人工智能应用豆包(Doubao)正式上线实时视频通话功能。用户需将App更新至最新版本,在对话框中选择“打电话”并切换至视频模式即可使用。
该功能基于豆包最新的视觉理解模型,具备多模态融合能力。通过摄像头捕捉画面,结合视觉理解模型分析场景内容,提供即时互动问答。还可解析视频中的物体、场景及文字信息,通过接入互联网数据库,动态更新信息库,确保回答的准确性和时效性。
豆包视频通话功能可应用于多种场景,如在旅行中可以讲解景点的历史背景、建筑特色;在博物馆中能快速识别并反馈展品相关知识;在家中可提供食谱建议、展示烹饪视频和步骤;在工作场景中能联网搜索最新的市场报告等。
为适配视障需求,豆包团队还进行了语音交互升级、低延迟响应、无障碍适配等三大核心升级。
相关概念股:
博通集成、会畅通讯、星宸科技、润欣科技、视觉中国、海天瑞声。
注:此文仅代表作者观点
