您当前的位置：首页 >> 热点 >> 财经

无需多次唤起可流式交互，国内首个所见即所得模型亮相

2024-07-05 来源：北京日报客户端

7月5日，在世界人工智能大会期间，商汤科技发布国内首个所见即所得模型“日日新5o”，实现了无需多次唤起，而是如同人与人之间实时交流的“流式交互”，对标GPT-4o。

“你知道我现在在哪吗？”当工作人员和“日日新5o”打了个招呼，它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼，判断出工作人员身处世界人工智能大会会场，并表示在这个地方可以“好好学习”。接下来，工作人员拿了一只小狗玩偶，“日日新5o”准确识别出并描述了小狗的外貌、表情以及重要穿戴。

随后，在镜头下，工作人员随便翻开一本书的任何一页，“日日新5o”都能娓娓道来进行介绍。这个过程中，系统并非简单地进行文字识别，而是识别图文后给出了普通人容易理解的总结，这些在瞬间就能完成，做到实时交互。

工作人员还现场发挥“画功”，随手画了一只简笔画小兔子，“日日新5o”直呼画得可爱，而在工作人员又画了一个微笑表情后，它从这个平静的表情中捕捉到了笑意，工作人员又改了一笔把嘴巴画大增添了舌头，“日日新5o”看到后立马说道，“这表情开心多了”。

能听会看，还会主动找话题，如同真人聊天一般的交流对话，工作人员介绍，这种交互模式特别适用于实时对话和语音识别等应用，其多任务适应性强，能够在同一模型中自然处理多种任务，且根据不同上下文自适应调整行为和输出，实现“对标GPT-4o”的交互体验。

为了让更多企业低门槛接入并使用“日日新”大模型体系，商汤于近期推出了“大模型0元Go”计划，凡是“日日新”的新注册用户，都可获得涉及调用、迁徙、训练等多项免费服务。同时，平台还将免费提供5000万Tokens包，并且提供专属搬家顾问，帮助OpenAI用户实现零服务成本迁移。

来源：北京日报客户端

24小时热文

欢迎您访问星网news！