6月18日,DeepSeek网页及APP端新增了“识图模式”,并显示“图片理解功能内测中”。同一天,DeepSeek多模态团队负责人陈小康在社交媒体上发文称,视觉模式已在网页和应用上正式上线。

6月19日,实测发现DeepSeek的识图功能并不太稳定。上传一张DeepSeek创始人梁文锋的照片时,系统将其识别为字节跳动的张一鸣;再上传另一张梁文锋的照片,结果依然如此。上传张一鸣的照片时,DeepSeek识别正确。但在新对话中再次上传张一鸣的照片,DeepSeek将其识别为寒武纪创始人陈天石;接着上传梁文锋的照片,系统仍然认为是陈天石。多次对话中,DeepSeek还曾表示“无法回答问题”。

DeepSeek解释说,目前的“识图功能”其实是“读图”。支持的图像文件上传和视觉识别为OCR模型,即读取图像中的文本,擅长从上传的图像(如PDF、Word、Excel、PPT、JPG等)中读取文本,并处理该文本;而不是多模态视觉语言模型(VLM),无法以像素级别“看到”物体、人脸或场景。对于将梁文锋识别成其他人,DeepSeek表示自己没有人脸识别模块,不会“看脸”只会“看字”,如果照片中只有一张脸,系统只能回复图片中没有文字内容。

测试中,上传带有文字的图片,如“货拉拉被约谈”的新闻封面,DeepSeek基本可以识别出图中内容,但将图中的“货拉拉”误认为“货拉业”,并指出可能是图片中的字打错了。对于“新东方集团总结大会”的视频截图,DeepSeek可识别出图中的信息,并且精确捕捉到俞敏洪也在图片中。对于怀素的草书作品,DeepSeek可以识别部分文字,但将“玉露凋伤枫树林”误认为“王右丞诗枫桥”。对于Yum! Brands宣布出售必胜客业务的英文公告截图,DeepSeek则能正确识别并翻译。
猜你喜欢
NASA 测试“在轨加油枪”,可自动为深...
IT之家 6 月 27 日消息,未来的深空任务可能无法仅靠发射时携带的推进剂抵达目的地,而是需要先在轨道上完成补给。多年来,美国国家航空航天局(NASA)一直研...
READ MORE花68元,我们让豆包干完了一个小团队的活
前两天,小雷做了一篇针对专业版豆包和免费版豆包的对比评测,在那篇文章中,不少读者都对专业版豆包的能力产生了浓厚的兴趣,希望我们再测一测其他应用场景。 既然大家都...
READ MORE西安交通大学研发新型钽合金:2000℃ ...
IT之家 6 月 27 日消息,西安交通大学宣布,该校金属材料强度全国重点实验室研制出 2000℃ 至 2400℃ 超高温区承载的塑性合金,为新一代超高温合金的...
READ MORE最新发布
-
《BanG Dream! 交织的乐章》预约正式开启!封闭测试...
综合新闻, 2026-06-27 -
NASA 测试“在轨加油枪”,可自动为深空任务补能
综合新闻, 2026-06-27 -
花68元,我们让豆包干完了一个小团队的活
综合新闻, 2026-06-27 -
西安交通大学研发新型钽合金:2000℃ 下拉伸屈服强度提高一...
综合新闻, 2026-06-27
热门
-
你的面子走不了
- 作者
- 2026-06-27
-
《BanG Dream! 交织的乐章》预...
- 作者
- 2026-06-27
-
NASA 测试“在轨加油枪”,可自动为深...
- 作者
- 2026-06-27
-
花68元,我们让豆包干完了一个小团队的活
- 作者
- 2026-06-27
-
西安交通大学研发新型钽合金:2000℃ ...
- 作者
- 2026-06-27
-
你的面子走不了
- 作者
- 2026-06-27
-
《BanG Dream! 交织的乐章》预...
- 作者
- 2026-06-27
-
NASA 测试“在轨加油枪”,可自动为深...
- 作者
- 2026-06-27
-
花68元,我们让豆包干完了一个小团队的活
- 作者
- 2026-06-27
-
西安交通大学研发新型钽合金:2000℃ ...
- 作者
- 2026-06-27

