DeepSeek利用阿里巴巴开源AI技术提升OCR性能 | DeepSeek借助阿里巴巴开源AI技术增强OCR表现

中国人工智能初创公司DeepSeek周二发布了升级版光学字符识别(OCR)模型——DeepSeek-OCR 2,并引入了由阿里云开发的开源系统以提升性能。新模型用阿里云的轻量级Qwen2-0.5b模型取代了原有架构中的关键组件,这一变化突显了中国开源生态系统在推动国内AI技术发展中的作用。

DeepSeek在其研究论文中表示,替换原先依赖的微软支持的OpenAI开发的CLIP模型,使其OCR系统能够更像人类一样识别和解读图像中的文本,采用“灵活且语义连贯的扫描模式,基于固有的逻辑结构”。这次升级仅在三个月前推出第一版本后不久,显示出公司对技术持续优化的决心。

via SCMP Full Text Feed
 
 
Back to Top