当前位置: 爱股网 > 股票新闻 > 正文

【华鑫计算机|行业周报】DeepSeek团队开源DeepSeek-OCR模型,OpenAI推出Atlas

时间:2025年10月28日 11:58

(来源:华鑫研究)

▌算力:算力租赁价格平稳,DeepSeek团队开源DeepSeek-OCR模型

2025年10月20日,DeepSeek团队开源的DeepSeek-OCR模型,以“上下文光学压缩”为核心突破,不仅重新定义了OCR(光学字符识别)的性能边界,更从底层逻辑上挑战了“文本作为AI核心输入”的传统范式,为大语言模型(LLM)和视觉语言模型(VLM)的发展开辟了全新赛道。

▌AI应用:文心一言周访问量环比+11.02%,OpenAI推出Atlas

10月22日,OpenAI正式发布了其首款AI浏览器产品ChatGPTAtlas,标志着该公司向传统浏览器市场发起了重要挑战。该产品的核心设计理念是将人工智能深度整合进用户的日常网络浏览过程中,其功能主要围绕三大支柱展开:原生嵌入的ChatGPT助手,使用户可在任意页面通过侧边栏进行即时交互与智能辅助;创新的“浏览器记忆”机制,能够系统记录并理解用户的浏览历史与上下文,以提供连续且个性化的支持;以及最具突破性的“AI智能体”功能,允许ChatGPT在用户授权下于页面内直接执行具体操作,从而将浏览器从被动的信息获取工具转变为能够主动参与并完成任务的智能代理。此次发布不仅被视为OpenAI在构建通用人工智能道路上的关键一步,也因其对现有市场格局的潜在冲击而受到业界广泛关注。

▌AI融资动向:医疗AI新星OpenEvidence获2亿美元融资,加速“临床决策支持”智能化

2025年10月20日,OpenEvidence宣布成功完成由GV领投的2亿美元C轮融资,Sequoia、KleinerPerkins、Blackstone、ThriveCapital、Coatue、Bond和Craft等知名机构参与跟投。本轮融资完成后,公司估值从今年7月的35亿美元提升至60亿美元。与此同时,公司创始人兼CEODanielNadler的个人净资产也大幅增长至36亿美元,较3个月前增加了13亿美元。成立仅三年的OpenEvidence,其发展轨迹与医疗AI的整体繁荣态势相契合。在全球医疗系统面临医生短缺、职业倦怠,以及需处理不断增长的医学文献等挑战的大背景下,该平台为医生提供即时、基于循证的临床问题解答,从根本上变革了行医方式。近期,公司推出了一款名为Visits的新工具,它能够自动从患者对话中生成医疗记录,还支持搜索具体细节并补充外部数据。这一业务拓展表明,公司正朝着更广泛的医疗AI应用场景迈进。

▌投资建议

2025年10月22日,Vertiv公布的2025年第三季度业绩全面超出市场预期,其当季的销售额达到26.76亿美元,同比增长约28%,且这一增速高于公司此前给出的指引上限;调整后每股收益为1.24美元。从订单端来看,公司第三季度订单与销售比率约为1.4倍,订单储备充足;过去十二个月有机订单同比增长约21%,业务增长韧性显著。单季度来看,2025年第三季度有机订单较2024年同期增长约60%,较2025年第二季度环比增长约20%,而订单增速的双重提升,充分反映市场对其产品与服务的需求热度。按区域来看,美洲与亚太地区增长强劲,EMEA地区则略有下滑。其中,美洲地区凭借各产品线及客户细分市场的广泛增长动力,实现43%的销售增长,调整后营业利润达5.02亿美元,利润率从去年同期25.3%提升至29.3%;亚太地区受AI需求加速推动,实现销售增长21%,调整后营业利润为6900万美元,利润率从去年同期10.2%增至13.2%。而EMEA地区受数据中心行业限制因素影响,调整后营业利润降至8400万美元,利润率从去年同期25.9%收缩至18.8%,未来该地区强劲的订单管道使其对未来季度增长存在加速预期。Vertiv本次发布的第三季度财报,充分彰显了其在液冷领域的规模化交付能力与技术适配优势。这一表现不仅有力印证了产业共识——液冷技术已从AI数据中心的“可选项”升级为“必选项”,尤其在高算力的需求场景下,液冷已成为突破风冷技术物理极限的核心解决方案;同时更向全球液冷产业链释放出明确的扩容预期信号。叠加Vertiv庞大积压订单所反映的强劲市场需求,这一趋势将持续驱动液冷产业链上下游的技术迭代与产能释放,我们持续看好液冷板块。

中长期,建议关注临床AI产品成功落地验证的嘉和美康(688246.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。

▌风险提示

1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。

算力动态:算力租赁价格平稳,DeepSeek团队开源DeepSeek-OCR模型

1.1

数据跟踪:算力租赁价格平稳

本周算力租赁价格平稳。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为5.73元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G价格为6.00元/时;显卡配置为A800-80G中,恒源云16+256G价格为7.50元/时。

1.2

产业动态:DeepSeek团队开源DeepSeek-OCR模型,开启光学认知新纪元

2025年10月20日,DeepSeek团队开源的DeepSeek-OCR模型,以“上下文光学压缩”为核心突破,不仅重新定义了OCR(光学字符识别)的性能边界,更从底层逻辑上挑战了“文本作为AI核心输入”的传统范式,为大语言模型(LLM)和视觉语言模型(VLM)的发展开辟了全新赛道。

DeepSeek-OCR的核心创新之处在于“上下文光学压缩”,也就是借助少量视觉token,高效地解码出远超其数量的文本信息。从理论上来说,它能够从视觉token中解译出超过10倍数量的文本token,使得单张包含文档的图像可以用远少于等效文本token的量级来表征丰富的语义。

作为连接视觉与语言的中间模态,OCR任务成为验证这一压缩范式的理想试验场景。它在视觉表征与文本表征之间建立了天然的“压缩-解压缩”映射关系,同时还提供了量化评估指标。

在OmniDocBench基准测试中,DeepSeek-OCR仅使用100个视觉token便超越了GOT-OCR2.0(每页256个token);以少于800个视觉token的表现,胜过了MinerU2.0(平均每页6000多个token)。在Fox基准测试中,在10倍压缩比内,DeepSeek-OCR解码精度可达约97%;即使压缩比接近20倍,精度仍能维持在60%左右,验证了“上下文光学压缩”的强大潜力。

DeepSeek-OCR采用统一的端到端VLM架构,由编码器(DeepEncoder)和解码器(DeepSeek-3B-MoE)组成:

编码器DeepEncoder负责图像特征提取与视觉token的压缩处理。它采用创新的“SAM-base+CLIP-large”串联结构,参数规模约3.8亿。DeepEncoder的输入模式主要分为两类:原生分辨率与动态分辨率,且每种模式均包含多个子模式。其中,原生分辨率模式下设Tiny、Small、Base和Large四种子模式;动态分辨率模式则由两种原生分辨率组合而成,其设计初衷是为了满足超高分辨率输入场景的应用需求。此外,系统还采用瓦片化(tiling)二级窗口注意力技术,可进一步有效降低激活内存消耗。在Gundam模式下,DeepEncoder输出的视觉token数量计算公式为n×100+256(n表示瓦片数量)。该模式与四种原生分辨率模式协同训练,最终实现单一模型对多种分辨率的支持能力。

解码器DeepSeek-3B-MoE基于DeepSeek的MoE架构,推理时激活6个路由专家和2个共享专家,仅激活约5.7亿参数,却能获得3B模型的表达能力,同时兼具类似500M小型模型的推理效率。

在实际应用与部署过程中,DeepSeek-OCR彰显出极高的工程价值。在训练数据生成层面,单张A100-40G显卡能够支持每日生成20万页以上的大语言模型/视觉语言模型训练数据;若采用20个计算节点(每个节点配备8张A100-40GGPU),每日可为LLM/VLM生成3300万页训练数据,从而为大模型预训练搭建起高效的数据底座。在计算开销优化方面,DeepSeek-OCR直接借助VLM基础设施(多模态系统内置视觉编码器),无需额外的计算开销,实现了效率与性能的双重提升。

DeepSeek-OCR的出现,引发了人工智能领域对“视觉输入vs文本输入”的深刻思考。特斯拉前AI总监、OpenAI创始团队成员AndrejKarpathy对其高度赞扬,认为它动摇了“文本作为AI核心输入”的传统认知,甚至提出“大语言模型的所有输入都应是图像”的大胆猜想——因为图像输入具有更高的信息压缩率、更强的信息通用性,如可处理粗体、彩色文本乃至任意图像,还能天然规避分词器的缺陷。

这种变革背后,是对“人类光学认知”的回归。正如人类通过眼睛、通用光学计算系统认识世界,DeepSeek-OCR让AI以更接近人类的方式处理信息,被业内视为“光学认知时代的开端”。

AI应用动态:文心一言周访问量环比+11.02%,OpenAI推出Atlas

2.1

周流量跟踪:文心一言周访问量环比+11.02%

本期(2025.10.16-2025.10.22)AI相关网站流量数据:访问量前三位分别为ChatGPT(1391.0M)、Bing(788.7M)和Gemini(271.7M),访问量环比增速第一为文心一言(11.02%);平均停留时长前三位分别为Character.AI(00:17:46)、Discord(00:10:56)和NotionAI(00:08:19);平均停留时长环比增速第一为Kimi(0.80%)。

2.2

产业动态:OpenAI推出Atlas,重新定义下一代浏览器

2025年10月22日,OpenAI正式发布了其首款AI浏览器产品——ChatGPTAtlas,此举被视为对传统浏览器巨头谷歌Chrome的又一次重大挑战。ChatGPTAtlas的核心设计理念在于将人工智能深度融入用户的日常浏览体验中,其功能架构主要围绕三大支柱展开。首先,浏览器原生嵌入了ChatGPT助手,用户可在任意网页通过侧边栏随时调用,实现即时的对话交互与智能辅助。其次,该浏览器引入了“浏览器记忆”机制,能够系统记录并理解用户的浏览历史,从而在后续任务中提供更具连续性与个性化的支持。第三,也是最具突破性的,是其所提供的“AI智能体”功能,该功能允许ChatGPT在用户授权下,直接在页面内执行具体操作,从而将传统的信息获取工具转变为能够主动参与并完成任务的智能代理。

从实际操作流程来看,ChatGPTAtlas力求用户体验的平滑与高效。用户在首次启动时,可便捷地登录其ChatGPT账户,并一键导入现有浏览器的书签、保存的密码及历史记录,实现无缝迁移。若用户将其设置为默认浏览器,还可获得为期七天的会员服务体验。目前,该浏览器的macOS版本已面向全球用户开放下载,涵盖免费、Plus、Pro及Go等多个用户层级,而Windows、iOS及Android版本也已在规划中,即将推出。此外,Beta版本已面向企业级用户开放,在开启相应权限后,教育和企业用户也能提前体验。值得注意的是,作为核心能力之一的“智能体模式”目前仅以预览版形式向Plus、Pro及Business等付费用户开放,这体现了OpenAI在商业化路径上的审慎考量。

在具体应用场景中,ChatGPTAtlas展现出强大的情境理解与任务执行能力。例如,当用户浏览网页时,可随时通过侧边栏启动与ChatGPT的对话,AI能够基于当前页面内容进行即时总结、解释复杂概念或协助处理具体事务。其“浏览器记忆”功能使得AI能够跨越会话,调用用户过往的浏览痕迹,例如,当用户询问“找出我上周浏览过的所有职位招聘,并总结行业趋势”时,ChatGPT能够基于记忆的数据给出整合性回答。用户对记忆数据拥有完全的控制权,可在设置中查看、归档或通过清除浏览历史一并删除相关记忆,确保了隐私的透明与可控。

智能体模式的引入,标志着浏览器从被动工具向主动助手的范式转变。该模式下,ChatGPT能够结合浏览上下文,执行更为复杂的任务序列,例如,根据用户提供的食谱,自动搜索生鲜电商、将食材加入购物车并完成下单;或在工作中,自动打开并分析团队历史文档,进行竞品调研,并生成汇总简报。在任务执行过程中,ChatGPT会主动寻求用户授权,例如询问是否允许其打开新标签页或执行点击操作。有早期试用者反馈,智能体的行为模式高度拟人,例如通过点击空白区域关闭弹窗,其用户界面设计和新手引导流程也获得了广泛好评,被形容为“丝滑”且“动画效果炸裂”。

然而,强大的能力也伴随着相应的风险与限制。OpenAI在构建智能体功能时,预设了多重安全屏障:例如,智能体无法在浏览器内运行代码、下载文件或安装扩展程序;无法访问用户本地计算机的其他应用或文件系统;在访问金融机构等敏感网站时,它会自动暂停操作,等待用户监督;用户亦可选择在登出模式下使用智能体,以限制其对敏感数据的访问和操作权限。OpenAI也坦承,智能体仍存在被网页中隐藏的恶意指令所操纵的风险,可能导致其行为偏离用户意图,甚至窃取已登录网站的数据。因此,安全保障与风险管控仍是其持续演进的关键议题。

从产品生态来看,ChatGPTAtlas的新标签页被设计为用户活动的中心枢纽,整合了提问、搜索、链接、图片、视频、新闻等多种功能入口,旨在提供一站式的高效体验。其写作辅助功能可在用户于任何文本框中输入时,提供实时的编辑与修改建议。个性化建议系统则能基于用户的浏览历史,智能推荐后续操作,如返回近期访问页面、深化主题研究或自动化日常任务。用户甚至可以通过自然语言指令,如“重新打开我昨天看过的那些鞋子”,来操控浏览器。

在隐私与控制方面,OpenAI强调用户拥有充分的主导权。除了可以精细化管理记忆和浏览历史外,用户还能针对特定网站,通过地址栏的开关控制ChatGPT是否可读取该页面内容。公司明确表示,在默认设置下,不会使用用户的浏览内容来训练其模型,但同时提供了允许此操作的选项供用户选择。针对家庭使用场景,浏览器也增强了家长控制功能,新增了关闭浏览器记忆和智能体模式等选项。

此次发布的深远意义在于,它可能预示着网络交互方式的一场根本性变革。它为我们描绘了这样一个未来:大部分常规性的网络活动将由智能体系统代为处理,用户得以从繁琐事务中解脱,专注于更具创造性和战略性的工作。这种被称为“氛围生活”的理念,旨在通过AI伙伴的无缝介入,提升整体生活与工作的效率与品质。

展望未来,OpenAI已为Atlas规划了清晰的产品路线图,其中包括支持多用户配置文件以适应不同场景、提升开发者工具的体验、以及为使用AppsSDK的开发者提供更多提升其应用在Atlas中被发现的机会。这些举措显示了其致力于构建一个繁荣浏览器生态的雄心。综上所述,OpenAIChatGPTAtlas的横空出世,不仅是该公司在构建通用人工智能道路上的一个重要里程碑,更是对现有浏览器市场格局的一次强力冲击。

AI融资动向:医疗AI新星OpenEvidence获2亿美元融资,加速“临床决策支持”智能化

2025年10月20日,OpenEvidence宣布成功完成由GV领投的2亿美元C轮融资,Sequoia、KleinerPerkins、Blackstone、ThriveCapital、Coatue、Bond和Craft等知名机构参与跟投。本轮融资完成后,公司估值从今年7月的35亿美元提升至60亿美元。与此同时,公司创始人兼CEODanielNadler的个人净资产也大幅增长至36亿美元,较3个月前增加了13亿美元。

OpenEvidence于2022年成立,其核心业务是构建覆盖全球顶级医学期刊的知识图谱,旨在为临床医护人员提供实时决策支持。该平台整合了《美国医学会杂志》《新英格兰医学杂志》等权威出版物的最新研究成果,可针对具体病例迅速匹配循证医学证据。这一基于知识图谱的临床决策支持系统,显著提升了医生获取和理解最新医学知识的效率,有助于制定更精准的诊断和治疗方案。

OpenEvidence采用“专业用户免费+广告变现”的商业模式,通过认证的医疗从业者能够免费使用核心功能。这种模式有效降低了用户的使用门槛,加快了平台的普及速度。运营数据显示,自上线以来,OpenEvidence呈现出爆发式增长态势。从今年7月至今,月度临床咨询量从750万次激增至1500万次,近乎翻倍的增长充分证明了市场对其产品的认可。这种指数级增长既体现了医疗行业对智能化工具的迫切需求,也验证了其产品定位与市场需求的精准契合。

成立仅三年的OpenEvidence,其发展轨迹与医疗AI的整体繁荣态势相契合。在全球医疗系统面临医生短缺、职业倦怠,以及需处理不断增长的医学文献等挑战的大背景下,该平台为医生提供即时、基于循证的临床问题解答,从根本上变革了行医方式。近期,公司推出了一款名为Visits的新工具,它能够自动从患者对话中生成医疗记录,还支持搜索具体细节并补充外部数据。这一业务拓展表明,公司正朝着更广泛的医疗AI应用场景迈进。

与此同时,AI医疗领域的竞争格局正在迅速升温。Microsoft通过与EpicSystems合作来推进医疗AI业务,Amazon则致力于构建AWSHealthLake医疗数据平台。不过,OpenEvidence专注于一线临床决策支持的市场定位,使其在整个生态系统中脱颖而出。

行情复盘

上周(10.20-10.24日),AI算力指数/AI应用指数/万得全A/中证红利日涨幅最大值分别为1.80%/2.28%/1.62%/0.81%,AI算力指数/AI应用指数/万得全A/中证红利日跌幅最大值分别为-0.42%/-0.65%/-0.38%/-0.65%。AI算力指数内部,中际旭创以+32.23%录得上周最大涨幅,常山北明以-4.67%录得上周最大跌幅。AI应用指数内部,科大国创以+31.31%录得上周最大涨幅,壹网壹创以-9.48%录得上周最大跌幅。

投资建议

2025年10月22日,Vertiv公布的2025年第三季度业绩全面超出市场预期,其当季的销售额达到26.76亿美元,同比增长约28%,且这一增速高于公司此前给出的指引上限;调整后每股收益为1.24美元。从订单端来看,公司第三季度订单与销售比率约为1.4倍,订单储备充足;过去十二个月有机订单同比增长约21%,业务增长韧性显著。单季度来看,2025年第三季度有机订单较2024年同期增长约60%,较2025年第二季度环比增长约20%,而订单增速的双重提升,充分反映市场对其产品与服务的需求热度。按区域来看,美洲与亚太地区增长强劲,EMEA地区则略有下滑。其中,美洲地区凭借各产品线及客户细分市场的广泛增长动力,实现43%的销售增长,调整后营业利润达5.02亿美元,利润率从去年同期25.3%提升至29.3%;亚太地区受AI需求加速推动,实现销售增长21%,调整后营业利润为6900万美元,利润率从去年同期10.2%增至13.2%。而EMEA地区受数据中心行业限制因素影响,调整后营业利润降至8400万美元,利润率从去年同期25.9%收缩至18.8%,未来该地区强劲的订单管道使其对未来季度增长存在加速预期。Vertiv本次发布的第三季度财报,充分彰显了其在液冷领域的规模化交付能力与技术适配优势。这一表现不仅有力印证了产业共识——液冷技术已从AI数据中心的“可选项”升级为“必选项”,尤其在高算力的需求场景下,液冷已成为突破风冷技术物理极限的核心解决方案;同时更向全球液冷产业链释放出明确的扩容预期信号。叠加Vertiv庞大积压订单所反映的强劲市场需求,这一趋势将持续驱动液冷产业链上下游的技术迭代与产能释放,我们持续看好液冷板块。

中长期,建议关注临床AI产品成功落地验证的嘉和美康(688246.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)、加快扩张算力业务的精密零部件龙头迈信林(688685.SH)、持续加码高速铜缆的泓淋电力(301439.SZ)、新能源业务高增并供货科尔摩根等全球电机巨头的唯科科技(301196.SZ)等。

1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。

证券研究报告:《DeepSeek团队开源DeepSeek-OCR模型,OpenAI推出Atlas—计算机行业周报》

对外发布时间:2025年10月27日

发布机构:华鑫证券

本报告分析师:

任春阳  SAC编号:S1050521110006

中小盘&主题&北交所组介绍

任春阳:华东师范大学经济学硕士,6年证券行业经验,2021年11月加盟华鑫证券研究所,从事计算机与中小盘行业上市公司研究

周文龙:澳大利亚莫纳什大学金融硕士

陶欣怡:毕业于上海交通大学,于2023年10月加入团队。

倪汇康:金融学士,2025年8月加盟华鑫证券研究所。

本报告署名分析师具有中国证券业协会授予的证券投资咨询执业资格并注册为证券分析师,以勤勉的职业态度,独立、客观地出具本报告。本报告清晰准确地反映了本人的研究观点。本人不曾因,不因,也将不会因本报告中的具体推荐意见或观点而直接或间接收到任何形式的补偿。

法律声明

查看更多董秘问答>>

热门新闻

>>>查看更多:股市要闻 内参消息 实时内参 财经日历