搜索
信网手机版移动继续看新闻

青岛AI企业积极“接入”DeepSeek 提升自家行业模型能力

原标题:青岛AI企业如何高效拥抱DeepSeek

青岛日报/观海新闻记者  孙 欣  周晓峰  杨 光

美国当地时间2月17日晚间,马斯克旗下人工智能公司xAI发布了最新人工智能模型Grok 3。在这场直播发布中,DeepSeek成为屡次被提及的比较对象,以此展示Grok 3的性能。

前几年,中国企业每每推出模型,都要和GPT-3.5、GPT-4比比。如今,Grok 3的“超越对象”成了DeepSeek,又一次印证了DeepSeek给全球人工智能行业带来的扰动和震撼。

曾经,人工智能(AI)领域信奉“大力出奇迹”,即通过增加模型规模、数据量和计算资源,可以显著提升模型性能。DeepSeek则闯出了一条发展人工智能的新路,以低成本、高效率的方式改写了行业竞争法则,给全球人工智能界带来新的启示。

早在DeepSeek“出圈”之前,青岛人工智能企业便开始关注这个“不走寻常路”的“新物种”,并在DeepSeek推理模型推出的第一时间积极拥抱,用以提升自家行业模型能力。

对青岛人工智能企业来说,DeepSeek的到来将加速大模型在各行各业落地应用,给垂直领域行业大模型带来新的利好。但与此同时,当前再强大的通用大模型对行业专业知识的理解仍有不足,大模型要在各行各业真正施展拳脚仍需“学习”更多专业知识,垂域大模型要做的还有很多。

AI行业迎来“安卓时刻”

没有人会否认,DeepSeek是继ChatGPT之后全球人工智能领域最“王炸”的产品。某种意义上,DeepSeek对于推动全球人工智能发展的意义要远甚于ChatGPT。如果说ChatGPT的出现告诉了全世界大模型可以“有多强”,那DeepSeek的出现则告诉全世界最强的大模型绝非“可望而不可即”。

更低的算力成本和开源路线,是DeepSeek与ChatGPT最显著的区别。也正是基于这两点,DeepSeek掀起了对现有全球AI秩序的一次猛烈冲击。

算法、算力、数据被称为人工智能三要素。自ChatGPT引发全球大模型浪潮以来,算力的重要性不断被推至高点。全球GPU龙头英伟达的股价持续攀高、算力建设步伐不断提速、大国芯片博弈加剧……全球围绕算力的竞争日趋白热化,算力俨然成为全球新一轮科技革命的制胜法宝。

DeepSeek的出现重构了AI行业这种以算力为焦点的竞争规则。从数据来看,通过多元专家混合的模型架构,DeepSeek V3版本的训练成本为600万美元,显著低于此前海外主流大模型数千万美元的成本量级。中国工程院院士、前中国科学院计算技术研究所所长李国杰将DeepSeek的创新描述为“既是技术上的重大突破,也是发展模式上的颠覆性创新”。在他看来,DeepSeek的崛起说明AI不再是简单堆砌算力的暴力游戏,而是进入了以算法和模型架构优化为主,同时高度重视数据质量与规模、理性提高算力的新时期。

更低的成本意味着在一定程度上降低了拥抱大模型的门槛。“DeepSeek依托算法突破大幅降低了模型的算力需求,将极大提速大模型的产业化应用进程,已成为中国和中国企业赢得AI时代竞争的关键优势。”海尔相关负责人称。

该负责人表示,以家电行业为例,依托低成本人工智能技术,智能家电和家居产业有望突破制造业与生成式人工智能结合的局限性,催生基于垂域大模型赋能的新型智能制造产业,产生的家庭垂域大模型也可以促进智能家居及家用服务机器人同步发展。

选择开源路线,则为技术的普及应用进一步降低了门槛,对全球加快构建大模型AI产业生态意义重大。这两年,全球AI界一直有着开源和闭源技术路线之争。Meta、阿里云等企业大模型更倾向于开源,ChatGPT则是闭源路线的代表。

“DeepSeek的成功,本质上是开源对闭源的成功。”专注“AI+教育”领域的青岛罗博数码科技有限公司董事长殷述军表示,如果拿AI行业与移动互联网做类比,可以说这是AI行业的“安卓时刻”,接下来行业一定会像2012年移动互联网一样,产生生态的大爆发。“在一些第三方平台上,已经有数百个基于DeepSeek的智能体上线,我们正在迎来AI应用的寒武纪大爆发。”

2月14日,百度官方微信公众号宣布,将于6月30日起正式开源下一代文心大模型。此前,百度一直坚持闭源技术路线。如今转向开源,似乎也从侧面印证了DeepSeek对全球大模型竞争所产生的影响。

种种迹象表明,DeepSeek是全球AI发展的又一个标志性时刻,大模型商业化落地有望提速。“2025年将是大模型在产业侧应用的爆发年。”极视角联合创始人陈硕表示。

拥抱从“接入”开始

DeepSeek火爆之后,青岛人工智能相关企业纷纷第一时间接入DeepSeek。

根据DeepSeek提供的解释,接入DeepSeek是指通过API、SDK或预训练模型接口直接调用DeepSeek提供的现有服务或模型能力。接入DeepSeek意味着企业将DeepSeek的能力“嫁接”到自身的产品和服务上,以进一步提升服务能力。

从全球来看,微软最早宣布将DeepSeek-R1模型添加到云平台Azure AI Foundry,开发者可用于构建基于云的应用程序和服务。接着,AWS(亚马逊云科技)、英伟达、AMD等公司相继宣布在其AI服务平台上部署DeepSeek-R1模型。

青岛人工智能企业紧跟行业步伐。诞生于海尔生态的三翼鸟HomeGPT智慧家庭领域大模型、卡奥斯天智工业大模型平台、海纳云安全大模型、国创大模型等,均已引入了DeepSeek的能力,为智慧家庭、生产数字化、城市应急安全等场景赋能,进一步提升人工智能科技对场景的优化。以城市应急安全场景为例,海纳云安全大模型通过与DeepSeek的深度融合,持续升级大模型的风险监测预警、复杂场景智能分析、预案匹配、问答交互等多重能力,监测准确率达95%以上,预案匹配准确率达90%以上,报警事件误报率降低20%。

海信自研的星海大模型接入DeepSeek,在智慧生活和智慧城市领域为用户带来全新的智能交互体验。目前,海信已通过DeepSeek“开源大模型+嵌入知识库模型”双引擎架构,搭建智能化交管安全法规知识库问答系统,能够快速精准检索知识片段。

青岛罗博科技已将DeepSeek接入了其自主研发的全球首款纸屏融合学练机产品。该产品融合手写、语音和视觉的多模态交互,可以实现手写输入识别、智能问答对话、手写解题、单词卡片等功能。目前,包括DeepSeek在内的AI能力已在备课、批改、课堂评价和个性化辅导等场景得到应用。

DeepSeek开源发布后,青岛联通第一时间进行了模型的本地化部署,已经基于DeepSeek开发并上线了多个大模型智能体应用,有效赋能内部营销、客服、财务、管理等多个环节。青岛联通人工智能及算力首席专家夏培勇介绍,运营商全面接入DeepSeek,基于多元化算力,用户可按需灵活、快速搭建DeepSeek推理和微调环境。同时基于运营商庞大的客户基础和丰富的应用场景,DeepSeek可以快速渗透到更多行业和领域。

“接入”只是开始。青岛人工智能企业大多聚焦于垂直细分领域,依托DeepSeek开发或改善提升垂域模型则是青岛人工智能企业的“进阶选项”。

创新奇智是国内聚焦“AI+制造”领域的企业。早在蛇年春节DeepSeek出圈前,创新奇智就已关注到DeepSeek所采用的新架构,以及它在推理方面的强大能力。“准确率和计算性能都让人印象深刻。”创新奇智相关负责人如是说。

2月12日,创新奇智宣布旗下AInnoGC工业大模型已经完成了DeepSeek-R1蒸馏AInno-75B技术适配。通过蒸馏DeepSeek-R1,AInno-75B的推理能力显著提升,同时保持了AInno-75B模型对工业知识深入理解和低成本私有化部署的优势。这意味着AInno-75B能够在更广泛的工业环境中实现部署应用,满足不同规模企业的需求。

“DeepSeek-R1的强项在于推理能力,创新奇智AInnoGC工业大模型的强项在于工业专业知识。对DeepSeek-R1进行蒸馏可以理解为老师教学生。先让这位通识老师回答一遍工业专业问题,形成一个范本后再让我们的工业大模型去学习老师是怎么回答问题的,以此提升工业大模型的思考能力。”创新奇智相关负责人表示,尤其是在知识管理类、数据管理类的应用上,下一个版本的AInnoGC会表现出更加明显的性能提升,以此促进工业制造企业进一步提升效率。

“专业”仍是稀缺能力

尽管DeepSeek十分强大,但对专注于垂直细分领域的人工智能企业来说,要真正将DeepSeek带来的行业利好转化为商业落地前景,“专业”能力仍是要持续精进的核心竞争力。

海纳云安全大模型相关负责人介绍,尽管DeepSeek在多个领域展示了其卓越的性能,但在与应急管理结合时仍然面临一些难点,如算法场景适配,应急场景复杂多样等。这就要求模型兼具灵活性和准确性,此外,应急行业很多政策标准文件更新频率快,需要模型具备快速迭代和学习的能力。

殷述军也表达了类似的观点。“DeepSeek目前还不支持多模态,因此在涉及教学评价的多模态分析上,还需要自己搭建相应的技术框架。”殷述军说,另外,和其他通用大模型一样,DeepSeek也存在幻觉问题,导致它无法直接用于教学,需要进行模型的微调和训练,同时结合知识图谱尽量将幻觉降到最低。

今年,罗博科技将基于DeepSeek等开源模型蒸馏训练特定领域的专家模型,在端侧实现更好的效果和更低的成本;同时,以自研大模型为基础,结合其他三方模型,为前端业务提供更好更稳定的AI基础能力。

如果将DeepSeek等通用大模型比喻为一个知识面广博的“通才”,那垂直领域行业大模型则为精通某一具体行业的“专才”。从“通才”到“专才”,很多时候并非通过简单地调改几个参数或增加行业数据来实现的。将“通才”的能力为我所用,开发更优秀的“专才”是未来垂域模型的重要发力方向,也是垂域模型的重要核心竞争力所在。

“除了对DeepSeek-R1进行蒸馏之外,DeepSeek对强化学习算法的使用也给了我们巨大的启发。未来将更多利用这一算法不断提升AInnoGC工业大模型的能力。”创新奇智相关负责人表示,AInnoGC工业大模型并非依托某一开源大模型简单地调改而来,而是根据工业场景的特点,集合了多款开源大模型进行自主开发的。此前,创新奇智虽已关注到强化学习算法,但并未太多使用。“DeepSeek让我们看到了强化学习算法在推理能力上的巨大潜力,强化学习算法将是我们大模型进入下一个境界的关键算法。”他说。

某种意义上,垂域大模型企业也开启了新一轮的“加速跑”。通过将大模型在各行各业具体业务场景中加快落地应用,抢得新一轮发展先机。

“DeepSeek的崛起不仅推动了单个企业的技术创新,还促进了整个供应链的优化和生态系统的构建。通过与DeepSeek等领先企业的合作,以萨技术可以更加高效地整合上下游资源,提升供应链的协同效率。”以萨技术轮值总裁姚巍表示。

据姚巍介绍,今年以萨将重点研发打造“以萨自进化AI生态体”。“它不是一个单一的大模型产品,而是以生成式AI为核心,通过连接所有离散业务系统和资源,实现一站式自进化开发、运营、管理的应用生成体系。”姚巍说,它类似一个虚拟的人工智能生产车间,可以衔接所有数据、模型、能力,自动进行任务拆解、逻辑编排及工作流构建,快速搭建各类生产级的、聪明的AI应用,帮助用户处理工作任务提质增效。

[来源:青岛日报 编辑:赵晓珊]
精彩美图 更多 >>
2025 02/28 09:49
· 来源 ·
青岛日报
· 责编 ·
赵晓珊
阅读量
扫描到手机
用手机或平板电脑的二维码应用拍下左侧二维码,可以在手机继续阅读。

青岛话题 更多 >>

深度报道 更多 >>

大家爱看

信网手机版

信网小程序

青岛网上辟谣平台

AI调解员

Copyright © 2014-2025 信网 All rights reserved. 鲁ICP备14028146号-1 互联网新闻信息服务许可证:37120180021 增值电信:鲁B2-20180061 鲁公网安备:37020202000005号
手机版 | 媒体资源 | 信网传播力 | 关于信网 | 广告服务 | 人才招聘 | 联系我们 | 版权声明| 违法和不良信息举报