水晶球APP 高手云集的股票社区
下载、打开
X

推荐关注更多

股道的卢

06年入市实战操作至今,经...


价值领航

稳健的投资风格和淘金精神


柴孝伟

建造十九层每层成倍财富高楼...


邢星

邢 星 党员,国...


石建军

笔名:石天方。中国第一代投...


揭幕者

名博


洪榕

原上海大智慧执行总裁


小黎飞刀

黎仕禹,名博


启明

私募基金经理,职业投资人


李大霄

前券商首席经济学家


banner

banner

【民生计算机】重估数据库:未来软件=Agent+数据库

股林   / 05月07日 08:29 发布

摘要

DB for AI:AI Agent推动软件形态变革,数据库具有不可替代的重要地位,赋能AI发展。1)AI Agent有望通过直接与终端互动,在一定程度上替代中间应用层软件:在传统软件架构中,应用程序充当用户与数据库之间的“中间商”。用户通过应用操作,请求经前端发至后端,后端查询数据库、执行逻辑后,再将结果返回前端。而在AI驱动的新模式下,智能Agent能够直接与数据库进行交互,实现数据的创建、读取等功能,进而可能代替中间应用层。


2)软件形态变革大趋势下,数据库具有不可替代的重要地位:第一,承载数据,做好数据来源的“源头关”治理。AI时代,AI训练的来源是数据,精确、可靠的高质量数据是做好AI训练的关键,数据库则是承载高质量数据的载体。第二,向量数据库、RAG等产品和技术直接赋能AI发展,缓解大模型推理的“幻觉”等问题,数据库成为AI时代不可替代的“必需品”:RAG技术通过检索外部知识库,为模型提供具体事实和数据支持,提高 AI 回答的准确性和可靠性,避免大模型推理的“幻觉”;RAG技术可以将知识库作为外部附件管理私有数据,敏感内容不用直接输入大模型进行训练,降低了数据泄漏风险;RAG技术允许从外部数据源实时检索信息,能获取最新知识,进而提升AI训练和推理的效率。


3)OpenAI通过整合Rockset的专家团队,增强了自身在实时分析和RAG领域的实力;OceanBase宣布进入AI时代,OceanBase 4.3.3 GA版本在关系型数据库的基础上,新增了向量检索能力等多种功能,加速RAG、智能推荐、多模态搜索等场景的落地;海量数据打造向量数据库,面向企业级AI应用落地的高性能集中式向量数据库,融合了关系型数据库的稳定性与高效的向量数据处理能力,支持结构化数据与高维向量的原生协同管理。


AI for DB:AI赋能推动数据库自身升级,推动行业加速发展。1)智能运维:涵盖SQL调优、安全管理以及数据库运维等功能,智能运维中心可以实现对数据库系统的实时监控、预测分析和自动化处理。2)降低数据库操作门槛:用户可以通过自然语言与计算机系统交互,大语言模型将自然语言转化为对应的SQL语句,辅助海量数据查询。3)数据库自治模式实现自我管理:自治数据库利用机器学习技术,自动执行传统上需要数据库管理员手动完成的任务,如调优、保护、备份和更新等。通过机器学习和AI算法,自治数据库能优化查询、自动管理内存和存储,实现自调优。4)达梦数据将人工智能算法融入数据库核心功能,利用AI优化查询引擎,提升复杂SQL查询效率;采用AI驱动的资源调度策略,使数据库在动态负载环境下性能达到最佳。GaussDB 充分利用盘古大模型的优势,构建了涵盖数据库咨询、开发、优化、运维等全生命周期的AI应用体系。


投资建议:AI Agent的发展推动软件形态变革,数据库具有不可替代的重要地位,不仅是承载数据的重要载体,而且能够帮助大模型推理避免“幻觉”、数据更新不及时等问题,有望成为AI时代不可替代的“必需品”。同时,AI赋能数据库自身升级,在智能运维等方面发挥重要作用,推动数据库行业加速发展。建议重点关注达梦数据、太极股份、海量数据、软通动力、创意信息、星环科技、超图软件、拓尔思等公司。


风险提示:国产数据库产品研发不及预期;技术路线变革带来的不确定性;同业竞争加剧的风险。


1 DB for AI:AI Agent推动软件形态变革,数据库具有不可替代的重要地位

AI Agent推动AI时代软件形态变革,AI Agent有望通过直接与终端互动,在一定程度上替代中间应用层软件。在传统软件架构中,应用程序充当用户与数据库之间的 “中间商”。用户通过应用操作,请求经前端发至后端,后端查询数据库、执行逻辑后,再将结果返回前端。而在AI驱动的新模式下,智能Agent能够直接与数据库进行交互,实现数据的创建、读取等功能,进而可能代替中间应用层。以飞猪最近推出的“问一问”功能为例,用户只需向AI助手提出需求,“问一问”功能就召唤出机票比价师、酒店顾问、路线规划师等多位AI助手,一键生成旅游攻略,方案中涉及的机票、酒店等商品,用户可以直接一键下单预订。相比于传统模式需要用户手动在不同页面填写各类信息,该模式简化了操作流程,提高了效率。

图片

软件形态变革大趋势下,数据库具有不可替代的重要地位。


第一,承载数据,做好数据来源的“源头关”治理。AI时代,AI训练的来源是数据,精确、可靠的高质量数据是做好AI训练的关键,数据库则是承载高质量数据的载体。


第二,向量数据库、RAG等产品和技术直接赋能AI发展,缓解大模型推理的“幻觉”等问题,数据库成为AI时代不可替代的“必需品”。向量数据库通过嵌入方式,将高维度离散数据(如文本、图像、音视频等)映射到低维度连续空间生成稠密向量,更好地捕捉数据潜在关系和语义信息。RAG框架则把信息检索技术和大模型结合,将检索出的文档和提示词提供给大模型,缓解大模型推理的“幻觉”问题,还能实现知识库更新,进而为AI发展提供保障。

图片

相较于原生的大模型,搭配RAG的模型具有多个优势。RAG框架主要由检索器和生成器两部分构成。检索过程涵盖对数据(如文档)进行切分、嵌入向量并构建索引,随后通过向量检索召回相关结果;生成过程则是借助基于检索结果增强的提示来激活大语言模型,进而生成回答。


这种方式使得RAG在处理复杂查询和生成丰富信息回答方面具备显著优势:第一,提高 AI 回答的准确性和可靠性,避免推理过程中的“幻觉”等问题:RAG技术通过检索外部知识库,为模型提供具体事实和数据支持。当被问到专业领域知识时,RAG会从专业文档、研究报告等可靠来源检索信息,让模型基于这些准确信息作答,大大提高了回答的准确性和可追溯性。第二,增强数据隐私和安全保护:RAG技术可以将知识库作为外部附件管理私有数据。企业的客户信息、财务数据等敏感内容,不用直接输入大模型进行训练,降低了数据泄漏风险。第三,提升信息的实时性和适应性:RAG技术允许从外部数据源实时检索信息,能获取最新知识,进而提升AI训练和推理的效率。

图片

向量数据库有望成为RAG检索的底座。RAG检索通常与向量数据库紧密结合,形成基于大模型ector Database+Prompt的RAG解决方案,即CVP技术栈。该技术栈依赖向量数据库高效检索相关信息,增强大型语言模型(LLMs)的能力。通过将LLMs生成的查询转换为向量,RAG系统能在向量数据库中迅速定位相应的知识条目,有效解决LLMs固有的知识更新延迟和“幻觉”等问题。

图片

OpenAI通过整合Rockset的专家团队,增强了自身在实时分析和RAG领域的实力。2024年6月,OpenAI官方宣布完成对实时分析数据库Rockset的收购,并计划将Rockset产品整合至旗下所有产品线。Rockset成立于2016年,提供基于云的实时分析数据库RocksDB,助力开发人员构建数据密集型应用程序。Rockset可作为大模型的实时外部知识库,为大模型传递时效性更高、信息密度更大的多模态数据,用于管理、存储、查询和搜索结构化及非结构化数据。其超大规模下的实时分析及向量检索能力,有效解决了大模型在企业落地时面临的快速整合不同来源数据、实时数据感知以及高效数据处理等关键问题。

图片

国内数据库龙头OceanBase宣布进入AI时代。2025年4月27日下午,OceanBase CEO杨冰发布全员信,宣布OceanBase全面进入AI时代,致力于打造“DATA×AI”核心能力,建设AI时代的数据底座。组织架构方面,任命CTO杨传辉担任AI战略一号位,同时成立了AI平台与应用部、AI引擎组等新部门。其中,AI平台与应用部由杨传辉主导,聚焦打造RAG、AI平台、知识库等能力;AI引擎组是 OceanBase 底层引擎团队中的新设部门,专注打造 AI 推理引擎。OceanBase 将依托蚂蚁集团丰富的应用场景,打磨“DATA×AI”能力,使其成为新的核心竞争力,逐渐服务外部客户,蚂蚁集团则向OceanBase开放全部AI场景支持其AI战略。


OceanBase 4.3.3 GA版本在关系型数据库的基础上,新增了向量检索能力,支持向量数据类型、向量索引以及基于向量索引的搜索功能。用户可以通过SQL 和Python SDK两种方式,灵活地使用OceanBase的向量检索能力,为用户带来更强大的数据融合查询体验,显著简化 AI 应用技术栈,加速RAG、智能推荐、多模态搜索等场景的落地。

图片

海量数据推出Vastbase向量版,面向企业级AI应用落地的高性能集中式向量数据库,融合了关系型数据库的稳定性与高效的向量数据处理能力,支持结构化数据与高维向量的原生协同管理。1)高性能:在处理大规模数据时表现卓越,单节点可承载1亿数据量且维度为1024维的数据,在保证召回率大于99%的情况下,吞吐量大于2000,能够满足企业对大数据量高并发处理的需求。2)高安全:集成了全密态计算、行列级访问控制以及三权分立审计机制等多种安全技术,通过了IT产品信息安全认证EAL4+等,满足金融级数据合规的严格要求,为企业数据安全提供坚实保障。3)高可用:采用多副本故障自愈架构和资源池化架构,恢复时间目标(RTO)小于等于10秒,能够确保业务的连续性,降低因数据库故障导致的业务中断风险。同时,在技术内核上,实现了算法优化等多个重要的技术革新。

图片


2 AI for DB:AI赋能推动数据库自身升级,推动行业加速发展

在AI大趋势下,数据量持续增长,数据库系统的规模和复杂度不断提升,传统的数据库管理和运维方式面临诸多挑战。AI的出现为解决这些问题提供了新的思路和方法,借助人工智能技术提升数据库的运维管理水平、降低操作难度并实现自我管理功能,成为数据库领域的重要发展方向。


智能运维:以华为技术有限公司的GaussDB 统一管控运维平台智能运维中心为例,其架构包含多个层次。数据采集层负责收集系统资源、数据库实例信息、审计日志等数据,并执行上层下发的命令;数据计算层对采集来的数据进行缓存、持久化和加工;自治服务层涵盖SQL调优、安全管理以及数据库运维等功能;监控层提供异常预警、健康报告等功能。


通过这些层次的协同工作,智能运维中心可以实现对数据库系统的实时监控、预测分析和自动化处理。比如,通过对数据库负载趋势和历史曲线的分析,提前预测可能出现的性能问题并及时进行优化。未来,数据库运维管理将朝着智能化方向持续迈进,自感知、自优化、故障自愈等功能将成为主要发展方向,根据实际情况进行优化调整,并在出现故障时自动修复,减少人工干预,提高运维效率和系统稳定性。

图片

降低数据库操作门槛:用户可以通过自然语言与计算机系统交互,大语言模型将自然语言转化为对应的SQL语句,辅助数据查询,目前主要有Text-to-SQL和NLQuery-to-NLAnswer两种技术路线。Text-to-SQL是将用户的自然语言查询转化为结构化的SQL语句,应用较为广泛;NLQuery-to-NLAnswer 则是端到端的查询意图到查询结果的映射,跳过SQL生成步骤,代表了未来的发展方向。


数据库自治模式实现自我管理:数据库能够实现自我管理和运维,尤其是在云计算的支持下,可实现数据库全生命周期的自动化管理。自治数据库利用机器学习技术,自动执行传统上需要数据库管理员手动完成的任务,如调优、保护等。通过机器学习和AI算法,自治数据库能优化查询、自动管理内存和存储,实现自调优。


达梦数据深度探索人工智能在数据库领域的应用,将人工智能算法融入数据库核心功能。利用AI优化查询引擎,提升复杂SQL查询效率;采用AI驱动的资源调度策略,使数据库在动态负载环境下性能达到最佳。

图片

GaussDB 充分利用盘古大模型的优势,构建了涵盖数据库咨询、开发、优化、运维等全生命周期的AI应用体系。在咨询阶段,通过将LLM与知识库相结合,打造了数据库垂域的专业知识问答系统,为用户提供专业的咨询服务;在运维阶段,借助大模型智能体的计划、编排等能力,实现了自动故障根因分析和定位。

图片
图片



3 投资建议

AI Agent的发展推动软件形态变革,数据库具有不可替代的重要地位,不仅是承载数据的重要载体,而且能够帮助大模型推理避免“幻觉”、数据更新不及时等问题,有望成为AI时代不可替代的“必需品”。同时,AI赋能数据库自身升级,在智能运维等方面发挥重要作用,推动数据库行业加速发展。建议重点关注达梦数据、太极股份、海量数据、软通动力、创意信息、星环科技、超图软件、拓尔思等公司。