问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

DeepSeek数据库安全漏洞事件深度分析:百万敏感数据暴露的风险与启示

创作时间:
作者:
@小白创作中心

DeepSeek数据库安全漏洞事件深度分析:百万敏感数据暴露的风险与启示

引用
CSDN
1.
https://blog.csdn.net/longxiaotian718/article/details/145425840

近日,AI初创公司DeepSeek的一个数据库出现重大安全漏洞,其内部敏感数据被公开暴露。安全研究团队Wiz Research在例行检查中发现这一问题,并及时向DeepSeek报告。本文将详细解析这一安全事件的技术细节及其背后的安全启示。

最近,DeepSeek因推出具有突破性的AI模型(尤其是DeepSeek-R1推理模型)而备受关注。这款模型在性能上可与OpenAI的o1等领先AI系统媲美,同时在成本效益和效率方面展现出独特优势。

随着DeepSeek在AI领域引发广泛关注,Wiz Research团队开始对其外部安全状况进行评估,以发现潜在的安全漏洞。在这一过程中,他们发现了一个与DeepSeek相连的可公开访问的ClickHouse数据库,该数据库完全开放,没有任何身份验证机制,导致敏感数据暴露。

这个数据库托管在oauth2callback.deepseek.com:9000dev.deepseek.com:9000,其中包含大量的聊天历史记录、后端数据和敏感信息,包括日志流、API密钥信息和操作细节。更关键的是,这些暴露的信息允许访客全面控制数据库,并在DeepSeek环境中进行潜在的特权升级,且没有任何身份验证或防御机制。

漏洞发现过程

Wiz Research的侦察工作始于对DeepSeek可公开访问域的评估。通过使用简单的侦察技术(被动/主动发现子域)分析外部攻击面,研究团队发现了约30个面向互联网的子域。大多数子域看起来都是良性的,托管着聊天机器人界面、状态页面和API文档等内容,最初这些并不被认为是高风险的暴露信息。

然而,当研究团队将搜索范围从标准HTTP端口(80/443)扩大到其他端口后,发现了两个不寻常的开放端口(8123和9000),它们与以下主机相关:

  • http://oauth2callback.deepseek.com:8123
  • http://dev.deepseek.com:8123
  • http://oauth2callback.deepseek.com:9000
  • http://dev.deepseek.com:9000

进一步调查后发现,这些端口通向一个公开暴露的ClickHouse数据库,无需任何身份验证即可访问,这立即拉响了警报。

ClickHouse是一个开源列式数据库管理系统,专为大型数据集的快速分析查询而设计。它由Yandex开发,广泛用于实时数据处理、日志存储和大数据分析,这表明暴露的内容含有很宝贵的敏感信息。

通过利用ClickHouse的HTTP接口,研究团队访问了/play路径,该路径允许通过浏览器直接执行任意SQL查询。运行简单的SHOW TABLES;查询,返回了可访问数据集的完整列表。

在这些表中,log_stream表特别引人注目,它包含100多万条日志条目,列内容包括:

  • timestamp:从2025年1月6日开始的日志
  • span_name:对各种内部DeepSeek API端点的引用
  • string.values:明文日志,包括聊天记录、API密钥、后端详细信息和操作元数据
  • _service:表明哪个DeepSeek服务生成了日志
  • _source:暴露日志请求的来源,包含聊天记录、API密钥、目录结构和聊天机器人元数据日志

这种级别的访问权限给DeepSeek及其最终用户的安全构成了严重风险。攻击者不仅可以检索敏感日志和实际的明文聊天信息,还有可能使用SELECT * FROM file('filename')之类的查询,直接从服务器泄露明文密码、本地文件以及专有信息,具体取决于ClickHouse的配置情况。

(注:为了确保安全研究遵循职业操守,研究团队没有执行枚举之外的侵入性查询。)

安全启示

这次泄露事件凸显了几个重要安全问题:

  1. AI服务的安全风险:在没有相应安全保障的情况下,迅速采用AI服务本身存在风险。AI应用的安全风险直接源于支持它们的基础设施和工具。

  2. 基础安全的重要性:虽然围绕AI安全的注意力大都集中在未来的威胁上,但真正的危险常常来自基本的风险,比如数据库意外暴露。防范这些风险应该是安全团队的当务之急。

  3. 数据保护责任:随着企业组织竞相采用越来越多的初创公司和供应商提供的AI工具和服务,有必要记住:如果这么做,我们无异于把敏感数据托付给了这些公司。迅速采用AI常常导致忽视安全,但保护客户数据必须仍然是首要任务。

  4. 团队协作:安全团队与AI工程师需要密切合作,确保深入了解所使用的架构、工具和模型,这样才能更好地保护数据、防止泄露。

结语

全球还没有哪一项技术像AI这样被迅速采用。许多AI公司已迅速成长为关键基础设施提供商,但缺少通常伴随这种广泛采用而来的安全框架。随着AI深度融入到全球企业中,业界必须认识到处理敏感数据的风险,并落实向公共云提供商和主要基础设施提供商要求的安全措施看齐的安全措施。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号