问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

大语言模型助力模糊测试新突破

创作时间:

作者:

@小白创作中心

大语言模型助力模糊测试新突破

引用

百度

等

10

来源

1.

https://cloud.baidu.com/article/3100329

2.

https://www.secrss.com/articles/65103

3.

https://blog.csdn.net/chlet/article/details/131211942

4.

https://www.secrss.com/articles/64032

5.

https://www.secrss.com/articles/65607

6.

https://blog.csdn.net/u014250402/article/details/141159340

7.

https://rivers.chaitin.cn/blog/cq954bh0lnechd244o8g

8.

https://www.gptsecurity.info/2025/01/26/AI+Security-%E7%B3%BB%E5%88%97%E7%AC%AC4%E6%9C%9F-%E4%BA%8C-LLM%E8%BE%85%E5%8A%A9%E7%9A%84%E6%A8%A1%E7%B3%8A%E6%B5%8B%E8%AF%95%E5%A2%9E%E5%BC%BA%E6%8A%80%E6%9C%AF/

9.

https://www.secfree.com/news/industry/10046.html

10.

https://rivers.chaitin.cn/blog/cqq59590lnec5jjugjfg

在软件安全领域，模糊测试（Fuzz Testing）是一种重要的漏洞检测技术。近期，大语言模型（LLMs）的引入为模糊测试带来了新的突破，显著提升了软件测试的效率和准确性。

01

什么是模糊测试？

模糊测试是一种通过向目标程序输入随机或特制的数据来检测软件漏洞的技术。其核心思想是通过构造异常输入，触发程序中的潜在错误，从而发现可能的安全隐患。模糊测试广泛应用于各类软件系统，包括操作系统内核、数据库、网络协议等关键领域。

模糊测试的主要优势在于其简单高效，不需要详细的软件规格说明，就能快速覆盖大量代码路径。它通常分为两种类型：

黑盒测试：不了解软件内部结构，仅通过外部输入观察程序反应
白盒测试：基于软件内部结构和实现细节进行测试

02

LLMs如何赋能模糊测试？

大语言模型（LLMs）的引入为模糊测试带来了革命性的变化。LLMs通过其强大的自然语言处理能力和代码生成能力，能够生成更高质量的测试用例，显著提升测试效率和准确性。

具体来说，LLMs在模糊测试中的应用主要体现在以下几个方面：

优化提示生成：LLMs能够理解复杂的上下文信息，生成更精准的测试用例提示，帮助测试人员快速定位潜在漏洞。
种子文件变异：传统的模糊测试依赖于随机变异，而LLMs可以根据已有的代码结构和语义信息，生成更有效的变异策略，提高测试覆盖率。
错误检测与分析：LLMs能够辅助分析测试结果，识别潜在的安全漏洞，并生成详细的错误报告。

03

最新研究进展

近期，多篇重要研究论文探讨了LLMs与模糊测试的结合，展示了这一领域的最新进展。

悉尼大学、东京大学和阿尔伯塔大学的研究团队发表了一篇综述性论文，系统总结了LLMs在模糊测试中的应用现状。研究指出，基于LLMs的模糊测试在API覆盖率、代码覆盖率和复杂错误检测方面都表现出显著优势。
中国科学技术大学和约翰霍普金斯大学的研究团队提出了CHEMFuzz框架，专门用于量子化学软件的漏洞检测。该框架利用LLMs生成语法和语义有效的输入文件，成功检测到40个独特错误。
延世大学和Suresofttech Inc.的研究人员开发了CovRL技术，将覆盖率引导的强化学习与LLMs相结合，显著提升了JavaScript引擎的漏洞检测能力。CovRL-Fuzz发现了48个与安全相关的漏洞，其中包括39个以前未知的漏洞。
伊利诺伊大学和斯图加特大学的研究团队提出了Fuzz4All框架，实现了通用的LLM辅助模糊测试方法。该框架在多个软件系统中都取得了优异的测试效果。

04

实际应用案例

在实际应用中，LLMs辅助的模糊测试已经展现出强大的能力。

嵌入式操作系统内核测试：水木羽林技术专家张强博士团队开发的ECG框架，通过LLMs优化了语料库构建和测试过程。在多个嵌入式操作系统中发现了总计42个未知bug，代码分支覆盖率平均提升了16.02%。
数据库模糊测试：LLMs在驱动程序合成、输入生成和漏洞检测等多个阶段都发挥了重要作用。虽然存在幻觉问题等局限性，但整体测试效果仍优于传统方法。

05

未来展望

尽管LLMs在模糊测试中展现出巨大潜力，但仍面临一些挑战：

自动化程度：虽然LLMs提高了测试效率，但尚未实现完全自动化
幻觉问题：LLMs生成的内容可能存在错误或不合逻辑的情况
训练数据局限性：LLMs的效果依赖于训练数据的质量和覆盖范围

未来的研究方向将聚焦于：

优化LLMs的训练数据：针对特定领域构建更高质量的训练集
提升自动化水平：开发更智能的测试框架，减少人工干预
解决幻觉问题：通过技术手段降低LLMs输出的错误率

总体来看，LLMs与模糊测试的结合为软件测试领域带来了新的发展机遇。随着技术的不断进步，这一方法有望在未来的软件开发和安全测试中发挥越来越重要的作用。

热门推荐

css_test

199元真香定律再现！Redmi Buds 6S评测：便宜又好听的主动降噪耳机

199元真香定律再现！Redmi Buds 6S评测：便宜又好听的主动降噪耳机

未来哪些专业好找工作？这份南京紧缺人才需求目录能帮你

未来哪些专业好找工作？这份南京紧缺人才需求目录能帮你

科创板开市暴涨陕西诞生6位亿万富翁，西工大教授身价超6亿

科创板开市暴涨陕西诞生6位亿万富翁，西工大教授身价超6亿

Hyper-V增强会话模式：与虚拟机共享设备的完整指南

Hyper-V增强会话模式：与虚拟机共享设备的完整指南

皮肤上长了一个包是咋回事？

皮肤上长了一个包是咋回事？

冰箱里放了一年的腊肉和腊肠，到底还能不能吃？

冰箱里放了一年的腊肉和腊肠，到底还能不能吃？

20万放余额宝，还是放零钱通好？还是说干脆就放银行定期？

20万放余额宝，还是放零钱通好？还是说干脆就放银行定期？

盘活空心村发展旅居业——曲靖市马龙区月望乡水箐村乡村旅居案例

盘活空心村发展旅居业——曲靖市马龙区月望乡水箐村乡村旅居案例

毕业生给学弟学妹的寄语有哪些要点？

毕业生给学弟学妹的寄语有哪些要点？

三国中的隐世大才，诸葛亮庞统奉之为师，不是水镜先生

三国中的隐世大才，诸葛亮庞统奉之为师，不是水镜先生

民间流传的神仙城隍：城隍是干什么的？

民间流传的神仙城隍：城隍是干什么的？

超快光学测量助力激光抛光技术进展

超快光学测量助力激光抛光技术进展

先诊脉后开茶！中药奶茶在年轻人中走红

先诊脉后开茶！中药奶茶在年轻人中走红

如何根据法律要求对虚拟信用卡进行审计

如何根据法律要求对虚拟信用卡进行审计

江苏三条铁路建设有新进展

江苏三条铁路建设有新进展

科创板说明了什么？其投资机会在哪里？

科创板说明了什么？其投资机会在哪里？

肝癌消融手术效果如何？如何能预防复发？

肝癌消融手术效果如何？如何能预防复发？

“笃”字的意思和解释，“笃”字的成语和组词

“笃”字的意思和解释，“笃”字的成语和组词

我国校园安全法律问题及对策研究

我国校园安全法律问题及对策研究

解析海外上市架构：全球市场的战略选择及其运作模式

解析海外上市架构：全球市场的战略选择及其运作模式

长发小寨：头皮巨痒，抓挠掉“雪花”，头皮脂溢性皮炎如何治疗？

长发小寨：头皮巨痒，抓挠掉“雪花”，头皮脂溢性皮炎如何治疗？

如何保护隐私权不受侵犯

如何保护隐私权不受侵犯

为啥自动驾驶企业扎堆美股上市？

为啥自动驾驶企业扎堆美股上市？

光电效应：从发现到理论解释的物理学里程碑

光电效应：从发现到理论解释的物理学里程碑

Subsequent的用法及其同义词详解

Subsequent的用法及其同义词详解

如何通过驾驶来减轻电池负担和能量损耗？

如何通过驾驶来减轻电池负担和能量损耗？

高原体检：守护健康，预防先行

高原体检：守护健康，预防先行

夏季多肉植物养护指南：通风、遮阴、浇水和配土比例全攻略

夏季多肉植物养护指南：通风、遮阴、浇水和配土比例全攻略

希尔排序详解

希尔排序详解

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号