用VBA简化Excel办公流程
创作时间:
作者:
@小白创作中心
用VBA简化Excel办公流程
引用
360doc个人图书馆
等
9
来源
1.
http://www.360doc.cn/article/78873848_1026234072.html
2.
https://blog.csdn.net/renyongzhe/article/details/126793884
3.
https://blog.csdn.net/dyfgs/article/details/7177088
4.
https://baijiahao.baidu.com/s?id=1769392456681844325
5.
https://baijiahao.baidu.com/s?id=1802273530418543341
6.
https://blog.csdn.net/u010454729/article/details/124231419
7.
https://blog.csdn.net/zhangdabai1/article/details/142214759
8.
https://www.cnblogs.com/-wenli/p/11079173.html
9.
https://docs.pingcode.com/baike/4975684
通过掌握VBA语言的字符串处理技巧,你可以显著提高在Excel中的工作效率。无论是数据清洗、文本分析还是报表生成,VBA都能帮助你轻松应对各种复杂的办公任务。例如,使用Left、Right和Mid函数提取特定字符,或者利用Replace函数批量替换错误信息,这些操作都可以大大减少手动处理的时间。此外,VBA还提供了丰富的内置函数来实现大小写转换、字符串查找等功能,让你的工作更加高效便捷。
下面为你封装一组进阶的文本处理函数:
'► 文本相似度计算
Public Function SimilarityRatio(ByVal str1 As String, ByVal str2 As String) As Double
'基于编辑距离计算相似度(0-1范围)
Dim maxLen As Long
str1 = CleanString(str1) '假设已实现基础清洁函数
str2 = CleanString(str2)
If str1 = str2 Then
SimilarityRatio = 1
Exit Function
End If
maxLen = WorksheetFunction.Max(Len(str1), Len(str2))
SimilarityRatio = 1 - (LevenshteinDistance(str1, str2) / maxLen)
End Function
'► 莱文斯坦距离计算
Public Function LevenshteinDistance(ByVal s As String, ByVal t As String) As Long
'动态规划实现编辑距离
Dim d() As Long, i As Long, j As Long, cost As Long
Dim m As Long, n As Long
m = Len(s)
n = Len(t)
ReDim d(0 To m, 0 To n)
For i = 0 To m: d(i, 0) = i: Next
For j = 0 To n: d(0, j) = j: Next
For i = 1 To m
For j = 1 To n
cost = Abs(StrComp(Mid(s, i, 1), Mid(t, j, 1), vbTextCompare))
d(i, j) = WorksheetFunction.Min( _
d(i - 1, j) + 1, _
d(i, j - 1) + 1, _
d(i - 1, j - 1) + cost)
Next
Next
LevenshteinDistance = d(m, n)
End Function
'► 模糊匹配查找
Public Function FuzzyMatch(ByVal searchStr As String, ByVal rangeToSearch As Range, Optional threshold As Double = 0.7) As Variant
'返回匹配单元格地址及相似度二维数组
Dim result() As Variant, cell As Range, cnt As Long
ReDim result(1 To rangeToSearch.Count, 1 To 2)
searchStr = CleanString(searchStr)
For Each cell In rangeToSearch
If SimilarityRatio(searchStr, CleanString(cell.Value)) >= threshold Then
cnt = cnt + 1
result(cnt, 1) = cell.Address
result(cnt, 2) = Format(SimilarityRatio(searchStr, cell.Value), "0.00%")
End If
Next
ReDim Preserve result(1 To cnt, 1 To 2)
FuzzyMatch = result
End Function
'► Jaccard相似度计算
Public Function JaccardSimilarity(ByVal strA As String, ByVal strB As String) As Double
'基于词集的相似度计算
Dim wordsA As Variant, wordsB As Variant
Dim union As Collection, intersect As Collection
Set union = New Collection
Set intersect = New Collection
wordsA = Split(RemoveNonAlphanumeric(strA), " ") '假设已实现基础处理函数
wordsB = Split(RemoveNonAlphanumeric(strB), " ")
'计算并集和交集
BuildUnionAndIntersect wordsA, wordsB, union, intersect
If union.Count = 0 Then
JaccardSimilarity = 0
Else
JaccardSimilarity = intersect.Count / union.Count
End If
End Function
'► 私有辅助方法 ◄
Private Sub BuildUnionAndIntersect(ByRef arr1, ByRef arr2, ByRef unionColl As Collection, ByRef intersectColl As Collection)
Dim dict As Object, elem As Variant
Set dict = CreateObject("Scripting.Dictionary")
'处理第一个数组
For Each elem In arr1
elem = LCase(Trim(elem))
If Len(elem) > 0 Then
dict(elem) = 1
AddToCollection unionColl, elem
End If
Next
'处理第二个数组
For Each elem In arr2
elem = LCase(Trim(elem))
If Len(elem) > 0 Then
If dict.exists(elem) Then
If dict(elem) = 1 Then
AddToCollection intersectColl, elem
dict(elem) = 2
End If
Else
AddToCollection unionColl, elem
End If
End If
Next
End Sub
Private Sub AddToCollection(ByRef coll As Collection, ByVal item As String)
'去重添加元素
On Error Resume Next
coll.Add item, item
On Error GoTo 0
End Sub
使用示例:
Sub Demo()
'相似度计算
Debug.Print SimilarityRatio("apple", "apples") '→ 0.8
'模糊匹配查找
Dim matches As Variant
matches = FuzzyMatch("Excel", Range("A1:A10"), 0.6)
'Jaccard相似度
Debug.Print JaccardSimilarity("Hello world", "World hello") '→ 1.0
End Sub
特点说明:
性能优化:莱文斯坦距离使用动态规划算法,处理20字符以内的字符串效率较高
预处理集成:内置CleanString函数(需与您的基础函数整合)进行统一预处理
扩展性设计:模糊匹配函数可直接应用于Excel单元格区域
阈值控制:所有相似度计算均可设置灵敏度阈值
兼容处理:统一使用vbTextCompare进行不区分大小写的比较
注意:需确保已实现引用的基础函数(CleanString、RemoveNonAlphanumeric等),可添加错误处理增强健壮性。对于大数据量场景建议结合数组处理优化性能。
热门推荐
银行的 ATM 机的取款限额与手续费规定有哪些?
2025年成都新房市场分析及购房建议
红河文旅,火出圈!
“淀粉之王”木薯粉,为什么不允许出现在红薯粉条里?
孩子长高,运动就对了?NO!不同年龄段要选择对应项目
《木薯的正确食用方法》
阿文读书:安徒生的《海的女儿》讲的其实是移民之路
科比的得分巅峰与低谷:81分与0分之间的职业生涯
AI 技术在无人机配送场景中的运用
唐代仿金银器的玉石器皿
煮荷包蛋总散开?大厨教你做出“完美荷包蛋”?只需多加一步!
喝酒腹胀是什么原因引起的怎么办
出口俄罗斯需要哪些认证?
超越ChatGPT:AI智能体的未来与挑战
毛氏红烧肉,吃货们的新宠!
吃猪肉好还是鸡肉好?这种肉吃太多糖尿病风险高!吃肉记住3个重点
圈刹与碟刹的全面对比:优缺点解析与购买指南
感情长久之道:不只是包容和忍让
孙颖莎的八年:从新秀到顶尖,如何塑造体育巨星的成长之路
来成都逛杜甫草堂,步子不要太快
进击的余杭:多维解读杭州城市新中心
什么是应收账款周转率公式?一个例子教会你
React — Redux详解
“食物过敏”知多少?
盘点历史上最神秘的十大谜团,真相慢慢浮出水面……
乒乓球亚洲杯:林诗栋3-0横扫日本奥运主力,篠塚大登惨遭2连败
桃花源记:探寻理想中的乌托邦世界
康德的名言“人是目的,而不是手段”如何理解?
图解系列|DeepSeek-R1的出众推理能力从何而来?
湿热难消?精选3款中成药,疏肝健脾一步到位