MATLAB的数值索引与逻辑索引的速度对比
MATLAB的数值索引与逻辑索引的速度对比
在MATLAB编程中,数值索引和逻辑索引是两种常用的数组元素选择方式。本文通过详细的性能测试,对比了这两种索引方式在不同数据量和索引量下的表现,并得出了实用的结论。
在MATLAB中,数值索引和逻辑索引都是用于从数组中选择特定元素的方法,但它们使用不同的方式来进行索引。
数值索引
数值索引是使用整数值作为索引来访问数组中的元素。你可以通过指定行和列的索引来访问特定的元素。
其中数值索引包括:
- 单下标索引
可以用数或数组索引一个或多个元素
A = [1 2 3]
>> A(2) %索引一个元素
ans = 2
>> A([2 3]) %索引多个元素
ans = 2 3
- 线性索引
将多维数组视为单列向量,按照对单列向量的索引方式进行索引。
B = [1:3;4:6;7:9]
>> B(5)
ans = 5
- 多下标索引
指定数组各个维度的元素位置进行索引
C = [1 2 3 4; 5 6 7 8; 9 10 11 12; 13 14 15 16]
>> C(1:3,2:4)
ans =
2 3 4
6 7 8
10 11 12
逻辑索引
逻辑索引是使用逻辑值(true或false)数组来选择数组中的元素。
可以通过条件语句创建一个与原始数组相同大小的逻辑数组,其中每个元素表示是否选择对应位置的元素。然后,通过将逻辑数组用作索引,可以选择满足条件的元素。
>> A = [1 2 6; 4 3 6]
A =
1 2 6
4 3 6
>> idx = A > 5 %通过条件语句创建逻辑数组
idx =
2×3 logical 数组
0 0 1
0 0 1
>> A(idx) %通过逻辑数组索引元素
ans =
6
6
性能对比
当讨论到数值索引与逻辑索引时,经常会提到 find
函数。find
函数可以返回数组中非0元素的位置,也就是说通过 find
函数可以将逻辑索引转换为数值索引。
但MATLAB的Code Analyzer通常会建议在数组与元胞数组中直接使用逻辑索引而非使用 find
函数转化为数值索引,因为 find
函数在创建索引向量时会带来额外的性能开销。
所以这里将对比数值索引、逻辑索引、find函数转换这三种方式在不同数据量与索引量下的性能表现。
通过以下函数对比在不同数据量和索引量的条件下上述三种方式的性能。
function idxPerform(dataSize,idxSize)
Set=false(dataSize,1,'like',logical(dataSize));
Index=cast(randsample(dataSize,idxSize),'like',dataSize);
disp('索引性能测试');
fprintf('数值索引:');
Start=tic;
Out=Set(Index);
toc(Start);
Set(Index)=true;
fprintf('逻辑索引:');
Start=tic;
Out=Set(Set);
toc(Start);
fprintf('find函数索引:');
Start=tic;
Out=Set(find(Set));
toc(Start);
end
数据量1e3
- 索引量1
- 索引量100
- 索引量1000
数据量1e6
- 索引量1
- 索引量1e3
- 索引量1e6
数据量1e9
- 索引量1
- 索引量1e3
- 索引量1e6
数据量1e10
- 索引量1
总结
在数据量较小(1e3级别)时,逻辑索引在不同的索引量下均有一定性能优势,其余两种数值索引方式性能差异不大。
随着数据量的增加(超过1e6级别),数值索引的性能优势开始凸显,而逻辑索引与
find
函数转换方式的差别不大,后者仅仅在索引量较小时有一定性能提升效果。当索引量接近数据量的时候,数值索引对逻辑索引的性能优势将会越来越小。
虽然数值索引始终是最快的,但在数据量较小的场景使用逻辑索引对性能的影响十分有限。
find
函数方法在一定场景下领先逻辑索引,可以考虑在编码与测试中进行尝试。