并行计算一定比单线程计算快吗

发布网友发布时间：2022-04-23 22:21

共2个回答

热心网友时间：2023-09-19 14:06

首先，应用的场合和解决的问题不一样。分布式计算比较倾向于在计算寻找模式的东西，穷举暴力之类的计算。分布式的计算被分解后的小任务互相之间有性，节点之间的结果几乎不互相影响

热心网友时间：2023-09-19 14:07

openmp默认使用的schele是取决于编译器实现的。gcc默认使用schele(dynamic,1)，也就是动态调度并且块大小是1。在你的程序里面，这种调度是及其低效的，看代码都能预期到，不太可能比单线程快。
动态调度的一种简单理解方式是，计算任务存在一个任务队列里面，你的for循环每一个i值对应一个计算任务。每个线程每次提取一批任务，然后计算。“一批”是多少呢？就是前面说的块大小，在你的程序里面是1。提取任务需要什么操作呢？因为这个任务队列是多线程共享的，提取任务前必须加锁，读取一批，从队列中移除，然后解锁。说到这里，你应该已经知道原因了。
你的线程一次只提取一次计算任务，这个任务还完成得很快。然后所有的16个线程排着队，逐个去加锁，抢任务，然后解锁让其它线程继续抢。然后马上发现这个任务很快，又要重新去排队等任务，始终处于饥饿状态。注意排队的时候可能也是要占cpu的，因为使用了busy
wait，所以可能你看来十六核满负荷，但是其实啥也没干。
我的建议就是，使用static
schele，或者增加dynamic
schele的块大小，比如1024，取决于你循环多少次。一般如果你知道每次循环的执行时间基本都是一样，并且是专用服务器设置好affinity，无其它负荷无oversubscription无numa问题的话，static
schele会是个比较好的选择。这样每个线程做哪些任务只需要进行一次分配，最小化了openmp本身的消耗。

全部栏目

并行计算一定比单线程计算快吗