南开大学20秋《并行程序设计》在线作业(参考答案)VIP专享VIP免费

下载本文档

阅读 148
下载 10
格式 pdf
大小 292.26 KB
约11页
2024-11-24 发布于天津市
收藏
评论
点赞(0)
海报
举报

/11

下载本文档

1.SSE intrinsics_mm_store_ps 命令的功能是()。 A.对齐向量存单精度浮点数 B.未对齐向量存单精度浮点数 C.对齐标量存单精度浮点数 D.未对齐标量存单精度浮点数答案：A 2.for (i=0;i<16;i+=1){L=A[i+0]-B[i+0];D=D+abs(L);}，此循环()。 A.可完全向量化 B.不可向量化 C.不确定 D.可部分向量化答案：D 3.对这样的循环for(i=0;i<100;i+=1) A[i+0]=A[i+0]+B[i+0]; 进行向量化，基本技术手段是()。 A.循环划分 B.循环消除 C.循环展开 D.以上皆错答案：C 4.MMX 有()个专用寄存器。 A.4 B.8 C.16 D.32 答案：B 5.编译器编译OpenMP 并行循环时，会自动生成一些代码，其中不包括()。 A.创建和管理线程代码 B.循环划分给线程的代码 C.找出数据依赖的代码 D.线程同步的代码答案：C 6.创建线程时，我们通过()将线程号分别传递给每个线程。 A.全局变量 B.局部变量 C.动态分配变量 D.pthread_create 的“线程函数参数”参数答案：D 7.下列哪项不是这门课程的目标?() A.学会肯定能优化程序性能的方法 B.学会用并行思维思考问题 C.学会常用的并行编程工具 D.理解软件到并行架构的映射答案：A 8.编写n 个数求和的OpenMP 程序，最高效的方法是()。 A.多线程直接并发累加到共享变量 B.将累加操作设置为临界区 C.在累加操作前设置障碍 D.采用归约指令答案：D 9.静态线程编程模式的缺点是()。 A.线程管理开销高 B.系统资源利用率低 C.线程负载不均 D.线程通信开销高答案：B 10.采用MPI 主从模型解决矩阵每行排序问题，主进程每次向一个从进程发送10 行作为一个任务相对于每次发送1 行的优点是()。 A.更有利于负载均衡 B.减少了通信开销 C.降低了计算次数 D.减少了从进程空闲答案：B 11.MPI 收发各一条消息的API 是()。 A.MPI_Sendrecv B.MPI_Send C.MPI_Recv D.MPI_Replace 答案：A 12.两个矩阵相乘，若矩阵规模大于cache 大小，则优化访存的可行方法是()。 A.先将两个矩阵读入cache 再进行乘法 B.先转置第一个矩阵再进行乘法 C.先转置第二个矩阵再进行乘法 D.以上皆错答案：C 13.多个线程进行并行求和，每个线程将自己负责的值依次读入局部变量x，累加到全局变量sum 上，sum+=x，对此，下面说法正确的是()。 A.读取x 存在数据依赖，不能并发进行 B.累加顺序被改变，结果是错误的 C.加法操作是简单运算，无需同步 D.加法操作不是原子操作，需要同步保证数据...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容