1.SSE intrinsics_mm_store_ps 命令的功能是()。 A.对齐向量存单精度浮点数 B.未对齐向量存单精度浮点数 C.对齐标量存单精度浮点数 D.未对齐标量存单精度浮点数 答案:A 2.for (i=0;i<16;i+=1){L=A[i+0]-B[i+0];D=D+abs(L);},此循环()。 A.可完全向量化 B.不可向量化 C.不确定 D.可部分向量化 答案:D 3.对这样的循环for(i=0;i<100;i+=1) A[i+0]=A[i+0]+B[i+0]; 进行向量化,基本技术手段是()。 A.循环划分 B.循环消除 C.循环展开 D.以上皆错 答案:C 4.MMX 有()个专用寄存器。 A.4 B.8 C.16 D.32 答案:B 5.编译器编译OpenMP 并行循环时,会自动生成一些代码,其中不包括()。 A.创建和管理线程代码 B.循环划分给线程的代码 C.找出数据依赖的代码 D.线程同步的代码 答案:C 6.创建线程时,我们通过()将线程号分别传递给每个线程。 A.全局变量 B.局部变量 C.动态分配变量 D.pthread_create 的“线程函数参数”参数 答案:D 7.下列哪项不是这门课程的目标?() A.学会肯定能优化程序性能的方法 B.学会用并行思维思考问题 C.学会常用的并行编程工具 D.理解软件到并行架构的映射 答案:A 8.编写n 个数求和的OpenMP 程序,最高效的方法是()。 A.多线程直接并发累加到共享变量 B.将累加操作设置为临界区 C.在累加操作前设置障碍 D.采用归约指令 答案:D 9.静态线程编程模式的缺点是()。 A.线程管理开销高 B.系统资源利用率低 C.线程负载不均 D.线程通信开销高 答案:B 10.采用MPI 主从模型解决矩阵每行排序问题,主进程每次向一个从进程发送10 行作为一个任务相对于每次发送1 行的优点是()。 A.更有利于负载均衡 B.减少了通信开销 C.降低了计算次数 D.减少了从进程空闲 答案:B 11.MPI 收发各一条消息的API 是()。 A.MPI_Sendrecv B.MPI_Send C.MPI_Recv D.MPI_Replace 答案:A 12.两个矩阵相乘,若矩阵规模大于cache 大小,则优化访存的可行方法是()。 A.先将两个矩阵读入cache 再进行乘法 B.先转置第一个矩阵再进行乘法 C.先转置第二个矩阵再进行乘法 D.以上皆错 答案:C 13.多个线程进行并行求和,每个线程将自己负责的值依次读入局部变量x,累加到全局变量sum 上,sum+=x,对此,下面说法正确的是()。 A.读取x 存在数据依赖,不能并发进行 B.累加顺序被改变,结果是错误的 C.加法操作是简单运算,无需同步 D.加法操作不是原子操作,需要同步保证数据...